Особенности ЭВМ PENTIUM Intel Р6. Механизм динамического выполнение команд
Интеллектуальное исполнение. Этим термином называется способность микропроцессора организовать неупорядоченное выполнение команд и восстановления впоследствии порядка за счет передачи результатов выполнения команд в порядке, предусмотренном алгоритмом обработки данных. Для реализации этого механизма результаты выполнения находящихся на конвейере команд размещаются во временных регистрах (буфер команд). Блок удаления и восстановления постоянно просматривает буфер команд и ищет те из них, которые уже исполнены и не имеют связи по данным с другими командами или не находятся в ветвях незавершенных переходов. Когда такие команды найдены, устройство удаления и восстановления помещает сформированные ими данные в память или регистры процессора в порядке, заданным исходным алгоритмом. После этого команды удаляются из конвейера. Механизм динамического выполнения команд приводит к тому, что наиболее оптимально используется время наиболее дорогостоящего компонента ЭВМ – микропроцессора, а если учесть, что в последних версиях Pentium команды программы исполняются в 3 потока одновременно, то понятным становятся истоки повышения производительности, достигаемые в этих моделях.
12.Повышение производительности вычислений: использование перекрытия и расслоения памяти. К ранним моделям, в которых использовалось перекрытие относят UNIVAC 1. Перекрытием называют способность ЭВМ одновременно выполнять не одну, а несколько операций обработки данных. В упоминаемой выше UNIVAC 1 было применено такое совмещение операций, которое впоследствии стало классическим: в ней перекрывались исполнение программы и выполнение операции ввода-вывода. M 7094 II сделан дальнейший шаг: использовано расслоение памяти для ускорения обращений к ней. Суть этого решения в том, что ОЗУ делят (расслаивают) на n независимых сегментов. Каждый сегмент имеет свое устройство управления. Величину n называют глубиной расслоения. Ячейки с последовательными номерами находятся в последовательных сегментах. Так, если n =4, то нулевая ячейка будет в первом сегменте, первая – во втором и т.д., иначе говоря, ячейка с номером 4 i будет в первом сегменте, а с номером 4 i+3 – в четвертом. Если полный цикл обращения к одному сегменту ОЗУ составляет К единиц времени, а глубина расслоения равна n, то к каждому последовательному сегменту можно обращаться через K/n единиц времени после обращения к предыдущему. Когда программа обратится к n подряд следующим ячейкам памяти, то пройдет время К и можно будет повторить цикл обращения. Быстродействие ОЗУ как будто увеличивается в n раз. Однако на практике такая оптимизация достигается редко из-за непоследовательных обращений к ячейкам памяти ЭВМ. Практика показала, что при обращении к адресам в памяти ЭВМ в случайном порядке, достигается продолжительность цикла обращения. Т.е. выигрыш от расслоения все равно получается существенным, хотя и не в n раз. 13.Повышение производительности вычислений: использование конвейеризации и параллельных вычислений. Разбиение процесса исполнения команды (конвейеризация) впервые применено в машинах STRETCH и LARC. В первой ЭВМ конвейер был двухступенчатым, во второй – четырехступенчатым. Существенному увеличению производительности за счет конвейеризации мешало то, что в этих машинах не была решена проблема снижения влияния помех. Под помехами в конвейерных ЭВМ понимают тот или иной фактор, связанный с его конструкцией или применением, который препятствует непрерывному поступлению новых данных на конвейер с максимально возможной скоростью. К первым машинам с конвейерной организацией относят IBM 360/91 (1967 г.). В ней была реализована предварительная выборка команд, причем, если предполагалось ветвление, то выбирались команды из обеих ветвей и ставились в очередь на конвейер. Когда исполнение команды ветвление определяло одну из ветвей программы, ненужная последовательность команд отбрасывалась. Уже в этой ЭВМ некоторые команды выполнялись непоследовательно, но за счет правильной организации процесса пересылки результатов все они оказывались на своих местах. К высокопараллельным ЭВМ относят ILLIAC IV (1968 г.). Построена была эта машина для решения очень больших научных задач. Такая ее специализация объясняет тот факт, что в ней использовались 64 копии блока, сходного с арифметическим устройством традиционной машины. Каждая копия имела свои регистры, сумматор и память, все копии могли работать одновременно. Повышение производительности за счет параллельной обработки может идти по двум альтернативным направлениям: - создание многомашинных комплексов – это направление развивается как вычислительные сети; - создание многопроцессорных комплексов.
|