Netcompa.net

Все про компьютер

p4В ноябре 2000 г. компания Intel приступила к производству новейшего 32-разрядного процессора, ранее известного как Willamette, работающего на частоте 1,5 ГГц. Знаменательность этого события в том, что с момента выхода Pentium Pro в области архитектуры процессоров Intel не происходило ничего более значительного. Итак, появился процессор седьмого поколения (Pentium Pro, Pentium II/III относятся к шестому поколению — Рб).

Достаточно перечислить революционные новшества в Willamette:

•    асимметричное ядро с блоками, работающими на различных скоростях;
•    значительно улучшенная версия суперскалярного механизма исполнения ИНСТРУКЦИЙ;
•    новый кэш второго уровня, отслеживающий порядок выполнения
ИНСТРУКЦИЙ;
•    переработанные блоки операций с мультимедийными данными и числами с плавающей запятой;
•    огромный набор новых инструкций;
•    новая 100 МГц шина, передающая по 4 пакета данных за такт (что эмулирует результирующую частоту в 400 МГц);
•    конвейер выполнения инструкций из 20 шагов.

Наибольшее впечатление на экспертов произвела стартовая рабочая частота процессора в 1,5 ГГц. Такого результата удалось добиться за счет новой архитектуры конвейера выполнения инструкций. Очевидно, что чем длиннее конвейер, тем легче наращивать тактовую частоту, но тем меньше производительности получалась на каждый тактовый импульс. Дело в том, что большее количество стадий конвейера распределяет меньше работы на отдельный такт, и тем самым этот такт выполняется быстрее. Pentium III имел конвейер длиной 12 стадий (17 стадий FPU), Athlon — 10 стадий (15 стадий FPU). Pentium 4 при длине конвейера 20 стадий имел самое меньшее время выполнения такта, позволяющее достичь максимальной тактовой частоты, но и получал самые большие задержки для связанных друг с другом операций (второй операции приходилось ожидать 20 тактов, пока не завершится первая операция).

Эта проблема частично решалась за счет буфера, некоторые инструкции из которого можно было выполнять независимо от результата предыдущих. Для этого требовалось точно предсказывать так называемые переходы. Так вот, объем кэшпамяти первого уровня у Pentium 4 увеличен до 256 Кбайт (для сравнения: Pentium III имеет 32 Кбайт, Athlon — 128 Кбайт). Кроме того, новый механизм предсказания переходов позволил повысить точность «попадания» до 95 процентов.

Новинкой процессорной архитектуры стал кэш с механизмом ОхМ упорядочивания инструкций. Его задачей являлось хранение инструкций в том порядке, в каком они исполняются. То есть, если первая инструкция, находящаяся по адресу 100, выполняет переход на вторую инструкцию, находящуюся по адресу 200, то в этом кэше вторая инструкция находилась именно в том порядке, как она исполнялась — непосредственно за первой, и т. д.

Еще один инструмент ускорения работы — Advanced Dynamic Execution, улучшенная версия механизма суперскалярного внеочередного выполнения инструкций, когда процессор нарушал их естественную последовательность с целью более плотной загрузки исполнительных модулей.

Не менее важным для эффективности процессора являлась производительность модулей, непосредственно выполняющих те или иные операции — с целыми числами, с числами с плавающей запятой, со специфическими данными, когда одна инструкция оперирует сразу несколькими пакетами данных (SIMD).

Добавить комментарий

Защитный код
Обновить

Мы ВКонтакте