25 мая 2004
Обновлено 17.05.2023

Pentium 4 Prescott: брать или не брать? Новый процессор от Intel

Pentium 4 Prescott: брать или не брать? Новый процессор от Intel - изображение обложка
Pentium 4 Prescott: брать или не брать? Новый процессор от Intel - фото 1

Внешне новые процессоры на ядре Prescott не отличаются от “старых”, на ядрах Northwood или Willamette.
2 февраля компания Intel объявила о выпуске нескольких новых процессоров. Однако помимо традиционного увеличения тактовых частот, мы стали свидетелями появления нового процессорного ядра Prescott. Это уже третье по счету ядро Pentium 4. Давайте проанализируем, какие изменения произошли в новом ядре, и ответим на главный вопрос: стоит ли вам покупать именно Prescott, чтобы получить дополнительные fps в любимых играх и гордо хвастаться самым быстрым ПК перед друзьями? “Толщина” техпроцесса В ноябре 2000 года на свет появился первый процессор Pentium 4 на ядре Willamette. При этом технологический процесс производства имел норму 0,18 мкм — размер одного элемента. Отметим, что “толщина” технологического процесса очень важна — переход на “тонкие” техпроцессы позволяет разместить на одной и той же площади кристалла большее число вычислительных элементов, транзисторов. Благодаря этому разработчики процессоров могут добавлять на кристалл дополнительный кэш, новые функциональные блоки. К тому же кристалл, изготовленный с помощью “тонкого” технологического процесса, выделяет меньше тепла — следовательно, позволяет использовать тихие кулеры. Наконец, совершенствование техпроцесса позволяет увеличивать частоту. Все эти факторы можно проиллюстрировать таблицей “Эволюция ядер”. Эволюция ядер Ядро процессора Pentium 4 Частоты Размер кэша L2 Технологический процесс Дата объявления
Willamette 1,3 ГГц — 2,0 ГГц 256 Кб 0,18 мкм 21.11.2000
Northwood 1,8 ГГц — 3,4 ГГц 512 Кб 0,13 мкм 07.01.2002
Prescott 2,8 ГГц — 3,4 ГГц 1024 Кб 0,09 мкм 02.02.2004
Поколения ядер процессора Pentium 4 отличаются и размером кэша второго уровня. Ядро Willamette обладало кэшем 256 Кб, ядро Northwood — 512 Кб, а ядро Prescott получило целый мегабайт

Pentium 4 Prescott: брать или не брать? Новый процессор от Intel - фото 2

Автор статьи с 200-мм кремниевой пластиной в нижегородской лаборатории Intel. Именно из таких пластин и вырезают будущие процессоры.
кэша L2. Таким образом, первая отличительная особенность новых процессоров Prescott — размер кэша. Давайте проанализируем, как размер кэша может повлиять на производительность. Размер кэша и производительность Казалось бы, здесь все просто: чем больше кэш, тем лучше. Увы, это не так. Кэш второго уровня является посредником между памятью и процессором. Отметим, что раньше компьютеры работали без кэша вообще — данные брались напрямую из оперативной памяти, и никаких проблем при этом не возникало. Но процессоры стали работать все быстрее и быстрее, и оперативная память перестала за ними поспевать. Действительно, если современные процессоры уже перешли за частоты 3,2 ГГц, то шина оперативной памяти смогла достичь только 400 МГц (DDR400) — она работает в 8 раз медленнее! То есть каждый такт шины памяти будет стоить процессору 8 тактов ожидания. Кроме того, оперативная память обладает задержкой доступа (или латентностью) — это второй негативный момент. То есть между запросом информации в память и ее получением процессором происходит задержка — и чем быстрее работает процессор, тем хуже становится ситуация. При переходе за частоту процессора 3 ГГц задержка при обращении даже к самой быстрой памяти достигает нескольких десятков тактов процессора!

Pentium 4 Prescott: брать или не брать? Новый процессор от Intel - фото 3

Транзистор — мельчайший вычислительный элемент процессора. В процессоре их миллионы. Отметим, что их размеры настолько малы, что в эритроците крови можно разместить сотни транзисторов.
Для борьбы с двумя указанными недостатками (медленной шиной памяти и большими задержками) разработчиком пришлось установить в процессор дополнительную память, называемую кэшем. В современных процессорах используется иерархическая многоуровневая система кэширования (до трех уровней в том же Pentium 4 Extreme Edition). Работа с кэшем осуществляется примерно на порядок быстрее, чем с оперативной памятью, — ведь кэш работает на частоте процессора и находится непосредственно на кристалле Pentium 4. Иерархическая система кэширования устроена следующим образом: сначала данные из памяти попадают в кэш второго уровня (L2), затем в кэш первого уровня (L1), а уже потом — в процессор. Кэш сохраняет пропускаемые через себя данные, и если процессор будет запрашивать данные повторно, то сначала будет произведен поиск этих данных в кэше L1, затем — в кэше L2, и если данных в кэшах не оказалось (произошел “промах” кэша), то данные будут запрошены из памяти. Таким образом, нам выгодно хранить в кэше часто используемые данные — тогда нам не надо будет брать их из памяти и тратить драгоценные такты процессора на ожидание. То есть кэш дает выигрыш только тогда, когда процессор запрашивает данные повторно! Если повторяемых данных нет (скажем, вы будете сжимать фильм DVD в DivX или аудиодиск в MP3), то кэш никакого выигрыша не даст — все данные процессору придется брать из памяти. Именно поэтому на таких приложениях мы не наблюдаем прироста производительности при увеличении кэша (сравните результаты Northwood и Prescott в конце статьи). В то же время в играх и различных рабочих/офисных приложениях увеличение кэша дает прирост производительности — ведь там много объектов, используемых процессором многократно. “В чем же проблема? — скажете вы. — Давайте сделаем кэш гигантским, а лучше переделаем всю оперативную память в кэш”. К сожалению, сегодняшние технологии сделать это не позволяют. Кэш состоит из очень быстрой статической памяти, которая на единицу информации тратит по 4—6 вычислительных элементов (транзисторов). Оперативная память является динамической — она работает медленнее, зато на единицу информации у нее отводится по одному вычислительному элементу. То есть она ст о ит в 4—6 раз меньше, чем память кэша. К тому же мы не можем разместить на кристалле процессора большое число вычислительных элементов. Обратите внимание на таблицу, приведенную в начале статьи. Только при уменьшении размера транзисторов (переходе на новый технологический процесс) мы смогли добавлять кэш на кристалл процессора. Еще один не очень приятный факт — чем больше мы сделаем кэш, тем медленнее он будет искать информацию. Поэтому на приложениях, которым кэш не нужен, увеличение размера кэша в ряде случаев приводит к уменьшению производительности. Какие из этого можно сделать выводы? 1. Размер кэша повышает производительность только тогда, когда повторно запрашиваются уже использованные один раз данные. Такая ситуация характерна для игр, офисных приложений, рабочих программ и архиваторов. Размер кэша практически не влияет на скорость кодирования в DivX и mp3 — то есть на работу тех приложений, которые используют большие массивы не повторяющихся данных. 2. Размер кэша должен быть оптимальным.

Pentium 4 Prescott: брать или не брать? Новый процессор от Intel - фото 4

Инженер Intel изучает качество 300-мм пластины. Возможно, из этой пластины и был изготовлен процессор вашего ПК.
Как увеличение кэша второго уровня с 512 Кб до 1 Мб в процессорах Prescott сказывается на их производительности — мы увидим ниже. Новый набор инструкций С выпуском процессора Pentium 4 на ядре Prescott Intel представила новый набор инструкций SSE3. Инструкции позволяют ускорить работу программ — с одним “но”: код программы должен использовать эти инструкции. То есть если программист не предусмотрел использование инструкций в программе, то никакого прироста производительности вы не получите. Именно поэтому выигрыш от новых инструкций SSE3 следует ожидать не ранее, чем через полгода, — тогда они начнут использоваться в новых версиях программ. Напомню, что первый набор инструкций MMX был интегрирован в процессор Pentium. Затем в Pentium III появились инструкции SSE (позже их поддержкой обзавелся и процессор AMD Athlon XP), а Pentium 4 стал поддерживать инструкции SSE2 (сейчас AMD тоже поддерживает их в процессоре Athlon 64). Как показывает история, на момент выхода инструкций они не давали никакого прироста по упомянутой выше причине. Поэтому о SSE3 можно смело забыть до осени. Улучшенная поддержка Hyper-Threading Мы уже рассказывали о технологии Hyper-Threading в нашей статье о Pentium 4 Extreme Edition. Напомним, что Hyper-Threading позволяет бесплатно получить два процессора из одного. То есть ваша операционная система и программы будут считать, что в компьютере два процессора. На самом деле, конечно, физический процессор один — он просто “прикидывается” двумя. Hyper-Threading позволяет получить прирост производительности в двух случаях: когда программа при создании была разбита на несколько потоков и когда вы работаете с несколькими программами одновременно. Что касается игр, то они сегодня практически не поддерживают Hyper-Threading — как показывают результаты нашего тестирования, включение Hyper-Threading не дает выигрыша в скорости. Возможно, ситуация изменится с выходом Doom 3 и Half-Life 2.

Pentium 4 Prescott: брать или не брать? Новый процессор от Intel - фото 5

Ядро процессора Pentium 4 Prescott. Разные по структуре элементы — это ступени конвейера процессора. Теперь их стало 31.
_Изменение длины конвейера _ Генри Форд увековечил свое имя в истории капитализма, впервые реализовав на своем автомобильном заводе конвейер. Понять преимущества конвейера очень легко. Предположим, что мы собираем автомобили традиционным способом. Для этого мы наняли пять команд инженеров: первая команда сваривает кузов, вторая команда надевает колеса, третья — устанавливает двери, четвертая — красит кузов, наконец, пятая команда занимается отделкой и ставит стекла. Пусть каждая команда справляется со своим заданием за час. Как нетрудно подсчитать, на сборку автомобиля будет уходить пять часов. Наш завод будет выдавать по одному автомобилю каждые пять часов. При этом когда первая команда выполнит свое задание, она передаст кузов второй команде и будет четыре часа отдыхать. Конечно, вы уже догадались, как повысить эффективность производства: мы выстраиваем команды инженеров в линейку и передаем автомобиль-заготовку по очереди каждой команде. При этом когда первая команда закончит сваривать кузов первого автомобиля, она передаст кузов второй команде и начнет сваривать кузов следующего автомобиля. Таким образом, на изготовление каждого автомобиля по-прежнему уходит пять часов, однако завод работает намного быстрее: он выпускает по одному автомобилю каждый час. В процессоре тоже применяется конвейер, который позволяет существенно увеличить производительность. В нашем примере конвейер автомобильного завода состоял из пяти ступеней. Конвейер Pentium 4 ядер Willamette и Northwood состоит из 20 ступеней, а конвейер Prescott удлинился до 31 ступени. Давайте рассмотрим влияние конвейера на производительность и оценим последствия удлинения конвейера. Сразу же следует отметить, что каждая ступень конвейера процессора выполняется за один такт. То есть если мы дадим команду процессору Northwood, то процессор выдаст результат не меньше, чем через 20 тактов (на самом деле это весьма упрощенное понимание сути работы процессора, но оно близко к реальности). Если же мы дадим ту же команду процессору Prescott, то результат мы получим через 31 такт! Получается, что конвейер Prescott работает медленнее, и производительность процессора ниже? На самом деле — и да, и нет. Если мы дадим процессору очередь команд (то есть программу), то мы будем ждать 31 такт выполнения только первой команды. Результаты выполнения всех остальных команд будут сходить с конвейера по одному за каждый последующий такт — то есть падения скорости работы уже не произойдет. На самом деле удлинение конвейера приводит еще к некоторым негативным моментам, которые отрицательно сказываются на производительности. Поэтому в большинстве случаев удлинение конвейера ухудшает производительность процессора, если тактовая частота остается прежней. Поэтому Athlon XP с коротким конвейером (чуть больше десятка ступеней) работает в ряде случаев быстрее Pentium 4 при равных тактовых частотах. С другой стороны, удлинение конвейера позволяет значительно повышать тактовую частоту. Повышая тактовую частоту, мы снижаем продолжительность каждого такта. Если мы возьмем процессор с коротким конвейером (например, Athlon XP), где ступеней мало, но они большие и сложные, то в какой-то момент времени ступень уже не сможет успевать выполнять свою работу за один такт — и тактовую частоту дальше увеличивать не получится. Именно поэтому сегодняшние процессоры Athlon XP не работают быстрее 2,2 ГГц (рейтинг 3200+). С другой стороны, если мы разобьем сложные и большие ступени на маленькие и простые, то они будут успевать выполняться за короткие такты. Поэтому сегодня процессоры Pentium 4 с длинным конвейером достигли частоты уже 3,4 ГГц. То есть удлинение конвейера позволяет увеличивать тактовую частоту процессора.

Pentium 4 Prescott: брать или не брать? Новый процессор от Intel - фото 6

Вид процессора Prescott снизу. Современные Pentium 4 насчитывают 478 ножек, а в ближайшем будущем их число увеличится до 775!
Итак, с одной стороны, удлинение конвейера замедляет процессор. Но с другой стороны, оно позволяет увеличивать тактовую частоту работы процессора. Вывод отсюда таков: если мы возьмем ядра Prescott и Northwood на равных тактовых частотах, то Prescott будет работать медленнее. Однако Prescott к концу года легко доберется до 4 ГГц и покажет всю свою силу и мощь. Подведем предварительный итог. В плюсы Prescott отнесем увеличение размера кэша второго уровня L2 до 1 Мб — оно должно дать прирост производительности в ряде приложений, в том числе и в играх. К минусам Prescott отнесем увеличение длины конвейера — при одинаковой тактовой частоте с ядром Northwood производительность Prescott должна быть хуже. Проверим? Пока что мы никак не оцениваем набор инструкций SSE3 — для этого еще не настало время. Что касается Hyper-Threading, то, как показывают наши тесты, эта технология полезна только на определенных приложениях (см. наши таблицы с результатами тестов). _Какие процессоры вышли? _ Во-первых, Intel объявила новую версию процессора из линейки Extreme Edition: Pentium 4 3,4 ГГц с кэшем третьего уровня 2 Мб. Но этот процессор вряд ли будет интересен большинству из-за своей астрономической цены, ведь даже Extreme Edition 3,2 ГГц стоит дороже $700. Во-вторых, был объявлен новый процессор Intel Pentium 4 3,4 ГГц на “старом” ядре Northwood. И, в-третьих, появились следующие версии Pentium 4 на ядре Prescott: 2,8A, 2,8E, 3,0E и 3,2E. К сожалению, выход процессора Intel Pentium 4 3,4E ГГц на Prescott временно задержан. Версия Prescott 2,8A является “усеченным” вариантом — она работает только на системной шине 533 МГц и не поддерживает Hyper-Threading. Все другие версии Prescott работают на частоте FSB 800 МГц и, конечно же, поддерживают Hyper-Threading. Отличить “нормальную” версию Prescott от других процессоров можно по добавлению буквы “E” к частоте. Пара слов о ценовой политике: цены на процессоры с ядром Prescott не будут отличаться от цен на модели Northwood. Тестирование: сравниваем новое ядро Prescott со старым ядром Northwood, оцениваем влияние Hyper-Threading Мы взяли два процессора: Intel Pentium 4 3,2E ГГц на ядре Prescott и Intel Pentium 4 3,2 ГГц на ядре Northwood. Мы проводили тесты на обоих процессорах как с включенной технологией Hyper-Threading, так и с выключенной. О том, какую тестовую конфигурацию мы использовали, можно узнать из соответствующей таблицы (она тут неподалеку). Тестовая конфигурация Процессоры Intel (Socket 478)
200 МГц FSB (двухканальная DDR400) Pentium 4 3,20 ГГц (512 Кб кэш L2)
Pentium 4E 3,20 ГГц (1 Мб кэш L2)
Память
Платформа Intel 4x Corsiar TwinX CMX256A-3200LL (XMS32005V1.1)
256 Мб на DIMM
CL 2,0 — tRCD 2 — tRP 2 — tRAS 6 для 200-МГц FSB
Материнская плата
Платформа Intel Asus P4C800-E Deluxe, Rev. 1.02
(Socket 478) Чипсет Intel 875P
BIOS: 1014
Intel 82547EI Gigabit Ethernet Controller (CSA)
Системное аппаратное обеспечение
Графическая карта Asus A9800XT/DVD, Rev. 1.01
GPU: ATI Radeon 9800XT, 412 МГц частота чипа
Память: 128 Мб DDR-SDRAM, частота 365 МГц
Звуковая карта Terratec Aureon 7.1 Space
Жесткие диски (массив RAID 0) Maxtor 6Y080M0 Serial ATA, 80 Гб
80 Гб на пластину, 7200 об./мин, кэш 8 Мб
Дисковая подсистема Intel FW82801ER ICH5R / South Bridge Controller
On-Board SATA RAID Controller
Сетевой контроллер См. материнскую плату
Программное обеспечение
Драйверы чипсета Intel Chipset Installation Utility 5.1.1.1002
Графический драйвер ATI Catalyst 4.1 (7.97 / 6.14.10.6414)
Драйверы подсистемы хранения Intel Application Accelerator RAID Edition 3.5.3
Сетевые драйверы Intel Pro Network Driver 8
Версия DirectX 9.0b
Операционная система Windows XP Professional 5.1.2600, Service Pack 1
__ __ NORTHWOOD VS. PRESCOTT: ИГРЫВ красных клетках: Prescott проигрывает Northwood В зеленых клетках: Prescott выигрывает у Northwood В черных клетках: нет существенной разницы Название

Northwood 3,2 ГГц без HT

Northwood 3,2 ГГц с HT

Prescott 3,2 ГГц без HT

Prescott 3,2 ГГц с HT

Comanche 4, fps

64,2

65,2

55,8

55,9

Quake III, fps

222,1

223,3

215,0

215,5

Splinter Cell, fps

71,5

71,7

71,1

70,9

Unreal Tournament 2003, fps

249,7

249,6

243,4

241,6

Wolfenstein — Enemy Territory, fps

148,3

148,5

146,3

146,0

X2 Demo — The Treat Rolling, fps

156,5

155,7

156,0

156,2

3DMark03 CPU

661

670

661

670

AquaMark 3, fps

101,9

104,9

98,8

102,4

Результаты подтверждают наши догадки и позволяют сделать два вывода. 1. Hyper-Threading пока что не дает выигрыша в играх. 2. На одинаковой тактовой частоте процессор Prescott работает медленнее Northwood в пяти игровых тестах из восьми, хотя разница в большинстве случаев невелика.
__ __ NORTHWOOD VS. PRESCOTT: АУДИО И ВИДЕО Здесь мы измеряли время кодирования аудио- и видеопотоков. Чем быстрее выполняется кодирование, тем лучше.В красных клетках: Prescott проигрывает Northwood В зеленых клетках: Prescott выигрывает у Northwood В черных клетках: нет существенной разницы Название

Northwood 3,2 ГГц без HT

Northwood 3,2 ГГц с HT

Prescott 3,2 ГГц без HT

Prescott 3,2 ГГц с HT

Mainconcept MPEG Encoder 1.4.1, время, с

205,0

164,7

214,1

164,7

Pinnacle Studio 9, время, с

180,1

158,4

172,1

148,4

XMPEG 5.0.3 / DivX 5.1.1 Pro, время, с

105

95

98

90

Windows Media Encoder 9, время, с

190

160

190

159

Windows Movie Maker 2.0, время, с

129

108

131

111

Steinberg Nuendo, время, с

189

176

197

167

Lame 3.95.1, время, с

91

89

101

100

Выводы будут следующими: 1. Технология Hyper-Threading дает существенный прирост производительности при кодировании аудио и видео. 2. Как видим, результаты кодирования MP3 в Lame и фильмов в Movie Maker 2.0 и Mainconcept MPEG Encoder на Prescott оказались хуже. Выше мы уже говорили, что увеличение кэша не дает прироста производительности на таких приложениях. А удлинение конвейера оказало свое негативное влияние. В случае с DivX Prescott выиграл, но связано это, скорее всего, с оптимизациями кодека под новый процессор — команда DivX очень любит этим заниматься.
____ __ NORTHWOOD VS. PRESCOTT: ТЕСТЫ ПРИЛОЖЕНИЙВ красных клетках: Prescott проигрывает Northwood В зеленых клетках: Prescott выигрывает у Northwood В черных клетках: нет существенной разницы Название

Northwood 3,2 ГГц без HT

Northwood 3,2 ГГц с HT

Prescott 3,2 ГГц без HT

Prescott 3,2 ГГц с HT

BAPCo SYSmark 2004 ICC, баллы

185

213

169

216

BAPCo SYSmark 2004 Office, баллы

184

168

187

169

BAPCo SYSmark 2004, баллы

176

198

169

201

WinRAR 3.20, время, с

277

275

260

258

Newtek Lightwave 7.5c, время, с

148,2

132,6

158,1

137,0

Maxon Computer Cinema 4D XL 8.503, время, с

226

190

255

216

Discreet 3DStudio MAX 6.0, время, с

97

101

107

97

Wolfram Research Mathematica 5.0, время, с

7,2

7,4

7,5

7,9

Обратите внимание на результаты WinRAR: сжатие на Prescott осуществляется быстрее примерно на 20 секунд, поскольку увеличение размера кэша очень благотворно сказывается на работе архиваторов. Интересны и результаты приложения по созданию 3D-анимации 3DStudio MAX: если у Northwood включение Hyper-Threading увеличивает время создания ролика на 4 секунды, то у Prescott аналогичный шаг уменьшает время создания на 10 секунд. Как видим, Intel действительно оптимизировала поддержку Hyper-Threading в ядре Prescott. В других приложениях по 3D-анимации переход на Prescott ухудшает производительность.
__ NORTHWOOD VS. PRESCOTT: СИНТЕТИЧЕСКИЕ ТЕСТЫВ красных клетках: Prescott проигрывает Northwood В зеленых клетках: Prescott выигрывает у Northwood В черных клетках: нет существенной разницы Название

Northwood 3,2 ГГц без HT

Northwood 3,2 ГГц с HT

Prescott 3,2 ГГц без HT

Prescott 3,2 ГГц с HT

Futuremark PCMark04 CPU, баллы

4372

4877

4344

4947

Futuremark PCMark04 Итог, баллы

4403

4978

4471

5018

SiSoft Sandra 2004 Pro CPU Dhry/Whet

4310/8221

7105/9639

3961/7969

6650/8673

SiSoft Sandra 2004 Pro MM Int/FPU

23 509/19 857

33 901/24 522

20 682/18 094

30 381/22 639

SiSoft Sandra 2004 Pro Mem Int/FPU

4966/4916

4932/4924

5008/5009

5002/5007

Ответ на Главный Вопрос По итогам нашего тестирования (см. врезки с результатами тестов) можно сделать следующие выводы. Intel отказалась от намерения выпускать Prescott под именем Pentium 5 — и причины очевидны. Процессор на ядре Prescott в 1/3 части тестов работает медленнее: программы типа большинства 3D-шутеров и даже серьезных приложений типа Lame, MS Movie Maker 2, Mathematica, Cinema 4D или даже 3D Studio работают хуже, чем раньше. С другой стороны, такое же количество приложений работает на процессоре Prescott быстрее. Здесь мы можем отметить кодирование DivX с помощью Xmpeg, архивацию файлов с WinRAR, обработку видео на Pinnacle Studio 9 и обновленный пакет тестов SYSmark 2004. Замедление связано с увеличением длины конвейера с 20 до 31 ступеней, а рост — с увеличением размера кэша второго уровня с 512 Кб до 1 Мб. По мере внедрения нового набора инструкций SSE3 производительность Prescott будет увеличиваться — произойдет это не раньше осени. Пока что набор SSE3 практически бесполезен. Что касается Hyper-Threading, то поддержка этой технологии в Prescott была улучшена, однако выигрыш от Hyper-Threading пока заметен только в приложениях по кодированию аудио и видео. Впрочем, у этой технологии есть и другой плюс: Hyper-Threading ускоряет работу нескольких одновременно запущенных приложений. Для геймеров Hyper-Threading пока что бесполезна. Надеемся, что ситуация изменится в будущем, когда выйдут игры с поддержкой этой технологии. Ситуация с Prescott напомнила нам выход Pentium 4, когда процессоры Pentium 4 в ряде тестов работали медленнее процессоров Pentium III на такой же тактовой частоте. Однако в будущем, при увеличении тактовой частоты, технология NetBurst смогла показать всю свою мощь. Скорее всего, с Prescott наблюдается примерно та же картина: процессоры пока ничем особым не выделяются от “старичков” на

Комментарии
Чтобы оставить комментарий,Войдите или Зарегистрируйтесь