Двойной удар DDR, или практическое исследование новых материнских плат с двухканальным интерфейсом памяти

Двойной удар DDR, или практическое исследование новых материнских плат с двухканальным интерфейсом памяти

Тест — Двойной удар DDR, или практическое исследование новых материнских плат с двухканальным интерфейсом памяти
"...Еще древним было известно, что, поставив нl
Игроманияhttps://www.igromania.ru/
Тест
Двойной удар DDR, или практическое исследование новых материнских плат с двухканальным интерфейсом памяти
   
   Мама...

   Всякому понятно, что для того, чтобы наслаждаться играми, нужно иметь очень-очень мощный процессор. Так? После этого наступает очередь покупки суперсовременной видеокарты, которая обеспечит высочайшую скорость в любых разрешениях и отличное качество при феноменальной же детализации. Важно не забыть про звуковую карту последнего поколения, которая враз поразит уши окружающих объемным семиканальным звуком. Наконец, крутой монитор и "геймерская мышь" (злая такая и оптическая) — также несомненные атрибуты любого правильного компьютера. И только закупив их, ты вдруг замечаешь, что все это великолепие надевается на старенькую материнскую плату с раритетным чипсетом i845 или на худой конец KT133A. В этот светлый миг приходит отчетливое понимание того, что вместо сердца истинному геймеру потребен не кардиостимулятор, а как минимум пламенный мотор. Мощный агрегат, который сможет собрать все эти компоненты вместе и бесперебойно гнать данные с достаточной скоростью, не тормозя тем самым общую работу системы.
    Еще древним было известно, что, поставив новенький Р4 2.53 ГГц (или даже 3.06 ГГц) на старую плату с обычной (не DDR) памятью SDRAM, никакого заметного прироста скорости по сравнению с Celeron 1.5 не получишь. Поэтому самое время задуматься о покупке новой материнской платы с поддержкой самых последних, самых быстрых технологий. Вот о некоторых из этих технологий мы и поговорим сегодня.

   Память как важный компонент, или зачем нам нужно 2 канала

   Надеюсь, не стоит объяснять, зачем нужна
63 Kb
оперативная память — в ней аккумулируются все данные, необходимые для работы программ и некоторых аппаратных составляющих системы. Соответственно, данные забираются с постоянного носителя (жесткий диск, CD-ROM, флэш), отправляются на обработку (в центральный или в видео/аудио процессор), после чего прошедшие обработку данные выводятся через собственные интерфейсы (например, с видеокарты — на монитор), либо опять же попадают в ОЗУ и рассылаются уже, так сказать, конечным потребителям. Таким образом, любая работа с данными требует участия оперативной памяти. При этом львиную долю пропускной способности (количество данных, которые память успевает пропустить за единицу времени) требует под себя процессор.
    Определившись с ролью памяти, стоит пару слов сказать и о ее скорости. Скорость работы с памятью определяется скоростью работы шины (Front Side Bus, FSB) и шириной канала памяти, который для SDRAM составляет 64 бита. Для Rambus эта цифра равна 16, но там последовательный интерфейс, и частота шины составляет 400 МГц. Кроме того, современные стандарты памяти используют технологию DDR, которая позволяет вдвое поднять теоретический лимит передаваемой за единицу времени информации за счет использования обоих фронтов сигнала. Таким образом, память стандарта RDRAM с частотой FSB 400 МГц имеет результирующую частоту 800 МГц (РС800), с частотой 533 МГц — 1066 МГц (РС1066). Память DDR работает при частоте FSB 100, 133, 166 и 200 МГц (соответственно, DDR 200, 266, 333, 400). Общепринятое и часто встречающееся обозначение РС1600, 2100, 2700 и 3200 демонстрирует как раз именно максимальную пропускную способность.
    Современным процессорам семейства Pentium 4, особенно старших моделей, в силу особенностей архитектуры необходима широкая полоса пропускания системной памяти. Вообще, ситуация с шиной памяти для Pentium 4 достаточно интересна. С одной стороны, процессор проектировался для работы с памятью типа Rambus RDRAM, которая обладает очень высокой пропускной способностью, но и большой латентностью (так называется промежуток времени, который проходит между запросом и началом поступления данных). Собственно, отсюда же идут разговоры об оптимизации процессора "под потоковые приложения", когда пересылаются большие объемы данных. Однако на редкость неудачный старт систем с RDRAM, которые впервые появились на рынке в связке с процессором Pentium III, который не был под нее оптимизирован, заставил Intel искать другие решения, и в конце концов компания была вынуждена перейти на использование уже широко
90 Kb
распространенного и значительно более дешевого типа памяти DDR SDRAM. Вполне естественно, что такое решение повлекло за собой неминуемое снижение производительности, ибо память типа DDR SDRAM не сможет полностью обеспечить потребности процессора в данных, и единственный способ исправить ситуацию — это гнать частоты DDR до предела. Соответственно, проблема увеличения частоты работы шины памяти стала одной из основных — потому как наращивание тактовой частоты процессора при сохранении низкоскоростной памяти не дает должного эффекта.
    Как результат эволюции — частоты памяти стали активно расти, появилась память стандарта DDR333 и DDR400. Последняя в данный момент еще не прошла официальную сертификацию, однако многие производители выпускают модули с такой частотой и чипсеты с поддержкой частоты памяти в 200 МГц. Но даже при такой скорости память продолжает оставаться узким местом, тормозящим работу процессора и, следовательно, — всей системы.
    Давайте взглянем на цифры. Современные Р4 на частоте FSB в 133 МГц (шина процессора 533 МГц) имеют полосу пропускания памяти в 4.2 ГГц. Ту же самую предельную пропускную способность дает нам и двухканальный Rambus, но при этом особенности строения памяти там другие. Если же мы возьмем DDR SDRAM, то РС266 имеет пропускную способность в 2.1 ГГц, что для Рentium 4 несколько маловато. Даже если взять "неофициальный" РС3200, то он даст всего лишь 3.2 ГГц.
    И не надо забывать, что это пиковая пропускная способность, и в суровой реальности существует много "накладных расходов", которые тормозят обмен данными и отъедают пропускную способность. Поэтому при интенсивной работе с памятью процессор тормозится достаточно серьезно — общий проигрыш может достигать в некоторых приложениях 10% (не надо забывать, что в компьютере много подсистем, и увеличение скорости одной из них, скажем, на 25% в самом удачном случае даст общий прирост в 10%). С другой стороны, двухканальный интерфейс — когда данные одновременно считываются по двум каналам из двух банков (двух модулей памяти) — даже на частоте 266 МГц вполне мог бы перекрыть потребности процессора Рentium 4. Кстати, возникает резонное предположение, что если поставить память на частоту 333 или 400 МГц, то таким образом можно создать неплохой задел на будущее для использования другими устройствами в системе. Минус такого подхода в том,
104 Kb
что, если частоты работы процессора и памяти не синхронны, необходимо вводить буферы в чипсете, появятся задержки синхронизации потока данных, и в итоге прирост будет меньше ожидаемого (главное, что он все же будет). Вообще, вопрос установки асинхронной шины во многом зависит от используемых приложений, поскольку разные классы задач по-разному работают с памятью.
    Итак, после того, как все традиционные возможности увеличения производительности (то есть простое увеличение частоты) были исчерпаны, мысли о создании двухканального интерфейса памяти стали все чаще посещать умы разработчиков, подстегиваемые существованием, с одной стороны, двухканального чипсета Intel 850/850E (правда, довольно простенького, работающего только в режиме чередования), а с другой стороны — nForce2 NVIDIA под платформу AMD, в котором уже реализован отличный механизм двухканального обмена с памятью. Результаты размышлений появились практически одновременно у SiS, основного официального партнера Intel по выпуску чипсетов для процессоров P4, и у самой Intel. Однако подходы все же различаются. SiS создала максимально гибкий продукт, допускающий установку асинхронной шины памяти и даже модулей DDR 400 (для статьи снимались бенчмарки и в этом режиме). А вот Intel в своем чипсете Е7205 Granite Bay решил ограничиться лишь синхронной шиной, стремясь свести к минимуму задержки при работе с памятью и оптимизировав скорость доступа, а не скорость передачи. Итак, давайте посмотрим, что же получилось у двух производителей.

   GraniteBay и SiS 655 — подробности

   Начнем с SiS 655, как с творения стороннего производителя.
90 Kb
SiS 655 имеет 2 полностью независимых канала работы с памятью, которые могут обеспечивать 128-битный доступ. Поскольку каналы независимые, система может работать и с одним модулем памяти, просто тогда второй канал останется незадействованным. Важно также упомянуть, что этот чипсет асинхронный, то есть частоты работы шины процессора и шины памяти могут быть различными.
    Что касается Intel E7205, то он тоже имеет два независимых канала и тоже может функционировать с одним установленным модулем памяти. А вот шины у него жестко связаны, поэтому на данный момент он может работать только с памятью стандартов DDR200 (при использовании процессора с шиной 400 МГц) и DDR266 (при использовании процессора с
шиной 533 МГц). Память DDR333 пока не поддерживается ни в каком виде. То есть модули этого стандарта поставить можно, однако работать они могут только на 200 или 266 МГц. Стоит также отметить, что платы на E7205 достаточно дороги (порядка $150-$180) и тенденций по их удешевлению пока незаметно. Цена складывается из стоимости чипсета, который Intel к тому же нацеливает в сектор рабочих станций, и из-за сложного шестислойного дизайна материнских плат.
    В качестве референс-платформы использовалась платформа Intel i850E с двумя установленными модулями Samsung PC1066 общей емкостью 512 Мб. Напомню, что этот чипсет тоже двухканальный и требует установки модулей парами. Из-за этого упрощается внутренняя логика чипсета, однако очевидным недостатком является необходимость покупки четного количества модулей. Кроме того, i850E — синхронный чипсет.

   Тесты

   Итак, для тестов были взяты две платы от известного производителя Giga-ByteGA-8INXP на чипсете E7205, а также GA-8SQ800 на SiS 655. Платы от Giga-Byte традиционно обладают высоким качеством и культурой исполнения, аккуратной разводкой и хорошими комплектами поставки.
100 Kb
С другой стороны, все платы поставляются с такими BIOS, в которых в нормальном режиме невозможно выставлять пользовательские настройки памяти. Существует лишь невнятная настройка Top Performance. В общем, Е7205 тестировался на установках по умолчанию, поскольку там выбор все равно небольшой, а вот настройки платы на SiS 655 я попробовал поменять. Дело в том, что установленная память была прописана в SPD как DDR400 и, соответственно, так и установилась, поэтому чипсет работал в асинхронном режиме. Интересно было взглянуть, как он будет работать в синхронном режиме, на одной частоте с процессором.
   Тестовая система:
   Pentium 4 3.06 (Hyper Threading disabled)
   512 Мб памяти (2х256 или 1х512 DDR SDRAM, PC3200 (DDR 400), 2х256 RDRAM PC1066 Мб для i850E).
   Видеокарта NVIDIA GeForce Ti 4200
   Жесткий диск IBM, 40 Гб

   Комментируя результаты проведенных тестов, стоит отметить несколько принципиальных моментов.
   Момент первый заключается в том, что
какое-никакое, но все же лидерство осталось у связки i850E+RDRAM. И это при том, что была использована родная плата от Intel, чье традиционное кредо — надежность, а никак не производительность. Изначальная оптимизация процессора Pentium 4 сделала свое дело, и RAMBUS "уделал", пусть и всего на пару кадров, новое поколение двухканальных DDR.
   Что же касается собственно DDR, то двухканальный режим доступа к памяти наглядно продемонстрировал свои преимущества. Прибавка по отношению к одноканальному режиму достаточно серьезная, и система на E7205 с двухканальным доступом практически догнала по производительности i850E+RAMBUS. Что же касается SiS 655, то там ситуация еще интереснее. При использовании чипсета в максимальном — асинхронном режиме с памятью DDR400 (2x256) все работает очень быстро на уровне E7205 и лишь на пару кадров меньше, чем у RAMBUS. При переходе же к синхронному режиму и памяти DDR266 отлично заметно преимущество контроллера от Intel и недостатки асинхронности контроллера от SiS. Неизбежные для последнего буферы и синхронизаторы, позволяющие работать с различными частотами памяти и процессора, платят за эту возможность чистой производительностью. По сути получается, что при использовании DDR266 SiS 655 при двух каналах работает лишь чуть быстрее, чем E7205 при одном.
    В одноканальном режиме E7205 хорош. Приличная производительность заметно быстрее, чем у SiS 655 (когда один канал+DDR266), и в среднем очень неплоха для одного канала и памяти DDR266. В случае SiS свою крутизну демонстрирует естественная пропускная способность памяти DDR400. С ней чипсет работает быстрее, чем E7205+DDR266 (кто бы сомневался), и чуть ли не догоняет двухканальный режим SiS 655 и E7205. То есть на самом деле процессору с такой памятью во многих случаях вполне хватает даже и одного канала (мы исследовали эту тенденцию только на игровых приложениях). В связке же SiS 655+DDR266 одного канала явно недостаточно — падение производительности просто катастрофическое.

   Вывод

   Глобальный вывод данной статьи заключается в бесспорной перспективности и принципиальной нужности чипсетов с двухканальным доступом к памяти. Нужда в большой пропускной способности была, есть и остается актуальной. В связи с чем наша тестовая лаборатория смеет
84 Kb
делать далеко идущие выводы о скорой и неизбежной гибели идеалов одноканальной DDR. Будущее бесспорно за двумя-тремя или даже четырьмя каналами, бесперебойно поставляющими данные для все более и более требовательных процессоров. Об этом также сигнализирует и цена на память SDRAM DDR. Сегодняшние тенденции к ее удешевлению внушают оптимизм и трепетную надежду на быструю и безболезненную миграцию большинства пользователей на новую платформу.
    Переходя же к конкретным участникам тестирования, хотелось бы отметить в первую очередь SiS 655. Его главное розничное преимущество — это скромная цена. Всего за 140 баксов покупатель получает теоретически пиковую производительность современной платформы Pentium 4. При этом покупать этот продукт следует только в паре с модулями DDR400. Использование DDR266 или DDR333, а также работа с ними в одноканальном режиме не дадут должного эффекта и только испортят ваше мнение о платформе в целом.
    На втором месте из фаворитов стоит E7205 — однозначно качественный и быстрый продукт по чуть более высокой цене (в среднем порядка $180). Также рекомендуется для употребления в двухканальном режиме, однако и в одноканальном способен насыпать под хвост перца конкурентам.
    Нельзя забывать, что оба DDR продукта-участника помимо уже перетертой выше производительности предлагают покупателям целый набор вкусных плюшек — среди которых Serial ATA контроллер, ATA 133 RAID, порт AGP 8X и FireWire (IEEE1394). Боимся сглазить, но по отдельным прайсам уже заметны небольшие, но все же тенденции к увеличению ассортимента и снижению цен на двухканальные материнские платы.
    О судьбе RDRAM говорить можно долго. Судя по тестам, запас производительности этой архитектуры велик и все еще способен на подвиги. Однако отрыв уже не так существенен, как в былые годы, и нет уж рядом могущественного соратника в лице Intel. Будущее RAMBUS покрыто мраком и на данный момент не определено. Особенно огорчает стоимость и ассортимент модулей памяти — по Москве разница в цене между 512 Мб DDR400 и PC1066 RDRAM отличается более чем в два раза не в пользу RDRAM. А это уже суровая плата за пару процентов прироста по сравнению с двухканальным DDR. На данный момент, пока не выйдет обещанный компанией SiS чипсет с поддержкой четырехканальной RDRAM и пока, наконец, не понизятся
розничные цены, рекомендовать к покупке данную платформу можно только обеспеченным комрадам, принципиально приверженным идеям максимальной производительности.

   Результаты тестов
Конфигурация Тесты
UT 2003Flyby/botmatch Max Payneend sequence1/end sequence2 Comanche 4 3DMark 2001SE
Intel 850E, 512MB PC1066 202/75 failed 57,5 13212
E7205, 1x512mb 189/68,7 73,5/94 52,5 12250
E7205, 2x256mb 199/73 76,4/99,5 55,3 12714
Sis655, DDR400, 1x512 194/71 79/94 55,1 12730
Sis655, DDR400, 2x256 198/72,5 81/101 55,3 12762
Sis655, DDR266, 1x512 178/63 72,5/89 50 12188
Sis655, DDR266, 2x256 189/67 76,5/95,5 53 12300


   
   Краткий словарик

   Последовательный интерфейс. Интерфейс, при
72 Kb
котором данные пересылаются не по нескольким проводникам одновременно с последующей синхронизацией, а последовательно по одной линии.
   SDRAM, Rambus RDRAM. Типы оперативной памяти. Различаются строением чипа, организацией доступа.
   Front Side Bus, FSB. Шина, связывающая процессор и северный мост чипсета, отвечающий за координацию работы шин процессора, памяти и шины PCI.
   Пропускная способность памяти — максимальное теоретическое количество данных, которое шина памяти способна пропустить за определенное время.
   DDR. Подвид SDRAM, способный передавать данные на обоих фронтах электрического импульса, что теоретически позволяет достичь вдвое большей производительности. На практике максимально удается добиться 50-70% прироста скорости относительно традиционной SDRAM. Как правило, в обозначениях типа DDR266, 333 обозначают результирующую (т.е. с учетом передачи на обоих фронтах) частоту работы памяти (266266 МГц, частота 133 МГц, 333333 МГц, реальная частота 166 МГц).
   Двухканальный доступ к памяти. Организация не одной, а двух шин передачи данных от памяти к чипсету. Позволяет за единицу времени считать вдвое больше данных. Независимость каналов означает, что каждый канал может работать отдельно, т.е. не нужно устанавливать модули в оба канала.
   Чипсет (он же "системная логика"). Набор микросхем, составляющих суть материнской платы и осуществляющий координацию работы различных компонентов компьютера (процессора, видеокарты, памяти, жесткого диска и пр.).
   SPD. Микросхема, в которой записаны характеристики модуля памяти, чипов, скорости доступа и пр.
   Латентность памяти (упрощ.). Время, которое проходит между посылкой запроса и началом передачи данных модулем.
Комментарии
Загрузка комментариев