Холивар не выдержит двоих. Тестирование видеокарты PowerColor Radeon HD 6970
После долгих развлечений с переименованием старых видеокарт и выкатыванием «новых серий» AMD представила настоящее следующее поколение — платы Radeon HD 6970 и HD 6950 на процессоре Cayman. Мы незамедлительно достали старшую карту на тесты и разобрались, что же такого придумали в AMD и на что способна новая архитектура.
В очередь
Перед тем как перейти к разбору видеокарт, необходимо сказать пару слов об их месте на рынке. Грандиозной битвы HD 6970 и GTX 580 не будет. Старшая карта, HD 6970, конкурирует с GTX 570 и GTX 480. А вот у младшей, HD 6950 , противников пока нет, она располагается где-то между GTX 570 и GTX 470. В верхнем ценовом сегменте без изменений: там остается HD 5970 , которая до сих пор с успехом борется с GTX 580.
Несмотря на то что AMD сознательно отказалась от соревнования с GF110, ядром GTX 580, процессор Cayman на удивление интересен. От Cypress в нем остались только основополагающие элементы. Так, в Cayman используется тот же принцип суперскалярности: операции разбиваются на простые действия и выполняются параллельно. Соответственно, на месте и ядра с технологией SIMD, которые занимаются циклическими операциями, проводимыми одновременно с несколькими массивами данных.
А вот компоновка ядер изменилась. В прошлой архитектуре, VLIW5, их объединяли в группы по пять штук на одном потоковом процессоре. Четыре ядра отвечали за простые действия типа сложения и умножения, а пятое, называемое t-unit, — за специальные вычисления вроде синуса, логарифма, извлечения корня и т.п. К сожалению, с такой компоновкой сильно проседал КПД процессора: равномерно загрузить ассиметричную архитектуру сложно, и ядра часто простаивали без дела.
Теперь AMD перешла на архитектуру VLIW4. Вместо пяти ядер на потоковом процессоре оставили четыре, зато три из них научили работать со сложными функциями. Это заметно облегчило жизнь программистам, позволило более равномерно загружать ядра и повысить производительность в расчете на площадь.
В остальном компоновка похожа на Cypress. Потоковые процессоры объединены в SIMD-массивы — по 16 штук в каждом. Всего таких наборов 24 штуки — на четыре больше, чем в Cypress, — но вот самих SIMD-ядер меньше, 1536 против 1600. За счет этого AMD удалось сэкономить место и оставить по четыре текстурных блока на каждый массив. В итоге у Cayman насчитывается 96 TMU — на 16 больше, чем у старого процессора.
Количество блоков растеризации осталось тем же, 32 ROP, но работают они быстрее: AMD ускорила обработку 16- и 32-битных значений и стала эффективнее нагружать шину памяти.
А вот и она
Отдельного упоминания стоит тесселяция. Как известно, видеокарты AMD прошлого поколения сильно проигрывали платам NVIDIA. В то время как последние уже давно использовали для расчета параллельно функционирующие движки, AMD даже в серии Radeon HD 6800 продолжала работать только с одним процессором тесселяции. В Cayman количество графических движков (тесселятор, растеризатор, вершинный и геометрический компиляторы) увеличили до двух. За счет этого, по данным AMD, скорость расчета тесселяции выросла в три раза.
Продолжает AMD заниматься и улучшением изображения. В HD 6800 мы получили новый режим антиалиазинга, Morphological AA, в котором процессор работает не с геометрией, а с готовой картинкой. В HD 6900 появился еще один режим сглаживания — Enhanced Quality Anti-Aliasing (EQAA). По принципу работы он похож на традиционный мультисемплинг (MSAA), но, в отличие от старого стандарта, позволяет делать больше выборок на один пиксель без дополнительной нагрузки на память. В результате качество получается выше, а производительность практически не страдает.
Еще отметим, что, несмотря на количественные изменения, даже при старом 40-нм техпроцессе чип Cayman остался сравнительно небольшим, всего 389 мм2 — против 334 мм2 Cypress. Число транзисторов увеличилось не сильно — с 2,19 до 2,64 млрд. Сравните с GF110, процессором GTX 580, который оснащен 3 млрд транзисторов и занимает площадь в 529 мм2.
Быстро и экономично
Еще одна новинка AMD — высокие частоты работы и грамотное управление энергопотреблением. В обзоре GTX 580 мы упоминали, что NVIDIA установила датчик контроля цепей питания, который не позволяет синтетическим тестам вроде FurMark искусственно перегружать плату. AMD пошла тем же путем, но вместо того, чтобы просто ограничить доступ к некоторым тестам, установила тотальный контроль.
В процессор встроили множество датчиков, которые в реальном времени следят за тем, какие блоки включены, как они используются, сколько на это может потребоваться энергии и так далее. В результате AMD научила платы предугадывать повышение энергопотребления и заранее снижать тактовую частоту. Причем работает это не только в синтетике, как у NVIDIA, но и в играх.
Таким образом AMD смогла оградить платы от перегрева и выхода из строя и поднять частоту процессора до впечатляющих 880 МГц, а памяти — до 5500 МГц. При этом снижение скорости при перегреве не должно влиять на производительность: троттлинг включается на доли секунды и никак не сказывается на среднем показателе fps.
Для любителей разгона AMD предусмотрела частичное отключение защиты. В настройках AMD Catalyst появился специальный пункт Power Control. Через него можно увеличить или, наоборот, уменьшить количество потребляемой энергии. Хотите разогнать плату, а троттлинг сводит все ваши усилия на нет? Пожалуйста, передвиньте ползунок энергопотребления на +20% и продолжайте эксперименты. Нужно, напротив, затормозить процессор? Сдвигайте ползунок на –20%, и видеокарта все сделает сама.
Еще один подарок оверклокерам — двойной BIOS. AMD разместила на плате два набора памяти: один с жестко зашитыми заводскими настройками, второй — для наших экспериментов. В случае неудачной прошивки нужно всего лишь сдвинуть рычажок рядом с разъемами CrossFire — и откатиться к стандартным настройкам. Такое мы, признаться честно, видим в первый раз.
Сестричка
Младшая видеокарта нового поколения, Radeon HD 6950 , которую нам пока так и не удалось достать на тесты, по компоновке и возможностям практически не отличается от старшей. AMD лишь немного урезала процессор: массивов SIMD осталось 22 штуки вместо 24, количество потоковых процессоров сократилось с 1536 до 1408, а текстурных блоков — с 96 до 88. Частоты работы тоже снизили, но не сильно — до 800 МГц на процессоре и 5000 МГц на видеопамяти. Больше ничего не тронули: на месте 32 ROP, 2 Гб GDDR5 и шина памяти 256-бит.
Как видите, для карты среднего уровня HD 6950 получилось очень мощной. От старшей версии она отстает на каких-то 10%. А все из-за того, что дальше снижать характеристики некуда, иначе HD 6950 начнет конкурировать с серией HD 6800, чего AMD точно не нужно. Вот и получается, что младшая в линейке HD 6900 карта стоит почти 12 000 рублей.
Radeon HD 6950 оказалась отличным подарком для оверклокеров. Оказывается, на плате стоит тот же самый Cayman, что и в старшей версии, с 24 SIMD-массивами и скоростью работы 880 МГц, а все ограничения сделаны через BIOS. Это значит, что, если записать в HD 6950 прошивку от старшей платы, получится полноценная HD 6970! Как утверждают интернет-энтузиасты, результат стопроцентный. В крайнем случае всегда можно откатиться на заводские настройки: двойной BIOS есть и на HD 6950. Впрочем, халява наверняка закончится даже раньше, чем этот номер появится в продаже. В AMD знают о лазейке и вовсю готовят обновленную видеокарту с железной блокировкой SIMD-блоков.
Красный барон
На момент запуска новой серии AMD представила всего две видеокарты — Radeon HD 6970 и HD 6950. Получить их на тесты одновременно было очень сложно. С большим трудом мы нашли старшую версию у PowerColor , а младшей платы в нашей стране на момент сдачи номера не оказалось.
PowerColor Radeon HD 6970 — эталонный образец видеокарты от AMD, только с фирменной наклейкой PowerColor. Внешне плата похожа на рассмотренную ранее Radeon HD 6870: вся поверхность закрыта большим угловатым кожухом, напоминающим черно-красный слоеный пирог. На дальней стороне расположен 75-мм вентилятор, который прогоняет воздух через карту и выбрасывает его за пределы корпуса. На самом процессоре по традиции стоит испарительная камера, соединенная с полностью медным радиатором.
Набор разъемов такой же, как у Radeon HD 6800: два DVI, столько же mini-DisplayPort 1.2 и один HDMI 1.4a. Все это позволяет подключить к видеокарте до шести мониторов, смотреть Blu-ray 3D на стереотелевизорах и выводить звук в форматах Dolby TrueHD и DTS-HD Master Audio.
Во время работы карточка потребляет 250 Вт и требует подключения 8- и 6-pin вилок питания.
Тесты
Про конкурентов мы уже говорили, поэтому сейчас приведем только список участников тестирования — Radeon HD 6970, GeForce GTX 580, GeForce GTX 480, Radeon HD 5870 и Radeon HD 5970. К сожалению, к сдаче номера мы не успели достать GeForce GTX 570, так что о ней поговорим в следующий раз.
Список тестов стандартный — синтетические бенчмарки 3DMark Vantage и Unigine Heaven Benchmark 2.0 , два проекта на DX10 — Resident Evil 5 и Devil May Cry 4 , две игры на DX11 — Lost Planet 2 и Aliens vs. Predator.
Результаты вас немного удивят. 3DMark Vantage по результатам теста GPU поставил Radeon HD 6970 на третье место — после GTX 580 и HD 5970 и аккурат перед GTX 480. Unigine Heaven Benchmark 2.0 вообще отдал карте второе место — сразу после GTX 580! Могли ли мы подумать, что в самом тяжелом тесте с DX11 Radeon HD 6970 окажется чуть-чуть быстрее GTX 480? Ведь это значит только одно: AMD наконец-то отобрала у NVIDIA ее главный козырь — расчет запредельных уровней тесселяции.
В играх ситуация сохранилась. В первом тесте, Resident Evil 5, все карты отработали примерно на одном уровне, показывая чуть больше 100 fps. В Devil May Cry 4 до HD 5970 и GTX 580 с их невероятными результатами по 210-230 fps не добралась ни одна видеокарта. Зато из борьбы с GTX 480 наша Radeon HD 6970 вышла победителем, обогнав соперника на 9%.
Не изменилась ситуация и в DX11-играх. В тесте Aliens vs. Predator новинка от AMD не только уверенно обгоняла GTX 480, но и держалась на уровне GTX 580. А вот результаты Lost Planet 2 нам показались странными. HD 6970 отстала от GTX 480 на 18%, и это как-то не вяжется с предыдущими тестами.
Итого
Вообще же итоги тестирования скучноваты. Никаких прорывов, откровений или рекордов скорости. Да и вообще, если забыть про второстепенные технологии и посмотреть на цифры, то станет заметно, что ничему, кроме работы с тесселяцией, новую карту не научили. Разница в DX10-играх между HD 5870 и HD 6970 всего каких-то 3-6%.
Нам кажется, что выход Radeon HD 6970 был продиктован не столько коммерческими соображениями, сколько необходимостью ответить на понукания NVIDIA, карты которой значительно лучше работали в DX11. Кроме того, это был прекрасный повод подстегнуть интерес к продукции AMD и, конечно, замечательный шанс обкатать новую архитектуру VLIW4. Что-то нам подсказывает, что именно она будет использоваться на новых видеокартах, создаваемых по 28-нм нормам производства. В целом же мы пока не видим смысла ни в HD 6970, ни в GTX 580 — по крайней мере до тех пор, пока не появятся игры, способные их нагрузить.
* * *
Стоит ли покупать Radeon HD 6970 — отдельный вопрос. Если у вас уже есть Radeon HD 5870, то отдавать 14 500 рублей за тесселяцию не резон. Если же вы собираете новый компьютер и мечетесь между HD 6970 и GTX 480, то, наверное, лучше будет взять новую карту. Все-таки AMD привнесла много интересных идей, подключила поддержку HD3D, добавила несколько видов антиалиазинга и научилась эффективно распределять энергию. Что же касается старшего сегмента, то в нем до сих пор господствует GTX 580. Так что если есть лишние 19 000 рублей и нужны 240 fps в Devil May Cry 4, то GTX 580 — единственный выбор. Таблица 1
Технические характеристики
Характеристика AMD Radeon HD 6970 NVIDIA GeForce GTX 580 NVIDIA GeForce GTX 480 AMD Radeon HD 5870 AMD Radeon HD 5970
Ядро Cayman GF110 GF100 Cypress Hemlock
Количество транзисторов 2,64 млрд 3 млрд 3 млрд 2,15 млрд 4,3 млрд
Техпроцесс 40-нм 40-нм 40-нм 40-нм 40-нм
Количество потоковых процессоров 1536 512 480 1600 2х 1600
Частота графического ядра 880 МГц 772 МГц 700 МГц 850 МГц 725 МГц
Частота потоковых процессоров 880 МГц 1544 МГц 1401 МГц 850 МГц 725 МГц
Тип, объем памяти GDDR5, 2 Гб GDDR5, 1536 Мб GDDR5, 1536 Мб GDDR5, 1 Гб GDDR5, 2 Гб
Частота памяти 5500 МГц 4008 МГц 3696 МГц 4800 МГц 4000 МГц
Шина данных 256 бит 384 бит 384 бит 256 бит 256 бит
Количество текстурных блоков 96 64 60 80 2х 80
Количество блоков растеризации 32 48 48 32 2х 32
Энергопотребление 250 Вт 244 Вт 250 Вт 188 Вт 294 Вт
Интерфейс PCIe 2.0 x16 PCIe 2.0 x16 PCIe 2.0 x16 PCIe 2.0 x16 PCIe 2.0 x16
Цена на январь 2011 года 14 500 рублей 19 000 рублей 13 500 рублей 11 500 рублей 19 000 рублей
Таблица 2
Синтетические тесты
3DMark Vantage
Модель видеокарты GPU CPU Overall Соотношение
AMD Radeon HD 6970 19 098 17 175 18 578 100%
NVIDIA GeForce GTX 580 22 468 48 353 25 940 140%
NVIDIA GeForce GTX 480 16 526 47 711 19 796 107%
AMD Radeon HD 5870 17 402 17 326 17 383 94%
AMD Radeon HD 5970 21 848 17 347 20 517 110%
Unigine Heaven Benchmark 2.0
Модель видеокарты FPS Overall Соотношение производительности
AMD Radeon HD 6970 24,8 626 100%
NVIDIA GeForce GTX 580 31,6 796 127%
NVIDIA GeForce GTX 480 24,6 617 99%
AMD Radeon HD 5870 11,4 288 46%
AMD Radeon HD 5970 19,9 502 80%
Таблица 3
Игровые тесты (кадров в секунду)
Настройки AMD Radeon HD 6970 NVIDIA GeForce GTX 580 NVIDIA GeForce GTX 480 AMD Radeon HD 5870 AMD Radeon HD 5970
Resident Evil 5 (DX10)
High, 1680x1050, AF 16x, AA 8x 110,1 113,8 105,2 105,8 112,7
High, 1920x1080, AF 16x, AA 8x 108,5 108,1 106 99,4 106,7
High, 1680x1050, AF 16x, AA 16x 114,5 108,8 106 108,5 109,8
High, 1920x1080, AF 16x, AA 16x 108,7 106,1 103,7 104,5 105,7
Соотношение производительности 100% 99% 95% 95% 99%
Devil May Cry 4 (SC2, DX10)
SuperHigh, 1680x1050, AF 16x, AA 8x — 242,5 147,5 — —
SuperHigh, 1920x1080, AF 16x, AA 8x 157,9 240,8 138,2 131,5 218,7
SuperHigh, 1680x1050, AF 16x, AA 16x — 222,6 148,7 — —
SuperHigh, 1920x1080, AF 16x, AA 16x 144,7 217,6 136,7 163,2 211,8
Соотношение производительности 100% 151% 91% 97% 142%
Aliens vs. Predator (Demo, DX11)
VeryHigh, 1680x1050, AF 16x, AA 2x 53,9 62,3 42,4 48,7 74,7
VeryHigh, 1920x1080, AF 16x, AA 2x 48,3 34 39,2 43,5 61,7
VeryHigh, 1680x1050, AF 16x, AA 4x 46,9 55,7 38 39,4 66,8
VeryHigh, 1920x1080, AF 16x, AA 4x 42,1 47,4 35,1 35,2 55,1
Соотношение производительности 100% 104% 81% 87% 135%
Lost Planet 2 (DX11, Test A, SC2)
High, 1680x1050, AF 16x, AA 8x 41,2 71,5 47,5 32,7 47,5
High, 1680x1050, AF 16x, AA 16x 40,1 75,5 48,2 34,3 49,7
Соотношение производительности 100% 180% 118% 82% 120%
Соотношение цены 100% 131% 93% 79% 131%
Соотношение производительности 100% 134% 96% 90% 124%