Чудесная тройка. Изучаем процессорную архитектуру AMD Trinity


Компания AMD, похоже, окончательно решила, что соревноваться напрямую с Intel — штука бесполезная и пора завлекать покупателей альтернативными способами. Один из них — популяризация гибридных процессоров, совмещающих обычные x86-ядра и видеокарту. Учитывая, что AMD давно уже выпускает и то и другое, тема более чем благодатная. Пробный шар был запущен около года назад с архитектурой APU Llano, объединившей кристаллы Phenom и Radeon HD 6800. Сегодня на сцену выходит APU Trinity, предлагающая усовершенствованную версию Bulldozer и Radeon HD 6900.
Быстрее и выше
Новая x86-архитектура получила название Piledriver и является прямым развитием идей Bulldozer (именно на ней год назад вышли первые восьмиядерные ЦП от AMD). Техпроцесс остался прежним — 32 нм. На месте и высокие частоты, минимум — 3,4 ГГц, а под напором автоматических оверклокеров и все 4,2 ГГц. Заметим, что автономному разгону уделили особое внимание. Если Llano на законные стероиды переходили неохотно («Турбо» был откровенно слабым и доступен избранным моделям), то отныне с помощью AMD TurboCore 3.0 Technology камень вправе сам выбирать оптимальный режим и варьировать производительность как CPU-, так и GPU-модулей. Спасибо за это надо сказать изменившемуся алгоритму, который учитывает не только температурные показатели, но еще и тип нагрузки, а также уровень занятости отдельных элементов кристалла.
Не обидели в AMD и любителей ручных настроек: в теории Trinity должны подниматься до 6,5 ГГц. Для облегчения процесса даже появилась специальная утилита OverDrive , открывающая доступ к параметрам обоих блоков APU и контроллера памяти.
Семейство копателей
Структурно Piledriver не отличается от Bulldozer. На каждый модуль процессора (ввод/вывод, кэш-память, планировщик) приходится по два вычислительных отдела. Чем-то такая схема похожа на Hyper-Threading от Intel, но в железном исполнении. По сравнению с первыми Bulldozer в Piledriver основательно потрудились над производительностью блока предсказаний и планировщика, увеличили размер L1 TLB, а также переписали алгоритмы выборки данных из кэш-памяти второго уровня. А вот L3-кэша кристаллы лишились — его, как и в Llano, просто вырезали.
Свои изменения получил северный мост. Так, контроллер памяти подтянули до современных стандартов и научили дружить с планками DDR3-1866 и DDR3-2400 МГц (под разгоном). Плюс при распределении ресурсов предпочтение теперь отдается x86-ядрам, которые, по заверению AMD, куда меньше нагружают шину, нежели встроенное «видео». Последнее, кстати, перевели на фирменный интерфейс Radeon Memory Bus шириной 256 бит. С чипсетом же APU отныне общается не по привычному HyperTransport, а по PCIe. По словам AMD, если сложить все это вместе, то получится примерно на 25% быстрее Bulldozer. Впрочем, цифры эти, скорее всего, достигнуты в искусственных условиях — в реальных тестах мы их вряд ли увидим. Зато что в Trinity действительно сильно преобразилось — так это интегрированная графика.
Опустошитель
Как и в Llano, GPU отъедает половину площади, но использует ее гораздо эффективнее. Если прошлые APU были построены на архитектуре VLIW5 с пятью ядрами на каждый блок, то теперь в основе лежит VLIW4 с отрезанной частью специальных вычислений. Эта конструкция была представлена AMD два года назад в Radeon HD 6900 и позволила при тех же производственных нормах поднять производительность линейки видеокарт. Сразу отметим, что с Graphics Core Next (Radeon HD 7000) у VLIW4 ничего общего, так что объединить усилия интегрированной и дискретной плат не удастся.

Называются встроенные ядра Devastator («Опустошитель») и выпускаются в нескольких версиях. В максимальной стоит шесть SIMD-движков, оснащенных четырьмя текстурниками и шестнадцатью потоковыми процессорами с четырьмя вычислительными модулями. В итоге Devastator может насчитывать до 384 ALU вместо 400 штук у прошлогоднего Sumo. На потерю 16 элементов обращать внимание не надо: логика работы иная, и в лоб сравнивать чипы неправильно. Куда важнее — частота. У взрослого Devastator HD 7660D она достигает 800 МГц, на 80 МГц ниже, чем у HD 6970, и на 200 МГц выше, чем у Sumo HD 6550D.
В списке поддерживаемых технологий Devastator значится весь сегодняшний стандарт: DirectX 11.1, Shader Model 5.0, OpenGL 4.2 и OpenCL 1.1. Дополнительно владелец AMD Trinity получает пакет AMD HD Media Accelerator. Он включает в себя операции по аппаратному декодированию фильмов, чего очень не хватало Llano.
Новое поколение APU несет на борту сразу четыре контроллера дисплеев, что вдвое больше, чем у предшественника. Иными словами, к системе можно подключить до четырех мониторов по интерфейсам VGA, DVI, HDMI и DisplayPort 1.2. Единственное «но»: для четвертого экрана понадобится разветвитель. Не обошелся Devastator и без AMD Eyefinity, позволяющей растягивать игры до невероятных разрешений.
Модельный ряд:
На момент написания этой статьи в рамках линейки Trinity было представлено шесть моделей процессоров. Маркировка досталась от Llano: A4 , A6 , A8 и A10. Первая пара получила всего по два x86-ядра и 1 МБ L2-кэша. Вторая обзавелась четырьмя модулями и 4 МБ кэш-памяти. Есть отличия и во встроенной графике (см. таблицу), а также возможностях разгона. Разблокированный множитель получают лишь версии с суффиксом «K» в конце названия. Официальные цены на Trinity варьируются в пределах от 1600 до 4200 рублей.
Логика Троицы
Отличить Trinity от Llano можно и без углубления в «нанометрические» детали. «Новому процессору — новый сокет». Этот девиз в американской компании явно подсмотрели у Intel и, похоже, твердо решили ему следовать. Материнки с Socket FM1 для Trinity не подойдут, надо покупать свежие модели с Socket FM2 , внешне отличающимся отсутствием одной ножки: 904 против 905 штук. Глубокий смысл замены разработчики не раскрывают, отделываясь общими фразами типа «слишком много изменений, со старыми технологиями не совместимо».
Странность ситуации подчеркивают и представленные наборы логики. Новый чипсет один — A85X. Еще два, помладше, достались в наследство от Llano: на A55 и A75 ставят другой сокет и пускают в продажу. Не особо изменилось и позиционирование. A55 — выбор для бюджетных систем. Есть всего шесть портов SATA 2, 14 USB 2.0 и поддержка RAID нулевого, первого и десятого уровней. У A75 интерфейсы SATA уже третьего поколения, а четыре порта USB идут в версии 3.0. Новинке — A85X — добавили еще два SATA Rev. 3, возможность строить RAID-массивы пятого уровня, а также устанавливать связку из нескольких видеокарт в режиме CrossFireX.
Чисто теоретически новые APU от AMD выглядят очень интересно. Компания исправила многие недостатки прошлой линейки — избавилась от древней архитектуры K10, установив свежую Piledriver, а также оптимизировала использование площади, переведя графическое ядро на компактную схему VLIW4. На словах все это звучит очень здорово, однако поспешных выводов делать не будем: на следующей странице вас ждет подробный тест топового A10-5800K , а также обзор материнской платы на основе чипсета A85X.
Таблица 1
Модельный ряд AMD Trinity
Количество ядер
A4-5300
2 шт.
A6-5400K
2 шт.
A8-5500
4 шт.
A8-5600K
4 шт.
A10-5700
4 шт.
A10-5800K
4 шт.
Частота CPU
A4-5300
3,4-3,6 ГГц
A6-5400K
3,6-3,8 ГГц
A8-5500
3,2-3,7 ГГц
A8-5600K
3,6-3,9 ГГц
A10-5700
3,4-4,0 ГГц
A10-5800K
3,8-4,2 ГГц
L2-кэш
A4-5300
1 МБ
A6-5400K
1 МБ
A8-5500
4 МБ
A8-5600K
4 МБ
A10-5700
4 МБ
A10-5800K
4 МБ
TDP
A4-5300
65 Вт
A6-5400K
65 Вт
A8-5500
65 Вт
A8-5600K
100 Вт
A10-5700
65 Вт
A10-5800K
100 Вт
GPU
A4-5300
HD 7480D
A6-5400K
HD 7540D
A8-5500
HD 7560D
A8-5600K
HD 7560D
A10-5700
HD 7660D
A10-5800K
HD 7660D
Число ALU
A4-5300
128
A6-5400K
192
A8-5500
256
A8-5600K
256
A10-5700
384
A10-5800K
384
Частота GPU
A4-5300
724 МГц
A6-5400K
760 МГц
A8-5500
760 МГц
A8-5600K
760 МГц
A10-5700
760 МГц
A10-5800K
800 МГц
Цена на ноябрь 2012 года
A4-5300
1600 рублей
A6-5400K
2200 рублей
A8-5500
3400 рублей
A8-5600K
3400 рублей
A10-5700
4000 рублей
A10-5800K
4200 рублей