Видеокарты. Asus AMD Radeon HD7970 - "темный рыцарь" игрового мира Изменения в качестве рендеринга

11.02.2021 Игры

График температурных режимов видеокарт

Даже если бы новинка показала не самые лучшие «температуры», после столь высоких результатов производительности мы бы смогли ей это простить. Но в нашем великодушии нет необходимости. Radeon HD 7970 греется меньше, нежели предшественник (Radeon HD 6970) при гораздо более высокой производительности. При этом, как я говорил выше, если не изменять скорость вращения вентилятора самостоятельно, то, чтобы услышать карту придется очень постараться. Думаю, при закрытом корпусе это и вовсе невозможно.

При разгоне температуры ниже, чем на стандартных настройках, из-за того самого ручного увеличения оборотов для стабильности.

Кстати, у нас есть еще несколько тестов этой же видеокарты с альтернативной СО и на другой системе. Вы можете ознакомиться с результатами, чтобы понять, как современные процессоры влияют на производительность в популярных приложениях. Стоит отметить, что стоковая система охлаждения на видеокарте производства ASUS проиграла всего один градус в номинале двухвентиляторной системе от XFX , это хороший результат.

Заключение

Разгон видеокарты ASUS HD 7970 приятно удивил. Графический процессор разогнался с дефолтных 925 МГц до 1200 без увеличения напряжения. Этим и обусловлен столь высокий прирост производительности при разгоне. Если честно, то это очень приятный момент. В последнее время видеокарты разгоняются все хуже, поэтому надобность в оверклокинге пропадает: если видеокарта не вытягивает игру в дефолте, то бедный разгон на 50 МГц ситуацию не исправит. Здесь явно другой случай.

Единственное, что смущает в новинке, это непомерный уровень шума при ручном увеличении оборотов. А оно необходимо для успешного разгона, иначе вы имеете все шансы спалить видеокарту. Но, я думаю, со временем эта проблема будет решена - появится множество альтернативных систем охлаждения. Главное, чтобы разгонный потенциал не изменился в худшую сторону.

Высокая производительность, низкое тепловыделение, а также новые фирменные технологии делают видеокарту AMD Radeon HD 7970 лучшим однопроцессорным видеоадаптером на сегодняшний день. Более того, при разгоне новинка легко тягается с двухпроцессорным монстром Radeon HD 6990. Поэтому если у вас возник вопрос: «что лучше: HD 7970 или HD 6990?», то я рекомендую выбрать первый вариант. С ним у вас не будет проблем при активации CrossFireX, не будет внезапных просадок производительности, как это бывает с двухголовыми картами. Три гигабайта видеопамяти - приятный бонус к покупке. К сожалению, использоваться они будут крайней степени редко, но лучше с ними, чем без них.

В общем, видеокарта ASUS HD 7970 удалась на славу, и оставляет очень приятные впечатления. Будем надеяться, что продолжение новой линейки, которое выйдет уже совсем скоро, порадует нас не меньше.

Выход новой AMD Radeon HD 7970 GHz Edition не стал неожиданностью ни для кого, ведь с самого анонса Radeon HD 7970 (и даже до него) и знакомства с великолепным оверклокерским потенциалом графического процессора «Tahiti» циркулировали слухи о возможности выпуска ещё более быстрой видеокарты. Так оно, собственно, и произошло, пусть и не сразу после появления главного конкурента – NVIDIA GeForce GTX 680. По всей видимости, трёхмесячная задержка появления форсированной Radeon HD 7970 вызвана не только отладкой нового 28-нм техпроцесса, но и стремлением AMD одновременно с этим снизить цены на новую линейку своих видеокарт. Теперь новая Radeon HD 7970 GHz Edition стоит 499 долларов США, что на 50 долларов США дешевле анонсированной более полугода назад Radeon HD 7970, которая сейчас рекомендуется в продажу за 429 долларов США:

Давайте изучим новинку, её особенности, и ответим на вопрос, смогла ли с выходом Radeon HD 7970 GHz Edition компания AMD стать единоличным лидером среди однопроцессорных видеокарт?

Технические характеристики

Технические характеристики AMD Radeon HD 7970 GHz Edition приведены в таблице в сравнении с характеристиками эталонных видеокарт AMD Radeon HD 7970 и NVIDIA GeForce GTX 680:

Конструктивные особенности

Внешне в сравнении с AMD Radeon HD 7970 новая эталонная Radeon HD 7970 GHz Edition совершенно не отличима:




Естественно, в плане размеров видеокарты никаких изменений не произошло – её длина составляет 278 мм, высота и толщина – 100 и 38 мм, соответственно.

В плане выходов также нет никаких изменений, видеокарта оснащена одним DVI-I с поддержкой высоких разрешений (Dual Link), одним HDMI версии 1.4а и двумя DisplayPort версии 1.2:


С учётом такой тенденции, нужно ли говорить, что в плане разъёмов питания, MIO и двойного BIOS также ничего не изменилось: Radeon HD 7970 GHz Edition оснащена восьми- и шестиконтактными разъёмами для подключения дополнительного питания, двумя разъёмами MIO для создания CrossFireX-связок и маленьким переключателем выбора BIOS:


Несмотря на повышенные частоты, энергопотребление новой видеокарты заявлено на прежнем уровне: в 3D-режиме это пиковые 250 Вт, а в 2D Radeon HD 7970 GHz Edition потребление может снижаться вплоть до 3 Вт (при выключении монитора). Напомним и про отключение всех остальных видеокарт, кроме первой, в режиме CrossFireX при выходе из 3D-режима. Эта безусловно полезная особенность новых Radeon HD 79xx никуда не исчезла.

По внешнему виду печатной платы и расположению элементов никаких изменений в сравнении с обычной Radeon HD 7970 нами не выявлено:


Как и на эталонном Radeon HD 7970, форсированная версия видеокарты оснащена схемой питания «5+1», где пять фаз приходятся на графический процессор и одна – на цепи питания видеопамяти:


За управление ими по-прежнему отвечает контроллер CHiL Semiconductor CHL8228G, установленный в задней части лицевой стороны PCB:


28-нм графический процессор нашего экземпляра видеокарты AMD Radeon HD 7970 GHz Edition выглядит следующим образом:


Как вы уже могли видеть по таблице характеристик, никаких функциональных изменений у него нет: 2048 унифицированных шейдерных процессора, 32 блока растеризации и 128 текстурных блоков. Единственное, что AMD сделала – это повысила его частоту с прежних 925 МГц до 1000 МГц, а также ввела новый так называемый boost-режим, в котором частота графического процессора при высокой нагрузке может повышаться вплоть до 1050 МГц. Таким образом, можно сказать, что частота GPU AMD Radeon HD 7970 GHz Edition на 13,5% выше частоты обычной Radeon HD 7970. По данным мониторинга, напряжение графического процессора в 3D-режиме равно 1,256 В, а в 2D, когда частота снижается до 300 МГц, напряжение опускается до 0,949 В.

ASIC-качество кристалла GPU оказалось очень низким – всего 56,3%:


Как и у обычной Radeon HD 7970, три гигабайта видеопамяти стандарта GDDR5 расположены в 12 микросхемах FCFBGA-микросхемах на лицевой стороне печатной платы. Чипы выпущены компанией Hynix Semiconductor Inc. и имеют маркировку H5GQ2H24AFR R0C :


Теоретическая эффективная частота таких микросхем в 3D-режиме составляет 6000 МГц, на которых память AMD Radeon HD 7970 GHz Edition и функционирует, в отличие от 5500 МГц на Radeon HD 7970 (+9,1%). При ширине шины обмена с памятью видеокарты равной 384 бит пропускная способность памяти достигает рекордных 288 Гбайт/сек. В 2D-режиме частота снижается до 600 эффективных мегагерц.

Больше никаких изменений у эталонной AMD Radeon HD 7970 GHz Edition нет:


Считанный с помощью утилиты GPU-Z и сохранённый BIOS вы можете скачать из файлового архива.

Система охлаждения и её эффективность

Как вы уже поняли, все отличия AMD Radeon HD 7970 GHz Edition от обычной Radeon HD 7970 можно сосчитать по двум пальцам одной руки, так как они не коснулись и системы охлаждения видеокарты, которая состоит из радиатора с медной испарительной камерой в основании, медной основы, турбины и пластикового кожуха:


Ни единого изменения мы не выявили и при разборе этого кулера и снятии его радиального вентилятора:




По данным мониторинга скорость вращения этой турбины может изменяться в диапазоне от 1050 до 5400 об/мин, а максимальное энергопотребление не должно превышать 20 ватт.

Для проверки температурного режима работы видеокарты в качестве нагрузки мы использовали пять циклов теста весьма ресурсоёмкой игры Aliens vs. Predator (2010) при максимальном качестве графики в разрешении 2560х1440 пикселей с анизотропной фильтрацией уровня 16х и с использованием MSAA-сглаживания степени 4x:



Для мониторинга температур и прочих параметров применялись программа MSI Afterburner версии 2.2.2 и утилита GPU-Z версии 0.6.3 . Все тесты проводились в закрытом корпусе системного блока, конфигурацию которого вы сможете увидеть в следующем разделе статьи, при комнатной температуре 25 градусов Цельсия. Тестирование эффективности системы охлаждения видеокарты было проведено до её разборки с использованием штатного термоинтерфейса.

Посмотрим, справится ли кулер эталонной AMD Radeon HD 7970 GHz Edition с её повышенными частотами:


Автоматический режимМаксимальная мощность


Да справился он, конечно, только вот температурный режим работы видеокарты при автоматической регулировке скорости вращения вентилятора оставляет желать лучшего, ведь графический процессор прогрелся почти до 90 градусов Цельсия, а радиальный вентилятор разогнался до 3200 об/мин, что очень шумно. На максимальных 5400 об/мин находиться в одной комнате с такой ревущей видеокартой весьма сложно, зато столь высокие обороты позволяют отыграть сразу 18 градусов Цельсия по температуре графического процессора в пике нагрузки на него.

Оверклокерский потенциал

Может быть, из-за низкокачественного GPU, а может быть просто из-за невезения, но оверклокерский потенциал предоставленного нам на тестирование образца AMD Radeon HD 7970 GHz Edition оказался средним. Без повышения напряжения на ядре его удалось разогнать только до 1180 МГц:


Память также поскромничала с разгоном остановившись лишь на 6680 МГц. В результате частоты нашего экземпляра видеокарты составили 1180 МГц (+12,4%) по графическому процессору и 6680 МГц (+11,3%) по видеопамяти:


Ладно хоть температурный режим работы разогнанной видеокарты при автоматической регулировке скорости вращения вентилятора практически не изменился:


Немного расстроившись, мы решили выжать «все соки» и, вставив беруши и выставив скорость вентилятора на максимум, проверили потенциал графического процессора при повышенном до 1,3 В напряжении. Итог – 1250 МГц, что не так уж и плохо:




Температурный режим разогнанной с повышением напряжения видеокарты оказался следующим:


Пиковая температура графического процессора достигла 77 градусов Цельсия (напомним – при максимальных 5400 об/мин турбины). Надеемся, что серийные видеокарты «GHz Edition» с оригинальными и высокоэффективными кулерами смогут порадовать нас не только более низкими температурами, но и умеренным уровнем шума.

Энергопотребление

Измерение энергопотребления системы с различными видеокартами осуществлялось с помощью многофункциональной панели Zalman ZM-MFC3 , которая показывает потребление системы «от розетки» в целом (без учёта монитора). Измерение было проведено в 2D-режиме, при обычной работе в Microsoft Word или интернет-«сёрфинге», а также в 3D-режиме, нагрузка в котором создавалась с помощью трёхкратного теста из игры Metro 2033: The Last Refuge в разрешении 2560х1440 при максимальных настройках качества графики.

Давайте посмотрим на результаты:



Очевидно, что для нашей тестовой системы с разогнанным шестиядерным процессором и любой из тестируемых сегодня видеокарт будет достаточно качественного блока питания мощностью 550 ватт. Что касается новой AMD Radeon HD 7970 GHz Edition, то на номинальных частотах система с ней потребляет на 20 ватт больше электроэнергии, чем система с обычной Radeon HD 7970, и примерно на 80 ватт больше системы с не разогнанной GeForce GTX 680. Отметим, что при разгоне видеокарт энергопотребление систем в пике нагрузки возрастает несущественно, даже при повышении напряжения на графических процессорах. В режиме бездействия показатели потребления электроэнергии практически одинаковы.

Тестовая конфигурация, инструментарий и методика тестирования

Тестирование видеокарт было проведено на системе следующей конфигурации:

Системная плата: Intel Siler DX79SI (Intel X79 Express, LGA 2011, BIOS 0525 от 09.07.2012);
Центральный процессор: Intel Core i7-3960X Extreme Edition 3,3 ГГц (Sandy Bridge-E, C1, 1,2 В, 6x256 Kбайт L2, 15 Мбайт L3);
Система охлаждения CPU: Phanteks PH-TC14PЕ (2x135 мм, 900 об/мин);
Термоинтерфейс: ARCTIC MX-4 ;
Оперативная память: DDR3 4x4 Гбайт Mushkin Redline (2133 МГц, 9-10-10-28, 1,65 В);
Видеокарты:

AMD Radeon HD 7970 GHz Edition 3 Гбайт 384 бит GDDR5, 1050/6000 и 1250/6680 МГц при 1,3 В;
Sapphire Radeon HD 7970 OC Dual-X 3 Гбайт 384 бит GDDR5, 925/5500 МГц;
ASUS GeForce GTX 680 DirectCU II TOP 2 Гбайт 256 бит GDDR5, 1006/6008, 1137/6008 и 1217/7168 МГц;

Системный диск: SSD 256 Гбайт Crucial m4 (SATA-III, CT256M4SSD2, BIOS v0009);
Диск для программ и игр: Western Digital VelociRaptor (SATA-II, 300 Гбайт, 10000 об/мин, 16 Мбайт, NCQ) в коробке Scythe Quiet Drive 3,5";
Архивный диск: Samsung Ecogreen F4 HD204UI (SATA-II, 2 Тбайт, 5400 об/мин, 32 Мбайт, NCQ);
Корпус: Antec Twelve Hundred (передняя стенка – три Noiseblocker NB-Multiframe S-Series MF12-S2 на 1020 об/мин; задняя – два Noiseblocker NB-BlackSilentPRO PL-1 на 1020 об/мин; верхняя – штатный 200-мм вентилятор на 400 об/мин);
Панель управления и мониторинга: Zalman ZM-MFC3 ;
Блок питания: Xigmatek «No Rules Power» NRP-HC1501 (1500 Вт), 140-мм вентилятор;
Монитор: 27" Samsung S27A850D (DVI-I, 2560х1440, 60 Гц).

Для сравнения с AMD Radeon HD 7970 GHz Edition мы включили в тесты видеокарту Sapphire Radeon HD 7970 OC Dual-X 3 Гбайт :


Так как оба её BIOS имеют повышенные частоты, то мы вручную снизили частоту графического процессора и памяти видеокарты до номинальных для Radeon HD 7970 –925/5500 МГц, хотя GPU-Z нам упорно демонстрировала слегка повышенные частоты:


Со стороны NVIDIA мы включили в тестирование лучшую GeForce GTX 680, из побывавших в нашей Лаборатории. Это видеокарта ASUS GeForce GTX 680 DirectCU II TOP 2 Гбайт :


Её производительность была проверена на номинальных для ASUS частотах – 1137/6008 МГц, номинальных для эталонной NVIDIA GeForce GTX 680 частотах – 1006/6008 МГц, и при максимально возможном для этого экземпляра видеокарты разгоне 1217/7168 МГц:


Для снижения зависимости производительности видеокарт от скорости платформы, 32-нм шестиядерный процессор при множителе 37, опорной частоте 125 МГц и активированной функции «Load-Line Calibration» был разогнан до 4,625 ГГц при повышении напряжения в BIOS материнской платы до 1,47 В:



Технология «Hyper-Threading» активирована. При этом 16 Гбайт оперативной памяти функционировали на частоте 2 ГГц с таймингами 9-10-10-28 при напряжении 1,65 В.

Тестирование, начатое 30 июля 2012 года, было проведено под управлением операционной системы Microsoft Windows 7 Ultimate x64 SP1 со всеми критическими обновлениями на указанную дату и с установкой следующих драйверов:

чипсет материнской платы Intel Chipset Drivers – 9.3.0.1020 WHQL от 26.01.2012 ;
библиотеки DirectX End-User Runtimes, дата выпуска – 30 ноября 2010 года ;
драйверы видеокарт на графических процессорах AMD – Catalyst 12.x (8.982.0.0 RC1) от 19.07.2012 + Catalyst Application Profiles 12.7 (CAP1);
драйверы видеокарт на графических процессорах NVIDIA – GeForce 304.79 beta от 03.07.2012 .

Производительность видеокарт была проверена в двух разрешениях: 1920х1080 и 2560х1440 пикселей. Для тестов были использованы два режима качества графики: «Quality + AF16x» – качество текстур в драйверах по-умолчанию с включением анизотропной фильтрации уровня 16х, и «Quality + AF16x + MSAA 4х(8х)» с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания степени 4x или 8x, в случаях, когда среднее число кадров в секунду оставалось достаточно высоким для комфортной игры. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. Если данные настройки в играх отсутствовали, то параметры изменялись в панелях управления драйверов Catalyst и GeForce. Там же была отключена вертикальная синхронизация. Больше никаких изменений в настройки драйверов не вносились.

Cписок тестовых приложений состоит из двух полусинтетических пакетов, одного техно-демо и 13 игр, обновлённых до последних версий (на дату начала тестов):

3DMark Vantage (DirectX 10) – версия 1.0.2.1, профили настроек «Performance» и «Extreme» (тестировались только основные тесты);
3DMark 2011 (DirectX 11) – версия 1.0.3.0, профили настроек «Performance» и «Extreme»;
Unigine Heaven Demo (DirectX 11) – версия 3.0, максимальные настройки качества, тесселляция на уровне «extreme», AF16x, разрешение 1280х1024 без MSAA и 1920х1080 с MSAA 8x;
(DirectX 11) – версия 1.6.02, профиль настроек «Улучшенное динамическое освещение DX11» с дополнительным выставлением вручную всех параметров на максимум, тестировалась собственная демо-запись «cop03» на уровне «Затон»;
Metro 2033: The Last Refuge (DirectX 10/11) – версия 1.2, использовался официальный тест, настройки качества «Very High», тесселляция, DOF включено, использовалось ААА-сглаживание, двойной последовательный проход сцены «Frontline»;
Just Cause 2 (DirectX DX10.1) – версия 1.0.0.2, максимальные настройки качества, методики «Размытие фона» и Симуляция воды GPU» деактивированы, двойной последовательный проход демо-записи «Тёмная башня»;
Aliens vs. Predator (2010) (DirectX 11) – «Texture Quality» в режиме «Very High», «Shadow Quality» в режиме «High», технология SSAO включена, два цикла теста в каждом разрешении;
Lost Planet 2 (DirectX 11) – версия игры 1.0, максимальные настройки качества графики, размытие движения включено, использовался тест производительности «В»;
Sid Meier"s Civilization V (DirectX 11) – версия игры 1.0.1.348, максимальные настройки качества графики, двойной прогон «дипломатического» теста из пяти самых тяжёлых сцен;
Total War: Shogun 2 (DirectX 11) – версия 2.0, встроенный тест (битва при Sekigahara) на максимальных настройках качества графики и использовании в одном из режимов MSAA 4x;
Crysis 2 (DirectX 11) – версия 1.9, использовался Adrenaline Crysis 2 Benchmark Tool v1.0.1.14 BETA , профиль настроек качества графики «Ultra High», текстуры высокого разрешения активированы, двукратный цикл демо-записи на сцене «Times Square»;
Hard Reset Demo (DirectX 9) – встроенный в демо-версию тест при Ultra-качестве графики, один проход тестовой сцены;
Batman: Arkham City (DirectX 11) – версия 1.2, максимальные настройки качества графики, физика отключена, двойной последовательный проход встроенного в игру теста;
Battlefield 3 (DirectX 11) – версия 1.4, все настройки качества графики на «Ultra», двойной последовательный проход заскриптованной сцены из начала миссии «На охоту» продолжительностью 110 секунд;
DiRT Showdown (DirectX 11) – версия 1.0, встроенный тест на трассе «Nevada» при максимальных настройках качества графики («Ultra» preset);
Sniper Elite V2 Benchmark (DirectX 11) – версия 1.05, использовался Adrenaline Sniper Elite V2 Benchmark Tool v1.0.0.2 BETA максимальные настройки качества графики («Ultra»), Advanced Shadows: HIGH, Ambient Occlusion: ON, Stereo 3D: OFF, двойной последовательный прогон теста;

Более подробное описание методик тестирования видеокарт и графических настроек в некоторых из перечисленных играх вы можете найти в специально для этого созданной ветке нашей конференции , а также поучаствовать в обсуждении и совершенствовании этих методик.

Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1%. Если отклонения прогонов тестов превышали 1%, то тестирование повторялось ещё, как минимум, один раз, чтобы получить достоверный результат.

Результаты тестов производительности и их анализ

3DMark Vantage



Первый полусинтетический тест 3DMark Vantage продемонстрировал нам довольно интересную картину. Если в режиме без использования сглаживания новая AMD Radeon HD 7970 GHz Edition по-прежнему заметно проигрывает GeForce GTX 680, то в более ресурсоёмком режиме настроек «Extreme» разница сокращается до минимума. При разгоне обеих видеокарт картина не меняется, NVIDIA здесь немного быстрее AMD. В целом Radeon HD 7970 GHz Edition на 6,5-10,6% превзошла свою предшественницу.

3DMark 2011



В 3DMark 2011 расстановка сил не изменилась, но лидерство GeForce GTX 680 здесь более уверенное. AMD Radeon HD 7970 GHz Edition опережает обычную HD 7970 примерно на 9%.

Unigine Heaven Demo



Картина повторяется: в «лёгком» графическом режиме GeForce GTX 680 демонстрирует более высокую скорость, чем обе вариации Radeon HD 7970, а в разрешении 1920х1080 и при активации сглаживания производительность видеокарт практически равна. Новая Radeon HD 7970 GHz Edition опережает обычную HD 7970 на 10,5-12%.

S.T.A.L.K.E.R.: Call of Pripyat


Как видим по результатам обычной Radeon HD 7970, в S.T.A.L.K.E.R.: Call of Pripyat топовые видеокарты AMD и ранее не проигрывали, а с выходом Radeon HD 7970 GHz Edition стали опережать конкурента в лице GeForce GTX 680 на 7,5-11%. Справедливости ради, отметим, что при разгоне двух этих видеокарт их производительность практически равна, в том числе и в режимах с использованием сглаживания.

Metro 2033: The Last Refuge


В Metro 2033: The Last Refuge простая Radeon HD 7970 уже была чуточку быстрее GeForce GTX 680, а новая GHz Edition смогла увеличить этот отрыв, так как за счёт более высоких частот опережает обычную HD 7970 на 4-6%. Правда, комфортно играть в Metro 2033 на этих видеокартах можно только в разрешении 1920х1080 пикселей и ниже.

Just Cause 2


Just Cause 2 продемонстрировала нам с вами необходимость разгона Radeon HD 7970 и превращения её в GHz Edition для конкуренции с GeForce GTX 680. Если прежний флагман AMD отставал от прямого конкурента, то форсированная версия идёт уже вровень с ним в этой игре.

Aliens vs. Predator (2010)


В игре Aliens vs. Predator (2010) Radeon HD 7970 и прежде выглядела предпочтительнее, чем GeForce GTX 680, а с выходом GHz Edition версии этой видеокарты смогла нарастить своё преимущество вплоть до 44% в наиболее ресурсоёмком режиме.

Lost Planet 2

А вот в Lost Planet 2 повышенные частоты AMD Radeon HD 7970 GHz Edition не помогают ей в борьбе с GeForce GTX 680:


Разрыв сокращается, но не более того. Лидируют в этой игре по-прежнему видеокарты на графических процессорах NVIDIA.

Sid Meier"s Civilization V


У поклонников серии игр Sid Meier"s Civilization V выбор, в общем-то, один – видеокарты на графических процессорах AMD, которые опережают конкурента на величину вплоть до 67%.

Total War: Shogun 2

Вплоть до последнего обновления игры Total War: Shogun 2, устанавливаемого системой Steam автоматически, видеокарты NVIDIA могли успешно конкурировать с видеокартами AMD, но теперь ситуация серьёзно изменилась:


Так уже было пару-тройку месяцев назад, и NVIDIA смогла исправить ситуацию в этой игре, выпустив новую версию драйверов. Будет ли так на этот раз – время покажет, а пока GeForce GTX 680 здесь лишь в роли догоняющей.

Crysis 2


Если ранее Radeon HD 7970 и GeForce GTX 680 были примерно равны в Crysis 2, то с выходом Radeon HD 7970 GHz Edition чаша весов склонилась в пользу AMD. Пусть и с небольшим преимуществом, но новинка лидирует в этом тесте. При максимальном разгоне обеих видеокарт их производительность не отличается.

Hard Reset Demo


Здесь новая AMD Radeon HD 7970 GHz Edition опережает обычную Radeon HD 7970 на величину вплоть до 16% и за счёт этого проигрыш GeForce GTX 680 сменяется победой над ней. Впрочем, последняя при разгоне получает более высокую отдачу в Hard Reset, чем Radeon HD 7970 GHz Edition, и легко возвращает себе лидерство.

Batman: Arkham City


C переменным успехом выступает AMD Radeon HD 7970 GHz Edition в игре Batman: Arkham City: если в режимах без сглаживания GeForce GTX 680 весьма быстра, то при включении MSAA 8x пальма первенства переходит к новой видеокарте AMD, которая опережает обычную Radeon HD 7970 на 7-9%.

Battlefield 3


Уместными оказались повышенные частоты новой Radeon и в игре Battlefield 3: там, где ранее GeForce GTX 680 лидировала, теперь HD 7970 GHz Edition, как минимум, не уступает, а в режимах со сглаживанием даже чуть-чуть обходит конкурента.

DiRT Showdown


Ну, тут всё понятно и без комментариев, с движком DiRT Showdown архитектура NVIDIA работает менее эффективно, поэтому терпит в этой игре полное фиаско на фоне высоких результатов видеокарт AMD.

Sniper Elite V2 Benchmark


Похожим образом, но всё же не столь ярко, складывается ситуация и в новом тесте Sniper Elite V2. Преимущество AMD Radeon HD 7970 GHz Edition над GeForce GTX 680 достигает здесь впечатляющих 54%.

Традиционно, прикладываем к диаграммам и графикам итоговую , и переходим к сводным диаграммам.

Сводные диаграммы

Первая пара сводных диаграмм покажет нам с вами преимущество AMD Radeon HD 7970 GHz Edition с частотами 1050/6000 МГц над обычной Radeon HD 7970 с частотами 925/5500 МГц:



В среднем по всем тестам увеличение частоты графического процессора на 13,5% и видеопамяти на 9,1% принесли Radeon HD 7970 прирост производительности 9,3-9,6% в разрешении 1920х1080 пикселей и 9,9-10% в разрешении 2560х1440 пикселей. Максимальный прирост был достигнут в таких играх, как Aliens vs. Predator (2010) и Lost Planet 2, а минимальный в Metro 2033: The Last Refuge.

Теперь посмотрим на противостояние AMD Radeon HD 7970 GHz Edition 3 Гбайт и GeForce GTX 680 2 Гбайт на их номинальных частотах:



GeForce GTX 680 по-прежнему быстрее в полусинтетических тестах, игре Lost Planet 2, а также отдельных режимах Just Cause 2, Hard Reset, Batman: Arkham City и Battlefield 3. В остальных тестах преимущество на стороне новой AMD Radeon HD 7970 GHz Edition, причём в таких играх, как Aliens vs. Predator (2010), Sid Meier"s Civilization V, Total War: Shogun 2, DiRT Showdown и Sniper Elite V2 оно весьма приличное. Впрочем, не будем забывать, что сегодня многое зависит от конкретной игры и её движка, а не только от производительности самой видеокарты. К примеру, по собственному опыту скажу, что в ранее исключённых из нашего тестового списка StarCraft II: Wings of Liberty (из-за чрезмерной процессорозависимости) и Tom Clancy"s H.A.W.X. 2 (ввиду неактуальности) лидировала бы GeForce GTX 680. Так что всё относительно.

Напоследок сравним производительность разогнанных AMD Radeon HD 7970 GHz Edition на частотах 1250/6680 МГц и ASUS GeForce GTX 680 TOP на частотах 1217/7168 МГц:



Нельзя сказать, что ситуация изменилась кардинальным образом, тем не менее GeForce GTX 680 за счёт более высокого разгона (в процентном выражении) удалось сократить отставание от Radeon HD 7970 GHz Edition там, где она выигрывала, и нарастить там, где проигрывала.

Заключение

Сказать, что новая AMD Radeon HD 7970 GHz Edition теперь является самой быстрой однопроцессорной видеокартой было бы не совсем корректно, так как её тотального превосходства над эталонной NVIDIA GeForce GTX 680 мы не выявили. Тем не менее, повышенные частоты позволили этому графическому решению на 10% превзойти уровень производительности прежней Hi-End видеокарты AMD и в большинстве случаев всё же опередить конкурента из NVIDIA. Однако, на наш взгляд, выход AMD Radeon HD 7970 GHz Edition оказался несколько «смазанным», ведь сегодня свободно предлагается добрая дюжина заводских Radeon HD 7970 с повышенными частотами, а порой и с частотами выше уровня «GHz Edition». То есть своей производительностью новинка, в общем-то, никого не удивила и уж точно не впечатлила. Пожалуй, наибольшие надежды на неё возлагали любители разгона, ожидая нового степпинга ядра «Tahiti XT», его пониженного напряжения и, как следствие, высокого оверклокерского потенциала. В сегодняшней статье это, увы, не подтвердилось. Надеемся, серийные видеокарты будут в этом плане более привлекательными. Время покажет.

Первый графический адаптер с 28-нанометровым GPU. Комок высоких технологий, сплав запредельной производительности, образцовой функциональности и показательной экономичности. Или попросту говоря – самая быстрая в мире одночиповая видеокарта от AMD – Radeon HD 7970 .

Заждались мы уже от AMD чего-то неординарного, яркого и скоростного. Чуть больше года назад, когда была представлена линейка видеокарт Radeon HD 6900, у них не было шансов тягаться с GeForce GTX 580. Тогда компания осознанно отдала первенство в топ-сегменте, акцентируя внимание на том, что решения на чипах Cayman обладают лучшим, чем у конкурента, соотношением цена/производительность и более энергоэффективны. Но, как и любой серьезный игрок на рынке, компания может длительное время очень успешно предлагать достойные устройства по хорошей цене. Но где-то там, в глубине души… она, конечно же, хочет быть технологическим лидером в своем сегменте.

Radeon HD 7970 дает ей такую возможность. Новинка основана на чипе с принципиально новой архитектурой, который производится по наиболее прогрессивному 28-нанометровому техпроцессу. Гарантирует ли успех такое потенциально очень привлекательное сочетание?

Архитектура Graphics Core Next

Длительное время AMD для своих графических решений использовала архитектуру VLIW (Very Long Instruction Words), которая хорошо оптимизирована для работы с 3D, однако малоэффективна для универсальных вычислений. В подобных задачах довольно высокая теоретическая мощность GPU не давала ожидаемых результатов. Новая архитектура, получившая название Graphics Core Next, разрабатывалась в первую очередь для того, чтобы улучшить эффективность вычислений не связанных напрямую с 3D.

Строительными модулями GCN являются так называемые Compute Unit (CU), основу которых составляют векторные блоки, скалярный сопроцессор и независимый планировщик.

Такая модель организации более универсальна, легче поддается программированию, отладке и анализу. Но основным преимуществом GCN является хороший параллелизм вычислений в многозадачной среде и возможность динамического распределения нагрузки. По этой причине AMD делает акцент на том, что представленные решения с архитектурой GCN это нечто большее, чем просто мощные игровые видеокарты.

В максимальной конфигурации чип имеет 32 блока Compute Unit (суммарно 2048 потоковых процессора), шесть 64-битных контроллера памяти, и продвинутую систему двухуровневого кеширования. В новом ядре по-прежнему используется два блока обработки геометрии, которые были существенно модернизированы.

Функциональные нюансы

Помимо низкоуровневых архитектурных изменений, новинки AMD будут обладать целым набором различных нововведений, улучшающих их функциональность.

DirectX 11.1

Прежде всего, отметим поддержку DirectX 11.1, возможности которого будут реализованы в Windows 8. После выхода данной операционной системы от Microsoft, новая версия API сулит немало интересных возможностей. С предварительным перечнем функций DirectX 11.1 можно ознакомиться .

AMD ZeroCore Power

Функция PowerTune, появившаяся еще в адаптерах серии HD 6900, позволяет оптимальным образом задействовать ресурсы видеокарты, выжимая максимум производительности в рамках заданного теплового пакета. GPU с архитектурой GCN получили в свое распоряжение новый инструмент для оптимизации энергопотребления – AMD ZeroCore Power.

Данная функция, унаследованная от мобильной версии Radeon, позволяет переводить видеокарту в состояние глубокого сна, в котором ее энергопотребление не превышает 3 Вт, а вентилятор системы охлаждения останавливается. Это происходит в том случае, когда монитор переходит в режим stand-by (этот период изменяется в настройках ОС). Технология реализована на аппаратном уровне и не зависит от используемой операционной системы.

Подобный алгоритм работы акселератора настолько очевиден, что возникает лишь вопрос, почему же в железе он реализован только сейчас. Так или иначе, стремление AMD максимально улучшить экономичность своих решений можно только приветствовать.

Любопытно, что в режиме CrossFire все дополнительны адаптеры, не используемые в текущий момент, автоматически переводятся в состояние ZeroCore Power и не издают шума.

Video Codec Engine

Для декодирования видео используется блок, функционально идентичный UVD3, который реализован в чипах Cayman. Это наиболее функциональное решение на рынке, потому данный факт никаких нареканий не вызывает. В тоже время архитектура GCN предполагает наличие аппаратного блока Video Codec Engine, который предназначен для кодирования видео в формат H.264. Чтобы задействовать данную разработку, требуется соответствующее программное обеспечение, которое пока находится в процессе разработки.

В целом, возможность кодирования видео средствами GPU существует достаточно давно, однако ранее для этого задействовались потоковые процессоры. К тому же возможности по настройке, а также финальное качество картинки далеко не всегда устраивали требовательных пользователей. Ныне AMD обещает предоставить возможность гибкой настройки параметров, скорости, а также метода кодирования (возможен гибридный вариант с задействованием потоковых вычислителей).

Partially Resident Textures

Инновационная функция частично резидентных текстур (Partially Resident Textures) позволяет обрабатывать текстуры огромного размера (до 32 ТБ), используя локальную память адаптера, как своеобразный кеш-буфер. Блочный принцип работы с виртуальными текстурами и специальный алгоритм использования мип-уровней позволяет компенсировать задержки при подгрузке необходимых для рендеринга частей.

Данная функция может пригодиться в случаях, когда используется технология MegaTexture. Наглядный пример – игра Rage от id Software. В дальнейшем количество проектов, применяющих такой принцип визуализации, будет лишь увеличиваться.

Специально для перфекционистов улучшен алгоритм анизотропной фильтрации. Новый метод исключает случаи появления небольших артефактов в редких ситуациях, возникающих при обработке некоторых типов текстур. Функция активируется автоматически и не сказывается на общей производительности.

HDMI 1.4a (3ГГц)

Еще одним нововведением Radeon HD 7970 является скоростная версия HDMI 1.4a (3 ГГц) с поддержкой формата Frame Packing, позволяющая получить на подходящем экране стереокартинку не только для просмотра 3D-видео, но и игр в режиме 1080p с частотой обновления 60Гц для каждого глаза.

При этом максимальное разрешение при подключении по HDMI составляет 4096×3112. Таким образом, адаптер полностью готов к грядущей эре видео еще более высококачественных форматов Quad HD/4k.

Eyefinity 2.0

За последнее время несколько важных нововведений получила фирменная мультидисплейная технология Eyefinity. Вторая ревизия значительно увеличивает возможности создания конфигураций с несколькими мониторами. В частности теперь доступны режимы 5×1 с альбомной или портретной ориентациями экранов, а максимальное поддерживаемое разрешение увеличилось до 16384×16384.

Адаптеры с 28-нанометровыми чипами также получили технологию Discrete Digital Multi-Point Audio (DDMA), позволяющую выделить несколько независимых аудиопотоков для различных дисплеев, работающих в рамках Eyefinity.

С появлением Catalyst 11.12 стала возможной работа стереоскопической технологии HD3D на трех мониторах. В феврале ожидается выход драйверов 12.2, которые еще больше разнообразят возможности настройки конфигураций с несколькими дисплеями.

PCI Express 3.0

Видеокарты с GCN первыми получили поддержку PCI Express 3.0. Благодаря улучшенному алгоритму кодирования данных при передаче, пропускная способность шины нового поколения вдвое выше, чем у версии 2.0. В частность для режима х16 это 32 ГБ/c.

Напомним, что в случае с платформой Intel для полноценной работы данного скоростного интерфейса, соответствующую поддержку должны иметь центральный процессор, который собственно содержит контроллер PCI-E 3.0, материнская плата со специальными коммутирующими «вентилями», позволяющими получить необходимую скорость, и графический адаптер.

Что касается процессоров, то формально первыми CPU, которые получат поддержку PCI-E 3.0, должны стать предназначенные для платформы LGA1155 чипы Ivy Bridge, которые предположительно будут анонсированы в начале апреля. Однако в действительности, на рынке уже есть решения с контроллером шины нового стандарта. Речь о процессорах для LGA2011. Официально поддержка PCI-E 3.0 для них не заявлена, однако по факту, при наличии остальных требуемых компонентов экосистемы, шина работает именно в таком режиме.

Любопытно, что компания AMD в данном случае не торопится внедрять поддержку PCI Express 3.0 для своей настольной платформы. На текущий момент чипсеты для AM3+ и FM1 довольствуются шиной версии 2.0. Отчасти такой прагматичный подход оправдан. Возможностей текущей версии интерфейса вполне достаточно для нужд даже наиболее производительных видеокарт. Более того, в конфигурациях с несколькими адаптерами, когда слоты работают в режиме x8 (PCI-E 2.0) не наблюдается снижения производительности в игровых приложениях, соответственно пропускная способность шины не является узким местом платформы. С другой стороны, помимо сугубо маркетингового эффекта (и нужно признать, немалого) практическую пользу от PCI Express 3.0, возможно, удастся получить для GPGPU.

Серия процессоров Southern Islands

При формировании продуктовой линейки на основе решений с GCN, будут использоваться три типа графических чипов, принадлежащих семейству Southern Islands.

Tahiti – решение для максимально производительных адаптеров, которые должны будут удовлетворить запросы самых взыскательных энтузиастов. Для моделей линейки Radeon HD 7900 используется именно это ядро. Pitcairn – основа адаптеров, которые будут предлагаться для достаточно требовательных игроков. Данные GPU задействуются для видеокарт серии Radeon HD 7800. Cape Verde – чип для решений с хорошей энергоэффективностью и достаточной производительностью. Таковыми должны стать модели линейки Radeon HD 7700.

Приведем слайд, который поможет понять позиционирование будущих адаптеров серии Radeon HD 7000.

На начальном этапе 28-нанометровые чипы с архитектуру GCN будут использоваться лишь для видеокарт высокого и среднего уровней. В частности, для устройств серий Radeon HD 7900/7800/7700. Менее производительные видеокарты в линейке HD 7000 будут фактически идентичны тем, что сейчас включены в серии HD 6500/6600 и HD 6450/6350. Очевидно, что контрактный производитель кристаллов, компания TSMC, на текущий момент не в состоянии обеспечить AMD таким количеством чипов 28 нм, чтобы их можно было использовать и для бюджетных решений. В подобных условиях приоритет имеют более сложные, но и более прибыльные устройства.

Radeon HD 7970

Первой из семейства видеокарт с новой архитектурой была представлена Radeon HD 7970 . Давайте посмотрим на ее технические характеристики и сравним со старшей одночиповой моделью предыдущей линейки – Radeon HD 6970.

Графический адаптер основан на чипе Tahiti, который, как уже упоминалось, производится по 28-нанометровой технологии. Новый кристалл содержит 4,31 млрд. транзисторов, что на 63% больше, чем у предшественника, при этом его площадь даже несколько компактнее, чем у Cayman (365 vs. 389 мм2). Тактовая частота GPU увеличилась незначительно – до 925 МГц. АMD решила не форсировать события, преодолевая знаковую отметку в 1 ГГц. В случае с Radeon HD 7970 используется версия Tahiti со всем активными блоками, включая 2048 потоковых процессоров. Вычислительная производительность возросла на 40% и составляет 3,79 TFLOPS. Количество текстурных блоков возросло с 96 до 128, что, с учетом повышенной частоты ядра, позволило получить филрейт на уровне 118,4 ГТ/c. Число модулей ROPs не изменилось, потому пиксельная скорость заполнения практически на прежнем уровне.

Как и предшественник, Radeon HD 7970 использует память GDDR5, работающую на 1375 МГЦ (5500 МГц). Однако теперь передача данных производится по 384-битной шине, благодаря чему пропускная способность увеличена со 176 до 264 ГБ/c. При этом объем локальной ОЗУ для топового решения составляет 3 ГБ. Для традиционной одномониторной конфигурации такая емкость явно избыточна, даже если говорить о 27- или 30-дюймовой панели с разрешением 2560х1600. Однако в конфигурациях с несколькими дисплеями, кадровый буфер значительно увеличивается, потому подобный объем не окажется лишним.

Ознакомившись с техническими характеристиками можно смело говорить о том, что Radeon HD 7970 будет заметно производительнее предшественника с ядром Cayman. Новинка улучшена по всем параметрам, которые влияют на быстродействие GPU. При неизменном максимальном TDP в 250 Вт разработчикам удалось выжать максимум.

Референсная видеокарта

Внешне новинка лишь отчасти напоминает топовую модель предыдущей серии. Строгие прямоугольные формы внешнего кожуха системы охлаждения уступили место конструкции со скругленными углами, ярко-красными вставками и глянцевым покрытием элементов верхней защитной крышки.

Печатная плата имеет длину 270 мм, однако форма системы охлаждения увеличивает устройство до 280 мм. Корпусы Middle-tower даже средней ценовой категории, как правило, обеспечивают беспроблемную установку адаптеров подобных габаритов, в случае же с более дорогостоящими игровыми моделями проблем с размещением Radeon HD 7970 точно не возникнет.

В этот раз AMD не установила радиаторную пластину на тыльной стороне печатной платы. Греющиеся элементы, требующие дополнительного охлаждения, расположены на лицевой панели PCB, потому подобный элемент декора лишь ухудшил бы отвод тепла. Хотя, нужно признать, что анодированная пластина добавляет баллы за внешний дизайн, но в этот раз победила практичность.

На верхней кромке видеокарты расположена пара разъемов для подключения дополнительного питания: шести и восьмиконтактный. Соответствующие переходники с Molex-разъемов должны поставляться в комплекте с видеокартой.

Использование двух микросхем BIOS стало хорошей традицией для старших моделей адаптеров от AMD, и в данном случае компания не стала отказываться от функции Dual BIOS. Немалая часть владельцев таких решений – потенциальные экспериментаторы, которые захотят поиграться с частотами чипа/памяти, в том числе используя для этого и различные версии прошивок. Чтобы обезопасить пользователей от возможных проблем с этой стороны, AMD предлагает две версии BIOS, переключаться между которыми можно с помощью миниатюрного тумблера, расположенного на верхней кромке печатной платы.

По толщине Radeon HD 7970 занимает два слота расширения. На интерфейсной панели расположены четыре коннектора: пара Mini-DisplayPort, HDMI и DVI (Dual-Link). Примечательно, что все разъемы размещены в один ряд, тогда как большую часть крепежной пластины занимает решетка выхлопа системы охлаждения. Напомним, что Radeon HD 6900 имеют еще один порт DVI, расположенный на втором ярусе, что заметно уменьшает площадь решетки, тем самым замедляя вывод нагретого воздуха наружу.

Общая конструкция системы охлаждения во многом схожа с той, что используется для референсных видеокарт на чипах Cayman. К массивному алюминиевому основанию прикреплена крупная испарительная камера, на которую установлена кассета с набором алюминиевых пластин. Данный блок продувается 70-миллиметровым центробежным вентилятором. Чипы памяти, а также силовые элементы контактируют с радиаторной пластиной через теплопроводные прокладки, тогда как GPU сообщается непосредственно с теплосъемником испарительной камеры. Сверху кулер прикрыт защитным пластиковым кожухом. Подобная концепция СО уже доказала свою эффективность, потому вполне логично что AMD предпочла данный кулер для Radeon HD 7970. Важным преимуществом такой системы является то, что практически весь нагретый воздух выдувается за пределы системного блока. Это важный нюанс, особенно когда речь идет о производительных решениях с высоким TDP.

Теперь несколько слов о впечатлениях от работы видеокарты. В режиме покоя графический адаптер работает практически бесшумно, снижая частоту чипа до 300 МГц, а памяти до 600 МГц. Вентилятор вращается со скоростью 1000–1100 об/мин (20% от максимального значения). На открытом стенде этого оказывалось достаточно, чтобы температура GPU не поднималась выше 35 С.

Под нагрузкой вентилятор оживает, плавно увеличивая обороты. Алгоритм линейный, потому резких рывков или перепадов в процессе изменения не ощущается. После длительного прогрева температура чипа повысилась до 77 градусов, пропеллер вращался на 43% от максимума (~2300 об/мин). В таком режиме видеокарта, безусловно, слышна, но о серьезном дискомфорте речь не идет.

Мы также на практике убедились в работоспособности технологии AMD ZeroCore Power. Спустя 20–30 секунд после перехода монитора в режим ожидания, вентилятор кулера видеокарты действительно останавливается. Для охлаждения адаптера в таком состоянии достаточно работы СО в пассивном режиме.

В целом, штатная система охлаждения Radeon HD 7970 демонстрирует достойную эффективность при довольно умеренном звуковом сопровождении под нагрузкой. По этой причине нет сожаления о том, что на начальном этапе подавляющее большинство моделей от различных производителей видеокарт будут основаны на референсных печатных платах и кулерах, отличаясь между собой фактически только наклейками на верхней крышке.

Безусловно, компании работают над устройствами с альтернативными СО. В частности Gigabyte и XFX уже подготовили свои варианты.

Аналогичных шагов стоит ждать и от других весомых игроков на этом рынке. Другой вопрос, насколько эффективнее окажутся такие решения. Конструкции с габаритными тихоходными вентиляторами осевого типа выигрышно смотрятся на открытых стендах, но требуют заметно большего внимания к организации охлаждения внутри корпусов, так как горячий воздух в подобных случаях фактически не выводится за пределы системы.

Разгон

Тем, кто уже успел приобщить Radeon HD 797 0 к жидкому азоту, Tahiti раскрылся во всей красе, удивляя устойчивой работой на 1500–1600 МГц даже в CrossFire-конфигурациях. Оверклокеры, сумевшие обзавестись несколькими Radeon HD 7970, на зависть менее удачливым коллегам активно устанавливают новые мировые рекорды в классических приложениях от Futuremark.

К сожалению, на момент проведения тестирования, имеющиеся средства для разгона не позволяли нам изменять напряжения питания, а также увеличивать частоту GPU выше 1125 МГц – границы, установленной в драйвере. Достичь указанного значения не составило никаких проблем даже со штатным вольтажом. +200 МГц – уже очень неплохая прибавка, по сравнению с рекомендуемым значением, но наверняка это далеко не предел для нового чипа. Вопрос возможности разгона остается открытым, и мы к нему еще обязательно вернемся. Особенно любопытно будет оценить потенциал финальных Radeon HD 7970, которые попадут в розничную продажу. Все же в наших руках побывал инженерный образец видеокарты. Однако уже сейчас можно говорить, что 1 ГГц для Tahiti – это только начало. Учитывая легкость, с которой новому кристаллу даются такие частоты, производители видеокарт в последующем наверняка для своих турбированных модификаций будут изначально использовать более внушительные стартовые значения для графического ядра.

Что касается памяти, то для рассмотренной видеокарты используются 2-гигабитные чипы Hynix H5GQ2H24MFR-ROC с базовой частотой 6 ГГц. Так как штатным значением для Radeon HD 7970 является 5500 МГц, микросхемы изначально имеет определенный запас для разгона.

28-нанометровый техпроцесс творит чудеса. Несмотря на значительно возросшую сложность чипа, а также увеличившееся количество функциональных блоков и транзисторов, Tahiti работает на очень высоких тактовых частотах. В этом отношении их 40-нанометровые предки «сдувались» значительно раньше.

Конфигурация тестового стенда

Процессор: Intel Core i7-3930K

Материнская плата: MSI X79A-GD65 (8D)

Оперативная память: GeIL EVO TWO DDR3-2133 16 ГБ (GET316GB2133C11QC)

Накопитель: HDD WD WD1001FALS (1ТБ, 7200 об/мин)

Блок питания: be Quiet! Dark Power Pro 1000W

Результаты тестирования

Подбирать конкурентов для новинки AMD в данном случае было довольно легко. В первую очередь, это предыдущий флагман – Radeon HD 6970. Еще до начала практических тестов было очевидным, что Radeon HD 7970 окажется быстрее предшественника, вопрос был лишь в том, насколько значительной окажется разница в быстродействии этих решений в реальных условиях. А вот GeForce GTX 580 гораздо более интересный соперник для нового топового решения AMD. Уже более года данная видеокарта является обладателем чемпионского пояса в супертяжелом весе. И соперничество именно с этим адаптером вызывает наибольший интерес.

Первые результаты традиционной синтетики от Futuremark демонстрируют заявку на лидерство Radeon HD 7970. В 3DMark Vantage новинка имеет 20%-ное преимущество над GeForce GTX 580 в стандартном режиме Performance и почти вдвое больший перевес в Extreme – очень достойные показатели.

Схожую картину можно наблюдать и в более технологичном 3DMark 11 . С той лишь разницей, что преимущество в режиме с высоким разрешением и качеством графики составляет более скромные 28%.

Но, это еще не победа. Продукты от AMD всегда очень неплохо показывали себя в синтетических приложениях – вычислительная мощность позволяет, да и возможную программную оптимизацию под эталонные тесты не стоит сбрасывать со счетов. Тем не менее, полученные данные дают определенный повод для оптимизма.

В тесте Heaven Benchmark 2.5 использовался режим c максимальным уровнем тесселяции. Это очень некомфортные условия для чипов AMD предыдущего поколения. В подобных ситуациях серьезное преимущество имеют решения от NVIDIA. Собственно в этом можно убедиться, взглянув на соответствующую диаграмму. GeForce GTX 580 на 37% опережает до недавнего времени топовый Radeon HD 6970. Однако в случае с Radeon HD 7970 ситуация меняется на противоположную. Адаптер с Tahiti оказался проворнее и быстрее флагмана калифорнийцев, пересчитывая миллионы полигонов расторопнее предшественника на внушительные 67%. AMD сдержала слово в отношении скорости обработки тесселяции. Соответствующие блоки нового поколения действительно работают очень быстро. И хотя 4-кратного преимущества в данном случае получить не удалось, прирост в 1,7 раза оказался вполне реален.

Первая реальная игра и от тотального преимущества, исчисляемого десятками процентов, не остается и следа. Всего лишь 2% или 1 кадр/c отделяет Radeon HD 7970 и GeForce GTX 580 в режиме Full HD и порядка 9% при разрешении 2560х1600. Вряд ли шестиядерный Core i7-3930K здесь стал ограничителем.

Вместе с тем отметим, что движок Lost Planet 2 явно благоволит решениям от NVIDIA – уж очень велика разница между GeForce GTX 580 и Radeon HD 6970 (53%). Без хорошей оптимизации под конкретную архитектуру достичь подобного сложно. Тем не менее, играя даже на поле соперника, Radeon HD 7970 пусть и минимально, но все же смог его обойти.

В игре Мetro 2033 наблюдаем уверенное преимущество Radeon HD 7970 над основным оппонентом от NVIDIA. Разница в производительности составляет убедительные 21–26%. Обратим внимание на то, что Radeon HD 6970 здесь также выглядит очень неплохо, уступая более дорогостоящему GeForce GTX 580 всего 2–6%. Однако стоит учесть, что во время проведения теста в настройках игры отключалась опция PhysX. Ее активация добавляет визуальных эффектов, но ставит участников в неравные условия. В случае с решениями AMD расчет физики частиц ляжет на плечи CPU, тогда как с адаптером NVIDIA она будет просчитываться вычислительными блоками GPU посредством API CUDA.

Игра Far Cry 2 в режиме DirectX 10 также резвее бегает на Radeon HD 7970. Вряд ли кто-то способен на глаз ощутить разницу в скорости отрисовки между 153 и 142 кадрами/c, но 8%-ное преимущество все же факт неоспоримый. А с увеличением разрешения оно возрастает до более весомых 22%. В сравнении же с предшественником решение на Tahiti расторопнее на 35%.

Схожая расстановка сил наблюдается и в Colin McRae: DiRT 3 . GeForce GTX 580 на 13–22% отстает от Radeon HD 7970. И, что уже стало закономерностью, отрыв новичка AMD увеличивается с ростом разрешения. Ну, а самый скоростной Cayman в данном тесте довольствуется последним местом, отстав от лидера на 42–47%.

Оценивая производительность новинки, следует сказать и об ее скрытом потенциале, ведь Radeon HD 7970 имеет не просто улучшенную, а принципиально новую архитектуру. Как это часто бывает в подобных случаях, последующая программная оптимизация может принести очень хорошие результаты. Потому, вполне реально рассчитывать на дополнительную производительность решений с GCN по мере совершенствования драйверов. Разработчики наверняка сейчас сконцентрируют внимания на адаптерах линейки Radeon HD 7000. Потому очередные улучшения при обновлении ПО в первую очередь будут ощущать как раз владельцы видеокарт с новой графической архитектурой.

На этапе замера энергопотребления у нас осталось два участника. Дело в том, что в качестве тестовой Radeon HD 6970 использовалась MSI R6970 Lightning , которая, помимо используемого GPU, с референсной видеокартой не имеет ничего общего. Серьезно усиленная элементная база и оригинальная печатная плата не позволяют использовать полученные данные для прямого сравнения. А вот GeForce GTX 580 мы использовали адаптер ASUS ENGTX580/2DI/1536MD5 , который основан на эталонном дизайне и имеет рекомендуемые NVIDIA частотные и электрические характеристики.

Признаться, значения в 70 Вт на циферблате ваттметра весьма впечатляют. Особенно с учетом того, что тестовая система основана на отнюдь не самой экономичной платформе LGA2011 с шестиядерным процессором, четырьмя модулями памяти и двухдисковым HDD 7200 об/мин.

AMD хорошо поработала над тем, чтобы максимально снизить энергопотребление Radeon HD 7970. В режиме простоя система с такой видеокартой потребляет на 18 Вт меньше, чем ПК с GeForce GTX 580. Когда же речь идет о реальной игровой нагрузке, разница увеличивается еще больше – до 50–60 Вт. И это при том, что новинка на Tahiti обеспечивает большую скорость, а соответственно имеет лучшее соотношение производительности на ватт.

Итоги

В AMD, безусловно, уловила тренд гетерогенных вычислений. Более того, в сложившейся ситуации можно сказать, что компания всячески содействуют его развитию. По крайней мере, касаемо аппаратной части. Вполне вероятно, что в глобальном масштабе и недалекой перспективе Graphics Core Next поможет AMD более весомо заявить о себе, как о поставщике решений для самых разнообразных задач и применений: от ультимативных игровых систем, до HPC-вычислений.

Что же касается непосредственно Radeon HD 7970 , то видеокарта заслуживает похвалы. На текущий момент это самый производительный одночиповый графический адаптер. Без каких-либо скидок, оговорок и уточнений. Новинка имеет тотальное преимущество над флагманом предыдущего поколения, обеспечивая на 30–70% более высокие показатели, чем у Radeon HD 6970. Ей также удалось опередить и основного конкурента – GeForce GTX 580 – хотя разница здесь уже более скромная.

Тем не менее, для тех, кто готов потратить на видеокарту порядка $500, выбор не столь однозначен. Цена GeForce GTX 580 с референсной системой охлаждения и рекомендуемыми тактовыми частотами заметно снизилась за последние два-три месяца. Такую модель уже можно приобрести за $460-470. Тогда как розничная стоимость Radeon HD 7970 3GB в Украине ожидается на уровне $600. AMD не то, чтобы переоценила свое устройство, а скорее задала ту планку, с которой Radeon HD 7970 предлагает примерно схожее соотношение цена/производительность, что и у топового решения калифорнийцев. Последнее, хоть и оказывается медленнее, но настолько же и дешевле. Потому демпинга не получилось, хотя очень этого и хотелось. Впрочем, мы знаем, что AMD умеет оперативно реагировать на рыночную ситуацию, умело корректируя свою ценовую политику. К счастью для пользователей, в сегменте дискретной графики имеет место жесткая конкуренция, и нет явного лидера, что часто позволяет в ценовом вопросе расставить все точки над «i» сугубо рыночными методами.

Radeon HD 7970 – добротное решение с отличной производительностью, расширенной функциональностью, технологическими инновациями и хорошим потенциалом. За исключением цены, фактически, других слабых мест данный адаптер не имеет. Так или иначе, майка лидерства заслуженно переходит AMD. По крайней мере, на ближайшие пару месяцев, по прошествии которых NVIDIA также представит собственные разработки с 28-нанометровыми GPU и новой архитектурой Kepler. Так что очередная графическая партия также обещает быть весьма любопытной.

Презентация нового поколения графических процессоров AMD, безусловно, стала одним из наиболее значимых событий последнего квартала 2011 года в IT индустрии. В «гонке вооружений» с NVIDIA, полупроводниковому гиганту из Саннивейла удалось сделать очень важный стратегический ход, первым представив следующее поколение графических процессоров, основанное на чипах, выполненных с соблюдением норм 28 нм техпроцесса.

Таким образом, AMD вновь получила некоторое преимущество перед основным конкурентом на рынке дискретной графики. На момент появления в продаже первых представителей 600-ой линейки графических процессоров NVIDIA GeForce, решения на основе Radeon HD 7970 уже будут присутствовать на рынке, по меньшей мере, пару месяцев, что позволит повысить уровень их продаж, особенно в кругу продвинутых геймеров и энтузиастов, которые стремятся получить hi-end новинки как можно скорее. Демонстрация Radeon HD 7970 , состоявшаяся в Москве 13 декабря, произвела на нас очень приятное впечатление, но только спустя месяц нам удалось наконец-то получить образец видеокарты AMD Radeon HD 7970 в нашу тестовую лабораторию. Однако перед тем как перейти непосредственно к изучению особенностей самого графического ускорителя AMD Radeon HD 7970, стоит рассказать об архитектурных особенностях графического ядра Tahiti XT , которое лежит в его основе.

Особенности архитектуры Graphics Core Next

Напомним, что начиная с линейки Radeon HD 2000, инженеры ATI (а впоследствии AMD) для разработки графических процессоров Radeon использовали архитектуру типа VLIW (very long instruction word). Разумеется, с момента представления чипа R600 до семейства графических адаптеров Northern Island производительность решений возросла в несколько раз, однако принципиально новых изменений за это время всё же не произошло.

Тем не менее, качество графики в PC-играх постоянно повышается, а разработчики находят всё новые пути повышения реалистичности изображения на экране монитора. Разумеется, требования к скорости работы и объёму памяти видеокарт постоянно растут, однако постепенно меняется и характер задач, которые стоят перед ними. Так, например, в последнее время дискретные графические адаптеры всё чаще находят своё применение в «неграфических» приложениях и зачастую выполнение определенной задачи силами видеокарты требует меньше времени и ресурсов. Это один из наиболее приоритетных трендов развития для производителей графических чипов, и в компаниях AMD и NVIDIA это хорошо понимают. Отметим, что разработчики из «зелёного лагеря» осознали необходимость создание принципиально новой унифицированной архитектуры и графического чипа общего назначения (GPGPU или General Purpose GPU) заметно раньше. Как результат, технология NVIDIA CUDA сегодня поддерживается большим количеством программ, включая профессиональные решения. Впрочем, заметное распространение эта технология получила сравнительно недавно, так что у AMD ещё есть все шансы составить достойную конкуренцию в этом сегменте рынка.

Итак, основой нового чипа Tahiti XT на архитектуре Graphics Core Next являются супер-скалярные процессоры именуемые Compute Units, которые включают 64 ALU каждый. Важно отметить, что они состоят из векторных и скалярных блоков, а также имеют встроенный планировщик и 16 килобайт кэш-памяти первого уровня. Применяемая схема их строения позволяет получить более высокую производительность в сравнении с VLIW-архитектурой, а также высокую эффективность, как для решения графических задач, так и задач общего назначения.

Всего в состав чипа Tahiti XT входит 32 блока Compute Unit (2048 потоковых процессоров), которые разбиты в группы по 4 штуки. Каждая такая группа имеет в своем распоряжении 32 КБ кэш-памяти для хранения данных и 16 КБ для инструкций. Помимо этого, как мы уже отмечали, каждый блок CU оснащен собственным кэшем объёмом 16 КБ. Общий объём кэш-памяти первого уровня (L1) составляет 512 КБ, а второго - 768 КБ, что в два раза больше, нежели у предыдущего флагмана линейки Radeon HD.

Ширина шины памяти была увеличена до 384 бит, однако количество растровых процессоров (ROP) не возросло пропорционально до 48, а осталось прежним - 32. При этом принцип их взаимодействия с остальной частью GPU, по заявлениям инженеров AMD, был существенно переработан. Отметим, что новый чип Tahiti XT включает 4,31 млрд. транзисторов на площади 365 мм².

Особое внимание в новой архитектуре, по словам представителей компании AMD, было уделено блоку тесселяции. Со времен линейки Radeon HD 5000 в задачах с активным использованием тесселяции решения от NVIDIA выглядели гораздо предпочтительнее, однако с внедрением блока тесселяции десятой версии в линейке Radeon HD 7000, ситуация может существенно измениться.

Основываясь на данные графика из официальной презентации AMD, в сравнении с предыдущим флагманом, производительность Radeon HD 7970 при обработке тесселяции выросла вплоть до 140% в отдельных приложениях.

Важным нововведением в новой архитектуре Graphics Core Next стал отдельный блок Video Codec Engine. Когда на рынке появится программное обеспечение, позволяющее воспользоваться его возможностями в полной мере, пользователи смогут задействовать вычислительную мощь видеоускорителей не только для декодирования, но и для кодирования видеоконтента.

Немало внимания в новой архитектуре традиционно было уделено вопросам энергопотребления. Технология AMD Power Tune призвана динамически отслеживать нагрузку на графический процессор и в случае превышения максимального уровня TDP (например в стресс-тестах FurMark, OCCT) - автоматически снижать тактовую частоту GPU и напряжение его работы. Таким образом, производитель не идёт на искусственное занижение производительности видеокарты, оглядываясь лишь на синтетические тесты, которые в реальной эксплуатации практически не запускаются.

Ещё одной приятной особенностью Graphics Core Next стала функция ZeroCore. Теперь в режиме бездействия, после того как экран монитора автоматически отключается, видеокарта может автоматически перейти в экономный режим, отключив при этом даже вентилятор системы охлаждения. Энергопотребление графического адаптера в таком режиме не превышает 4 Вт, по словам инженеров AMD.

В режиме CrossFireX при переходе в 2D режим, все адаптеры кроме одного аналогично будут «засыпать» и отключать вентиляторы СО.

Немало внимания в новой архитектуре было уделено и технологии Eyefinity, которая, напомним, позволяет подключать к одной видеокарте одновременно несколько дисплеев в различных режимах. С переходом на Graphics Core Next, технология Eyefinity была обновлена до второй версии и теперь позволяет не только подключать до 6 мониторов к одной видеокарте (при использовании активных переходников, приобретаемых отдельно), но и активировать 3D-режим при подключении нескольких дисплеев. Здесь AMD снова задает новый стандарт в отрасли, ведь для аналогичного режима NVIDIA 3D Vision Surround потребуется установка как минимум 2х видеокарт в режиме SLI.

Кроме этого, для AMD Radeon HD 7970 заявлена поддержка мониторов и LCD-панелей ультравысокого разрешения (7680 × 4320 пикселей), что на теперешний момент уже является неплохим заделом на будущее. Также нельзя не отметить поддержку видеокартами семейства Southern Islands интерфейса PCI Express 3.0. Практической пользы от этого нововведения пока немного, однако, факт внедрения новых стандартов, безусловно, приятен. Отметим, что AMD Radeon HD 7970 стала первой видеокартой на рынке с поддержкой PCI Express 3.0. В завершение рассказа об архитектуре приведем сводную таблицу, в которой мы сравнили спецификации нового флагмана линейки Radeon HD с предшественниками и актуальными конкурентами:

AMD Radeon HD 7970

AMD Radeon HD 6970

AMD Radeon HD 5870

NVIDIA GeForce GTX 580

Кодовое имя

Текстурные блоки

Блоки растеризации (ROP)

Частота графического процессора, МГц

Шейдерная частота, МГц

Частота видеопамяти, МГц

Объём памяти GDDR5, Мбайт

Интерфейс видеопамяти, бит

Разъёмы питания

1 x 6-pin, 1 х 8-pin

1 x 6-pin, 1 х 8-pin

1 x 6-pin, 1 х 8-pin

1 x 6-pin, 1 х 8-pin

Приведенный список нововведений в архитектуре Graphics Core Next выглядит действительно интересно и многообещающе. Что ж, мы переходим к практическому тестированию, для того чтобы на практике изучить все особенности передовых технологий AMD на примере видеокарты Radeon HD 7970 «референсного» дизайна.

AMD Radeon HD 7970

Графическое ядро

Количество потоковых процессоров

Поддерживаемые API

DirectX 11.1 (Shader Model 5.0, DirectCompute 11.1), OpenCL 1.2 и OpenGL 4.2

Частота графического ядра, МГц

Частота памяти (эффективная), МГц

Объём памяти, МБ

Тип памяти

Ширина шины памяти, бит

Максимальное разрешение

До 4 дисплеев по 1920x1200 каждый
До 2560x1600 Dual-link DVI или 1920x1200 Single-link DVI
До 2048x1536 VGA (через переходник DVI-to-VGA)
До 1920x1200 HDMI 1.4
До 2560x1600 DisplayPort

Интерфейсы вывода изображения

1x Single-Link DVI
1x Dual-Link DVI
1х HDMI 1.4
2х Mini-DisplayPort 1.2

Поддержка HDCP и декодирования HD-видео

Есть
Декодирование MPEG-2, MPEG-4, DivX, WMV9, VC-1 и H.264/AVC

Минимальные требования к блоку питания, Вт

Размеры, мм

Драйверы

Свежие драйверы можно скачать:
- сайта производителя GPU

Сайт производителя

Стоит отметить, что в нашу тестовую лабораторию попал не розничный вариант Radeon HD 7970, и даже не финальная ревизия этой видеокарты. Сегодня мы имеем дело с инженерным образцом, который, вероятно, имеет ряд незначительных отличий от тех графических адаптеров на базе Radeon HD 7970, которые уже появились в украинских торговых сетях. Тем не менее, его основные характеристики полностью совпадают с заявленными для AMD Radeon HD 7970, следовательно, и уровень производительности должен быть аналогичным. До того времени когда партнеры AMD представят свои версии Radeon HD 7970 на основе уникального дизайна, все видеоускорители на базе Radeon HD 7970 будут отличаться лишь наклейкой на кожухе системы охлаждения, комплектом поставки, условиями гарантийного обслуживания и, конечно, стоимостью.

Внешний вид видеокарты очень напоминает дизайн предыдущих флагманов линейки Radeon, однако, при этом, отличия между ними хорошо заметны, и Radeon HD 7970 имеет своё собственное «лицо». На наш взгляд, сглаженные края кожуха системы охлаждения и применение глянцевого пластика выглядят более привлекательно, в сравнении со строгим и несколько «кирпичным» видом Radeon HD 6970/6950. Длина видеоускорителя составляет 285 мм, что характерно для hi-end решений. В большинстве современных игровых корпусов формата Middle- и Full-Tower его расположение не доставит проблем.

Для вывода изображения на видеокарте AMD Radeon HD 7970 предусмотрены следующие интерфейсы:

    1x Dual-Link DVI;

    1х HDMI 1.4a (frame packing);

    2х DisplayPort 1.2;

Отметим, что от второго разъёма DVI разработчик отказался, мотивируя это стремлением повысить эффективность системы охлаждения турбинного типа. Вероятно, розничные версии Radeon HD 7970 будут оснащаться дополнительными переходниками и у конечного пользователя не должно будет возникнуть никаких проблем с подключением к видеокарте монитора, плазменной панели или проектора. Напомним, что благодаря технологии Eyefinity 2.0 к графическим ускорителям на AMD Radeon HD 7970 можно подключить до 6-ти мониторов с двумя дополнительными DisplayPort-хабами (приобретаются отдельно). Порт HDMI версии 1.4a с поддержкой frame packing позволяет передавать 3D-изображение с частотой 60 Гц на каждый глаз.

Печатная плата видеокарты AMD Radeon HD 7970, попавшей к нам в лабораторию, выполнена на текстолите красного цвета, однако в розничные каналы поставляются карты на более поздней ревизии PCB черного цвета. Безусловно, стоит отметить применение качественной элементной базы: полевых транзисторов в металлическом корпусе DirectFET, дросселей с ферритовыми сердечниками и твердотельных конденсаторов. Для решения уровня Radeon HD 7970 качественная элементная база не только обеспечит длительную и стабильную работу в штатном режиме, но и позволит добиться лучших результатов в процессе разгона.

Модуль стабилизации питания выполнен по 6+1-фазной схеме, а в качестве ШИМ-контроллера используется микросхема CHiL CHL8228G.

Для обеспечения питания видеокарты, помимо разъёма PCI-E, применяется один 6-контактный и один 8-контактный разъёмы питания, которые расположены сбоку в конце платы.

Два коннектора для мостиков CrossFireX позволяют объединять несколько видеокарт на основе графических процессоров AMD для совместного расчета графических эффектов. Рядом с ними располагается небольшой переключатель BIOS, который впервые появился в линейке Radeon HD 6900.

Обратная сторона платы практически лишена элементов. Здесь мы обнаружили лишь крепежную крестовину системы охлаждения и несколько микросхем модуля VRM. Кроме этого, на инженерном семпле попавшем к нам в тестлаб на обратной стороне печатной платы присутствовало несколько маленьких переключателей и коннекторов непонятного назначения. В финальной версии, очевидно, ничего такого нет.

Так выглядит графический чип Tahiti XT, выполненный по нормам 28 нм процесса, который является центральной частью рассматриваемой видеокарты. Как мы уже упоминали, он включает 2048 унифицированных процессоров и 32 блока растеризации, а обмен данными между графическим ядром и памятью осуществляется через 384-битную шину.

Видеопамять стандарта GDDR5 общим объемом 3 ГБ набрана с помощью двенадцати чипов по 256 МБ производства компании Hynix. Чипы имеют маркировку H5GQ2H24MFR T2C и согласно документации могут функционировать на эффективной частоте до 6 ГГц. Учитывая, что память в тестируемой видеокарте изначально работает на частоте 5500 МГц, есть смысл попробовать немного ускорить ее в процессе ручного разгона.

Система охлаждения видеокарты AMD Radeon HD 7970 «референсного» дизайна включает турбину и достаточно массивный алюминиевый радиатор в основании которого установлена испарительная камера, способствующая равномерному распределению тепла по всей площади теплообменника.

Для эффективного забора воздуха в задней части пластикового кожуха, закрывающего всю лицевую часть печатной платы, присутствуют специальные отверстия.

Графический чип контактирует с основным радиатором напрямую, в то время как чипы памяти и силовые транзисторы соприкасаются через специальный термоинтерфейс с металлической пластиной-основанием, на которой закреплен радиатор и турбина. В целом со времени Radeon HD 6970 штатный кулер не перетерпел значительных изменений, а для того чтобы проверить его эффективность на практике мы провели наш стандартный набор тестов. Традиционно тесты проводились в двух режимах работы кулера: автоматическое управление и максимальная скорость вращения турбины.

В автоматическом режиме при максимальной нагрузке температура графического ядра не превышала отметку 74 градуса, что является неплохим результатом для адаптера такого уровня. При этом вентилятор работал на 50 % своей мощности, производя средний уровень шума, заметный на общем фоне работы системы, но не раздражающий.

После того как мы установили скорость вращения вентилятора на максимум и провели тестирование еще раз, мы зафиксировали снижение максимальной температуры GPU на 12 градусов, а уровень шума, издаваемый кулером при этом, мы бы охарактеризовали, как очень высокий.

При отсутствии нагрузки, частоты графического ядра и памяти автоматически понижаются, что приводит к меньшему энергопотреблению и тепловыделению. Кулер в таком режиме работает действительно тихо, а температура графического ядра не превышает 36 градусов.

В целом система охлаждения на основе испарительной камеры, применяемая для AMD Radeon HD 7970,продемонстрировала хорошую эффективность охлаждения при среднем уровне шума. На фоне остальных компонентов современного системного блока шум от работы видеокарты при типичной нагрузке выделяется незначительно.

При тестировании использовался Стенд для тестирования Видеокарт №3
Выберите с чем хотите сравнить Radeon HD 7970 3GB GDDR5 AMD


По результатам тестирования можно с уверенностью констатировать, что на теперешний момент, видеокарта AMD Radeon HD 7970 является наиболее производительным одночиповым графическим адаптером. В сравнении с предыдущим флагманом прирост быстродействия выглядит очень внушительно и составляет не менее 20% в игровых приложениях и синтетических бенчмарках. Более того, в нескольких тестах, Radeon HD 7970 оказался быстрее не только Radeon HD 6970, но и двухчипового графического «монстра» - Radeon HD 6990. Это ещё раз доказывает тот факт, что, несмотря на постоянное улучшение эффективности режима CrossFireX, мощная одночиповая видеокарта всё еще является более универсальным решением. Тем не менее, однозначную победу над двухчиповым «королем графики», вероятно, сможет одержать лишь гипотетический Radeon HD 7990, который, судя по всему, должен появиться позже в этом году. Важно отметить, что наиболее привлекательно новая архитектура Graphics Core Next выглядит в самых тяжелых графических режимах с активным использованием тесселяции, сглаживания и анизотропной фильтрации. В будущем разработчики игр, вероятно, будут учитывать особенности архитектуры GNC, и спустя какое-то время мы увидим реальный потенциал, заложенный в GNC. Что же касается сравнения с конкурентами из лагеря NVIDIA, то здесь новичок также выглядит неплохо, однако побеждает уже не столь уверенно. В среднем ускоритель на базе Radeon HD 7970 оказался быстрее GeForce GTX 580 на 10-15%, однако, в некоторых тестах получить победу ему так и не удалось. Вероятно, в ближайшие несколько месяцев эта ситуация должна изменится в лучшую для AMD сторону, ведь с выходом новых версий драйверов производительность нового флагмана должна улучшиться. Что же касается энергопотребления, благодаря переходу на новый технологический процесс и дальнейшей оптимизации, то его уровень практически не вырос со времен Radeon HD 6970, что, безусловно, приятно, учитывая заметный прирост производительности.

Разгон

Во время анонса Radeon HD 7970 представители компании AMD открыто заявляли, что новый флагман линейки Radeon изначально создавался с учетом дальнейшего ручного разгона. Напомним, что предыдущая «топовая» одночиповая модель - Radeon HD 6970 не могла похвастать выдающимся разгонным потенциалом при «стоковом» охлаждении, однако в этот раз ситуация должна быть иная. К сожалению, на момент написания материала, утилита MSI Afterburner (и другие) не позволила нам осуществить серьезный ручной разгон видеокарты AMD Radeon HD 7970. Как это часто бывает, возможности для оверклокинга оказались сильно ограничены ползунками изменения частоты.

Тем не менее, в результате наших экспериментов с разгоном нам удалось добиться полной стабильности графического адаптера при частоте графического ядра 1125 МГц (прирост 21,6%) и видеопамяти 6300 МГц (прирост 14,5%). Довольно внушительный результат, который позволяет надеется, что после того как утилиты научатся узнавать новинку, мы сможем получить еще более высокие частоты без необходимости править BIOS, ведь именно с модифицированными версиями BIOS некоторые оверклокеры уже получили заметно лучшие результаты.

Прирост производительности вследствие такого разгона вы можете оценить в таблице ниже:

Тестовый пакет

Стандартные частоты

Разогнанная видеокарта

Прирост
производи
тельности, %

Performance Score

Performance Score

Crysis Warhead, DirectX 10, Maximum Quality, AA4x/AF16x, fps

Far Cry 2, DirectX 10, Ultra Quality, NO AA/AF, fps

Aliens vs. Predator DX11 Benchmark, Maximum Quality, NO AA/AF, fps

Aliens vs. Predator DX11 Benchmark, Maximum Quality, AA4x/AF16x, fps

Colin McRae: DiRT 2, DirectX 11, Maximum Quality, NO AA/AF, fps

Colin McRae: DiRT 2, DirectX 10, Maximum Quality, AA4x/AF16x, fps

Прирост производительности в среднем составил около 13%, причем основной вклад в это сделало именно ускорение GPU, что является очень хорошим показателем для Hi-end продукта и позволяет заметно повысить и без того высокую частоту смены кадров.

Выводы

Безусловно, новый флагман линейки графических процессоров AMD Radeon HD получился действительно удачным продуктом, который будет в ближайшее время задавать стандарты для Hi-end продуктов на рынке дискретной графики. Список нововведений по сравнению с предыдущим поколением выглядит более чем внушительно: переход на новый 28 нм техпроцесс, инновационная архитектура, внедрение поддержки PCI-E 3.0 и технологий Eyefinity 2.0, ZeroCore, Power Tune, поддержка ультравысокого разрешения и передачи 3D изображения через HDMI-порт и т.д. Отметим, что архитектура не только позволила нарастить количество функциональных блоков и повысить уровень производительности в игровых приложениях и бенчмарках. Мы будем надеяться, что в будущем разработчики прикладного программного обеспечения обратят внимание на преимущества Graphics Core Next, что позволит активно применять видеокарты на её основе для решения широкого спектра задач. «Референсный» ускоритель AMD Radeon HD 7970 произвёл на нас приятное впечатление благодаря эффективной системе охлаждения на основе испарительной камеры, применению качественной элементной базы и хорошему разгонному потенциалу, который нам, к сожалению, не удалось раскрыть в полной мере. Стоимость нового флагмана линейки AMD Radeon не назовешь демократичной ($550), однако, на наш взгляд, для заядлых энтузиастов и хардкорных геймеров она окажется не столь высокой, учитывая отличную производительность и функциональность этого решения.

Достоинства:

    Высочайший уровень производительности;

    Поддержка DirectX 11.1, OpenGL 4.2 и большого количества фирменных технологий;

    Новая универсальная архитектура Graphics Core Next;

    Эффективная и достаточно тихая система охлаждения в автоматическом режиме;

    Хороший разгонный потенциал;

  • Качественная элементная база.

    Подписаться на наши каналы

Новые топовые ускорители всегда выходят на рынок через какое-то время после анонса предыдущих, но в этот раз срок ожидания оказался более длительным, чем ранее. Однако сегодня мы все-таки можем лицезреть появление очередного лидера, ускорителя, способного взойти на вершину, превзойдя лидера прежнего - однопроцессорный Nvidia Geforce GTX 580. Правда, речь идет именно об однопроцессорных 3D-акселераторах: не забывайте, что двухпроцессорные находятся в особой нише, имея цену от 800 долларов и выше, а также свои нюансы. Можно предположить, что прирост производительности при смене поколений не превысит полтора раза, поэтому новинка уж точно не переплюнет двухпроцессорные ускорители предыдущего поколения.

Это все к тому, что читателям пора привыкнуть сравнивать однопроцессорные с однопроцессорными и не ждать, когда такой новый ускоритель поставит абсолютный рекорд по производительности. Вот когда на базе новых ядер появятся и соответствующие двухпроцессорные гиганты - они уже смогут штурмовать абсолютные значения, достигнутые прежними лидерами в 3D. А пока мы про двухпроцессорные модели с их очень далекими от народа ценами забываем.

Итак, Radeon HD 7970, он же Tahiti в кодовом именовании. Что дает нам выход этого решения? Чем порадует? Передаем слово Алексею Берилло, он расскажет о теории вопроса.

Часть 1: Теория и архитектура

Наконец-то это свершилось! Многомесячное ожидание новых GPU, произведённых по новым технологическим нормам 28 нм, закончилось под самый конец уходящего года. Мы неоднократно писали о проблемах, вызванных трудностями и задержками в освоении нового техпроцесса, компаниям AMD и Nvidia приходилось выпускать всё новые и новые модели видеокарт, основанных на старых GPU, и даже вносить корректировки в функциональные возможности промежуточных решений. Например, серия Radeon HD 6900 получилась переходной от архитектуры, начавшей свой путь в Radeon HD 5800, к анонсируемой сегодня совершенно новой.

Рано или поздно проблемы с новым производством обязаны были закончиться, и вот они если не исчезли совсем, то хотя бы позволяют анонсировать свежие решения и начать массовые (степень их массовости пока под вопросом, впрочем) поставки. Самое время - ведь рынок ПК-игр переживает очередной небольшой расцвет из-за устаревания аппаратной начинки игровых консолей, даже с учётом засилья мультиплатформенных проектов.

Если брать даже чисто финансовые показатели, то продажи на игровом рынке ПК превысили 15 миллиардов долларов в текущем году, а в течение двух лет аналитиками ожидается рост объёма рынка до 20 миллиардов в той же валюте. При этом есть и стремительно растущие рынки, вроде Китая, который является крупнейшим рынком ПК-игр - продажи на нём достигли 4,8 млрд. долларов в 2010 году. Да и российский рынок является одним из важнейших даже для западных компаний, достаточно вспомнить выпуск специальных видеокарт ограниченного выпуска, рассчитанных в т. ч. и на нашу страну.

Понятное дело, что даже с учётом того, что большинство игр мультиплатформенные, они становятся сложнее графически. ПК-версии многих проектов выглядят лучше консольных собратьев по нескольким показателям, и не только экстенсивным, вроде разрешения рендеринга и текстур. Например, известнейшая игра Battlefield 3 использует многие возможности DirectX 11 для того, чтобы улучшить качество рендеринга. Насколько это удаётся разработчикам и каким был прогресс в качестве изображения, компания AMD предлагает посмотреть по таким примерам, как сериалы Battlefield и Deus Ex:

Как видно даже по этим маленьким скриншотам, скачки в качестве за прошедшие несколько лет вполне себе ощутимы. Но ещё более значительными они становятся, если учитывать рост разрешения рендеринга за всё это время. Даже если взять ситуацию трёхлетней давности, то с тех пор рынок шагнул далеко вперёд. Так, если в 2008 году основными на рынке игровых мониторов были модели с размером экрана 22″ и разрешением 1680×1050 пикселей, то в 2011 году распространение получили 24″ модели с FullHD-разрешением 1920×1080.

Но самое интересное даже не в размере и разрешении экрана. Если в 2008 году цена такого дисплея была порядка $360, то цены 24″ моделей в нынешнем году начинаются от $170-180. То есть, покупатель теперь получает чуть больший физически экран, имеющий почти на 20% больше пикселей, меньше чем за половину цены трёхгодичной давности для гораздо худшего монитора. Именно поэтому устройства с FullHD-разрешением уже стали наиболее распространёнными на рынке - ведь они стоят совсем недорого.

Ещё одним модным веянием в последние годы стало повышение энергоэффективности. Пользователи голосуют за эффективные устройства, использующие как можно меньше электроэнергии. Они и меньше воздействуют на окружающую среду, что влияет на умы сознательных граждан Земли, и позволяют экономить деньги на счетах за электричество, что весьма важно для остальных людей, менее сознательных. И компания AMD уделяет особенное внимание повышению энергоэффективности своих GPU, а также видеокарт на их основе.

Ну и нельзя не отметить значительный сдвиг графических процессоров в сторону неграфических вычислений (GPGPU). Все современные графические чипы делаются теперь совсем не только для игр, но и ускорения требовательных к вычислительной мощи задач, которые хорошо поддаются распараллеливанию. И хотя главным движителем рынка в эту сторону является компания Nvidia, выпускающая для рынка ПК лишь графические чипы, AMD старается не отстать. Кроме того, по пиковой вычислительной мощности лидируют именно видеокарты этой компании. Рост теоретически достижимой производительности можно пронаблюдать на диаграмме:

Как видите, скачки пиковой скорости при каждом новом технологическом процессе достигаются весьма значительные. Нужно ещё учесть, что техпроцесс 28 нм только начал свой путь, и можно с уверенностью сказать, что в будущем цифра в 3,79 терафлопа значительно подрастёт.

К слову о техпроцессах - именно компания AMD является их первопроходцем на рынке графических процессоров. В последние несколько лет эта компания опережала своего единственного сильного конкурента - Nvidia - по внедрению всех новых техпроцессов. Вот и сейчас они первые успели анонсировать свой новый продукт ещё в уходящем 2011 году (фотографии кристаллов схематичны, к сожалению):

28 нм - наиболее совершенная технология производства чипов, массово доступная на сегодняшний день, и именно по этой технологии производятся анонсируемые сегодня видеочипы серии AMD Radeon HD 7000. Эти решения поддерживают все современные индустриальные стандарты: GDDR5, PCI Express, DirectX и другие. Предыдущие серии видеокарт были настолько удачны, что AMD недавно отрапортовала о поставке 100 миллионов продуктов с поддержкой DirectX 11. И в результате, более двух третей DX11-совместимых видеокарт на руках у пользователей имеют графические процессоры производства этой компании.

Тем более значительным событием представляется сегодняшний анонс первой в мире линейки графических чипов под кодовым названием «Southern Islands» («южные острова»), обладающей поддержкой обновленной шины PCI Express 3.0 и будущей версии DirectX 11.1. Все подробности о первой видеокарте серии вы прочитаете далее, а сейчас мы вкратце расскажем о решениях, вошедших в новейшую линейку.

Серия «Southern Islands» включает:

  • «Tahiti» - решение наибольшей мощности, самый сложный и мощный GPU на данный момент (серия Radeon HD 7900 )
  • «Pitcairn» - графический процессор среднего ценового диапазона, предназначенный для массового пользователя (серия Radeon HD 7800 )
  • «Verde» - продукт, обладающий непревзойдённым сочетанием цены и производительности (выйдет под именем Radeon HD 7700 )

Чтобы понять, как именно планируется расположить новые решения в линейке продукции, AMD приводит такой слайд (положение по вертикали отражает производительность решений, по горизонтали - время выхода):

Как видите, младшие видеокарты линеек Radeon HD 6300, HD 6400, HD 6500 и HD 6600, продолжат свою жизнь и в следующем году. А вот более мощные решения постепенно заменятся новыми видеокартами указанных выше серий, основанных на представленной архитектуре. Но сегодня выходит только одна видеокарта - мощнейшее решение из линейка Radeon HD 7900, а остальные чипы серии «Southern Islands» выйдут на рынок несколько позже - в течение первого квартала 2012 года.

Предполагаем, что перед прочтением этого материала, читателям будет полезно ознакомиться с подробной информацией о ранних видеочипах компании по следующим статьям нашего сайта:

  • AMD Radeon HD 6950/6970: чуть слабее Geforce GTX 570/580, но и дешевле
  • AMD Radeon HD 6870 и HD 6850: теоретические сведения о новых решениях для среднего ценового сектора
  • ATI Radeon HD 5870: мощный удар из Канады - ATI (AMD) выпускает нового короля 3D-графики
  • ATI Radeon HD 4870 (RV770): самый мощный однопроцессорный 3D-ускоритель AMD

Ну а теперь мы переходим к описанию технических характеристик анонсированной сегодня первой видеоплаты из серии Radeon HD 7900, основанной на совершенно новом GPU с кодовым названием «Tahiti».

Графические ускорители серии Radeon HD 7900

  • Кодовое имя чипа: «Tahiti»
  • Технология производства: 28 нм
  • 4,3 млрд. транзисторов (более чем на 60% больше, чем у Cayman, и ровно вдвое больше, чем у Cypress)
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
  • Аппаратная поддержка DirectX 11.1, в том числе и шейдерной модели Shader Model 5.0
  • 384-битная шина памяти: шесть контроллеров шириной по 64 бита с поддержкой памяти GDDR5
  • Частота ядра: до 925 МГц (для Radeon HD 7970)
  • 32 вычислительных блока GCN, включающих 128 SIMD-ядер, состоящих в целом из 2048 ALU для расчётов с плавающей запятой (целочисленные и плавающие форматы, поддержка точности FP32 и FP64 в рамках стандарта IEEE 754)
  • 128 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • 32 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) - 128 отсчетов за такт
  • Интегрированная поддержка шести мониторов, включая HDMI 1.4a и DisplayPort 1.2

Спецификации видеокарты Radeon HD 7970

  • Частота ядра: 925 МГц
  • Количество универсальных процессоров: 2048
  • Количество текстурных блоков: 128, блоков блендинга: 32
  • Эффективная частота памяти: 5500 МГц (4×1375 МГц)
  • Тип памяти: GDDR5
  • Объем памяти: 3 гигабайта
  • Пропускная способность памяти: 264 гигабайта в сек.
  • Теоретическая максимальная скорость закраски: 29,6 гигапикселей в сек.
  • Теоретическая скорость выборки текстур: 118,4 гигатекселей в сек.
  • Два разъёма CrossFire
  • Шина PCI Express 3.0
  • Разъёмы: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Энергопотребление: от 3 до 250 Вт
  • Один 8-контактный и один 6-контактный разъёмы питания
  • Двухслотовый дизайн
  • Рекомендованная цена для рынка США: $549

Сразу же на себя обращает внимание огромная сложность нового чипа - 4 312 711 873 транзисторов (именно в таком сверхточном виде это число приведено в материалах AMD - наверняка вручную подсчитывали), что более чем наполовину превышает количество транзисторов в предыдущем топовом графическом процессоре. Возможность сделать такой сложный кристалл дало применение новейшего 28-нанометрового техпроцесса, новый чип по площади даже чуть меньше размера Cayman. Но практически все характеристики, влияющие на производительность, заметно улучшены: количество ALU, TMU, шина памяти. Лишь число блоков ROP не выросло, и частота видеопамяти GDDR5 осталась на той же отметке. Благодаря увеличению количества исполнительных блоков, возросшей эффективности, а также повышенной тактовой частоте GPU, он должен значительно превосходить Cayman во всех применениях.

Принцип наименования видеокарт компании остался прежним, продолжив тенденцию предыдущей серии, у которой в топовых решениях поменялась вторая цифра индекса с 8 на 9. Radeon HD 7970 является наиболее производительным одночиповым решением компании, через некоторое время выйдет и младшая модель HD 7950, но анонсирована сегодня она не будет. Понятно, что HD 7970 с её то характеристиками просто не имеет конкурентов на рынке и пока что не заменяет какую-то видеокарту из линейки AMD (разве что HD 6990 можно сразу смело списывать), а скорее сдвигает её вниз. Что касается сравнения с конкурентом, то у Nvidia своё 28-нанометровое решение ещё не готово, и его придётся подождать ещё несколько месяцев. А пока что Geforce GTX 580 придётся отдуваться, пытаясь противостоять HD 7950, но явно не HD 7970.

На новую видеокарту AMD устанавливается всё та же память типа GDDR5 (хотя ходили слухи о якобы совершенно ином типе памяти компании Rambus, но представители AMD их даже не комментируют), но объём вместо 2 гигабайт в предыдущем поколении вырос до 3 гигабайт. Так получилось из-за расширения шины памяти с 256-битной до 384-битной. И теперь на новую плату можно поставить или 1,5 ГБ или 3 ГБ. Естественно, с маркетинговой точки зрения установка меньшего объёма была бы явным поражением, и было принято решение поставить 3 ГБ, хотя на сегодняшний день это явный перебор. Лишь в сверхвысоких разрешениях да с MSAA 16x не хватит 1,5-2 ГБ. Впрочем, у AMD есть и Eyefinity, а для игр на трёх-пяти-шести мониторах экранный буфер будет как раз занимать огромный объём. Возможно, младшую модель Radeon HD 7950 когда-нибудь и выпустят с 1,5 ГБ памяти, для удешевления, но точно не старшую.

Итак, рассмотрим Radeon HD 7970. Новая видеокарта верхнего ценового диапазона имеет двухслотовую систему охлаждения, закрытую привычным для всех современных плат AMD пластмассовым кожухом по всей длине карты. Лишь дизайн этого кожуха немного изменился, хотя задняя часть всё так же выходит за пределы печатной платы. А вот дизайн планки с выводами был изменён - для улучшения охлаждения видеокарты, один из двух слотов (половина планки) был занят исключительно вентиляционным отверстием для отвода тепла.

Но пользователи не должны пострадать от снижения количества разъёмов DVI, распаянных прямо на плате. Для их удобства в комплект поставки будет включен специальный переходник HDMI-DVI, который позволит подключить два монитора, имеющих DVI-разъёмы. К слову, энергопотребление новой карты не ниже, чем у Radeon HD 6970, поэтому на неё пришлось установить набор из одного 8-контактного и одного 6-контактного разъёмов питания.

Зато в новой Radeon HD 7970 в лучшую сторону изменилась система охлаждения. Применяется новое поколение испарительной камеры и новый кулер большего размера, с изменённой формой лопастей и увеличенной производительностью (обеспечивается больший поток воздуха). В результате отмечается увеличение эффективности кулера при одновременном снижении шума.

С платы никуда не делся и переключатель прошивок Dual BIOS, о котором мы писали в обзоре Radeon HD 6900. Вкратце: видеокарта имеет две версии BIOS, одна с возможностью пользовательской перепрошивки, а вторая - с жёстко зашитой на фабрике прошивкой. Это удобное решение настолько приглянулось и пользователям и самой AMD, что та решила продолжить им комплектовать топовые решения.

Можно только поприветствовать данное решение, которое реально помогает в различных случаях, связанных как с неожиданными проблемами при перепрошивке (выключение электроэнергии в процессе, например), так и позволяет бесстрашно проводить различные эксперименты с образами BIOS. Неудивительно, что AMD ещё и снова намекает на отличные возможности разгона новой видеокарты:

Как видите, практически обещается разгон до частоты 1 ГГц и выше, если не учитывать мелкой надписи (она не вошла в кадр, но существует) о том, что гарантия перестаёт действовать даже в том случае, если видеокарта вышла из строя в результате эксперимента с поднятием частоты из настроек видеодрайвера. Кстати, новый слайд интересно сравнить со страницей из презентации давно ушедшего с рынка Radeon HD 4890:

Просто поразительное сходство (по компоновке и дизайну слайда), не правда ли? К сожалению, с тех пор хоть и освоены новые техпроцессы, но злополучный гигагерц никак на даётся в финальных продуктах с референсными частотами. А ведь, казалось бы, тут и 28 нм и явно улучшенное охлаждение, но нет - снова немного, но не дотянули. С другой стороны, зато пользователю будет чем заняться на досуге.

Архитектурные особенности Radeon HD 7970

Чтобы оценить актуальность архитектурных модификаций в Southern Islands, сначала рассмотрим развитие GPU за прошедшие несколько лет (в представлении AMD). До 2002 года графические чипы представляли собой специфичное аппаратное обеспечение, способное исключительно для обработки графики. Видеочипы того времени имели ограниченную функциональность, они умели лишь накладывать и фильтровать текстуры, обрабатывать геометрию, заниматься примитивной растеризацией и поэтому совсем не подходили для универсальных вычислительных задач.

За следующие несколько лет к GPU была добавлена базовая программируемость, но ориентированная также исключительно на графические задачи. Это было время поддержки DirectX 8 и 9, ограниченных по функциональности шейдерных программ с возможностью расчётов и с плавающей запятой. Видеочипы того времени имели специализированные блоки ALU для вершинной и пиксельной обработки, а также выделенные кэши для пикселей, текстур и других данных. Универсальности всё ещё не было даже близко.

И лишь в 2007 году у компании AMD появилась унифицированная шейдерная архитектура DirectX 10, а также возможности программирования GPU при помощи специальных средств: CAL, Brook, ATI Stream. GPU того времени уже имели продвинутое кэширование и поддержку локальных и глобальных общих данных. Архитектурно чипы были основаны на блоках VLIW5 и VLIW4, достаточно гибких для некоторых базовых неграфических вычислений, но всё же ориентированных на графические алгоритмы.

А теперь настало время для новой архитектуры, ещё лучше подходящей для универсальных вычислений - Graphics Core Next (GCN) . Для AMD это новая архитектурная эра, поэтому и название выбрано такое. Новые GPU предлагают отличные возможности и производительность по обработке графики, но сделанные архитектурные изменения предназначены, прежде всего, для улучшения позиций в неграфических вычислениях - увеличению производительности и эффективности в сложных универсальных задачах. Новый дизайн GPU предназначен для так называемых гетерогенных вычислений - смеси графических и универсальных в мультизадачной среде. Архитектура GCN стала гибче и должна ещё лучше подходить для энергоэффективного выполнения различных задач.

Базовым блоком в новой архитектуре является блок GCN. Именно на таких «кирпичиках» основаны все новые графические процессоры серии Southern Islands. Архитектура впервые для графических чипов компании AMD использует не VLIW-дизайн, в нём применяются векторные и скалярные блоки, и одним из самых важных изменений стало то, что каждый из вычислительных блоков GCN имеет свой планировщик и может выполнять инструкции из различных программ (kernel).

Новая вычислительная архитектура разработана для высокой эффективности загрузки вычислительных блоков в многозадачной среде. Вычислительный блок GCN разделён на четыре подраздела, каждый из которых работает над своим потоком команд каждый такт. Потоки могут использовать и скалярный блок, имеющийся в GCN, для управления потоком данных или операций над указателями. Комбинация векторных и скалярных блоков предлагает очень простую программную модель. Например, указатели на функции и стек (function pointers и stack pointers) программируются гораздо проще, да и задача компилятора теперь значительно упрощена, так как исполнительные блоки скалярные.

Каждый блок GCN имеет выделенное локальное хранилище данных для объёмом 64 КБ для обмена данными или расширения локального стека для регистров. Также блок имеет в своём составе и кэш-память первого уровня с возможностью чтения и записи, и полноценный текстурный конвейер (блоки выборки и фильтрации). Поэтому новый вычислительный блок способен работать самостоятельно, без центрального планировщика, который в предыдущих архитектурах отвечал за распределение работы по блокам. Теперь каждый из блоков GCN способен заниматься планированием и распределением команд сам, один вычислительный блок может исполнять до 32 разных потоков команд, которые могут быть из разных виртуальных адресных пространств в памяти и полностью защищены и независимы друг от друга.

Предыдущие архитектуры GPU компании AMD использовали архитектурные модели VLIW4 и VLIW5, и хотя они достаточно хороши для графических задач, но являются недостаточно эффективными для универсальных вычислений, так как загрузить все исполнительные блоки работой в таких условиях очень непросто. Новая архитектура GCN предлагает столь же большое количество исполнительных блоков, но при скалярном исполнении, которое убирает ограничения и зависимости регистров и инструкций. Переход от архитектуры VLIW к скалярному исполнению даёт заметное упрощение задач по оптимизации кода.

При исполнении инструкций на предыдущей VLIW4 архитектуре компилятору приходится заниматься решением конфликтов регистров, выполнять сложное распределение инструкций на исполнительные блоки на стадии компиляции кода и т. д. При этом для достижения высокой производительности зачастую требуется нетривиальная оптимизация, что подходит для большинства графических задач и гораздо менее гибко для других вычислений. Новая же архитектура предлагает значительное упрощение разработки и поддержки, упрощённое создание, анализ и отлов ошибок в низкоуровневом коде, стабильную и предсказуемую производительность.

Подсистема кэширования памяти

Пропускной способности и объёма памяти и кэшей никогда не бывает достаточно, и всегда есть необходимость и методы их увеличения. В новых GPU компании AMD применяется полноценная двухуровневая кэш-память с возможностью чтения и записи. Каждый вычислительный блок имеет по 16 килобайт кэша первого уровня, а общий объём кэша второго уровня составляет 768 килобайт (всего в чипе получается 512 КБ L1 и 768 КБ L2), что на 50% больше, чем в предыдущем чипе, вовсе не имеющем возможности записи в L2-кэш.

Что касается производительности, то каждый вычислительный блок GCN за один такт может получить или записать по 64 байта данных из/в L1-кэш или глобальную память, которая служит для обмена данными между потоками команд. Столько же данных способен передавать и принимать каждый раздел кэш-памяти второго уровня L2. В результате, для топового GPU компании получается 2 терабайт/с для L1 и 700 ГБ/с для L2, что на 50% больше, чем у предыдущего топового решения AMD.

Графический процессор «Tahiti»

После того, как мы рассмотрели низкоуровневые архитектурные изменения новой серии Southern Islands, самое время перейти к подробностям о самом мощном решении этой линейки - Radeon HD 7900, включающей в себя две модели. Прежде всего, отметим просто огромную сложность нового GPU, ведь он включает более чем 4,3 миллиарда транзисторов, что вдвое больше, чем было в чипе, на котором основан Radeon HD 5870! Естественно, что такой могучий чип стал возможен лишь благодаря применению нового техпроцесса 28 нм. Итак, что же у него есть внутри?

Количество геометрических блоков не изменилось, по сравнению с Cayman, их всё так же две штуки, но зато эффективность их работы значительно увеличена - мы остановимся на этом подробнее чуть позже. На схеме графического процессора мы видим 32 вычислительных блока архитектуры GCN, доступные на Radeon HD 7970, а в случае с младшим решением, некоторые из них будут отключены. Если считать пиковую вычислительную производительность решения, то она составляет почти 3,8 терафлопа (количество операций с плавающей запятой в секунду), что является абсолютным рекордом для GPU на сегодняшний день.

Каждый блок GCN имеет в своём составе по 16 текстурных блоков, что даёт итоговую цифру в 128 TMU на чип, или более чем 118 гигатекселей/сек - и это ещё один рекорд на сегодня, и он далеко не последний. А вот количество блоков ROP не изменилось, их всё так же 32 штуки в 8 укрупнённых блоках RBE. Ещё одно интересное архитектурное изменение - теперь блоки ROP «прикреплены» не к каналам памяти, как это было ранее, а к блокам GCN.

Хотя теоретически скорость записи во фреймбуфер почти не изменилась, и максимально возможны те же 32 значений цвета и 128 значений глубины за такт, практическая скорость заполнения (филлрейт) в реальных применениях значительно возросла из-за увеличенной пропускной способности памяти. По измерениям AMD, Cayman обеспечивал запись лишь 23 пикселей за такт, в то время как новый Tahiti приблизился к теоретическим 32 пикселям за такт.

Это и понятно, ведь новый видеочип компании AMD имеет 384-битную шину памяти - шесть 64-битных каналов, точно как и текущее топовое решение конкурента. Именно это полуторакратное увеличение ПСП и даёт возможность повысить реальную скорость текстурных выборок и записи во фреймбуфер. Пропускная способность в 264 ГБ/сек должна помочь выжимать близкие к теоретическим показатели в 118 гигатекселей/сек и 30 гигапикселей/сек, и в практической части мы это проверим.

Тесселяция и обработка геометрии

С архитектурной точки зрения, ничего особенного в геометрических блоках Tahiti со времен Cayman не изменилось. Используется всё так же по два блока для обработки (установка вершин и тесселяция) геометрических данных и растеризации, и схема весьма похожа на ту, что мы видели ранее, разве что тесселяторы названы аж 9-м поколением:

Несмотря на схематическое сходство, последнее поколение этих блоков способно на значительно большую производительность тесселяции и обработки геометрии, так как блоки подверглись значительным модификациям. Хотя пиковая производительность выросла лишь почти до двух миллиардов вершин и примитивов в секунду (925 МГц и две вершины а такт), реальная производительность выросла больше. Это было достигнуто при помощи увеличения объёма кэшей, улучшения буферизации геометрических данных и повторного использования вершинных данных.

В результате, производительность тесселяции улучшена при всех коэффициентах разбиения треугольников до четырёх раз, по сравнению с Radeon HD 6970 из предыдущего поколения. Но четыре раза достигаются не во всех случаях даже на диаграмме от самой AMD:

Диаграмма показывает сравнение производительности тесселяции Radeon HD 7970 по сравнению с HD 6970 при коэффициентах разбиения от 1 до 32. И, как вы видите, разница в производительности получилась от 1,7 до 4 раз. Но это - голая синтетика. И чтобы приблизиться к реальности, приведём ещё данные о скорости тесселяции уже в игровых приложениях:

Как видите, синтетические цифры AMD неплохо подкрепляются игровыми - производительность в реальных приложениях с «тяжёлой» тесселяцией значительно выросла. Это очень неплохой результат, который мы обязательно проверим в практической части, на примере синтетики и игровых приложений.

Неграфические вычисления

С точки зрения гетерогенных и неграфических вычислительных задач весьма важны появившиеся два асинхронных вычислительных движка (Asynchronous Compute Engines - ACE). Они предназначены для планирования и распределения работы между исполнительными блоками для эффективной многозадачности и работают вместе с графическим командным процессором (Command Processor).

Radeon HD 7900 имеет два независимых вычислительных движка и один графический. В сумме это даёт три программируемых блока и три потока команд, полностью отделённых друг от друга. А в дополнение к асинхронной подаче команд для быстрого переключения контекста, новый GPU также имеет два двунаправленных контроллера прямого доступа к памяти (DMA), появившиеся в Cayman. Эти два контроллера необходимы для того, чтобы полностью использовать возможности новой шины PCI Express 3.0.

Как мы знаем, с точки зрения серьёзных вычислений важна не только скорость выполнения операций с плавающей запятой с одинарной точностью, но и двойной (double precision floating point). И новая архитектура AMD весьма неплохо справляется с такой задачей. На данный момент предполагается существование двух версий вычислительных блоков GCN, имеющих разный темп исполнения FP64 инструкций. Для старшего GPU темп выполнения составляет 1/4 от скорости FP32, а для младших чипов выбран темп 1/16, что вполне достаточно для сохранения совместимости, но не слишком усложняет недорогие решения. В итоге, Radeon HD 7970 способен на 947 миллиардов операций двойной точности в секунду (эх, до терафлопа совсем же чуть-чуть не дотянули!) - налицо очередное высочайшее достижение нового чипа AMD.

Причём, это не те гигафлопы, что в случае предыдущих архитектур, а более «жирные». Ведь эффективность нового GPU в сложных вычислительных задачах должна серьёзно возрасти. Во-первых, улучшена подсистема памяти и кэширования. Во-вторых, каждый вычислительный блок GCN имеет свой планировщик, что должно улучшить исполнение ветвящегося кода и общую эффективность. Ну и в третьих отметим скалярное исполнение, не требующее сложных оптимизаций от компилятора, в результате чего вычислительные блоки будут гораздо реже простаивать. И в итоге в любых задачах новому чипу будет легче показать высокую производительность и загрузку ALU.

Из других нововведений, связанных с вычислительными возможностями, отметим полную поддержку ECC для DRAM и SRAM. С программной стороны важно, что Tahiti - это первый графический процессор с полной поддержкой новых версий API: OpenCL 1.2, DirectCompute 11.1 и C++ AMP и их возможностей. Например, OpenCL 1.2 позволяет объединять возможности нескольких вычислительных устройств в одно, и компания AMD уже выпустила соответствующую поддержку в виде AMD APP SDK 2.6 и драйвера Catalyst 11.12.

Производительность и эффективность архитектуры

После обзора всех архитектурных нововведений на примере топового чипа серии Southern Island настало время поговорить об эффективности всех этих изменений. Понятно, что производительность новых чипов гораздо выше, чем у предыдущих, обратное было бы весьма удивительно. Вопрос в том, насколько быстрее. В различных задачах получаются цифры от 40-50% (минимум!) до пятикратной разницы. Улучшения в архитектуре позволяют превысить теоретическую 1,4-кратную разницу по тупым гигафлопсам. Давайте рассмотрим это на примерах:

На диаграмме сравнивается новое топовое решение и предыдущее одночиповое: Radeon HD 7970 и HD 6970, что вполне справедливо. Тесты производительности выбраны различные: SmallptGPU и LuxMark - это рейтрейсинг на OpenCL, SHA256 - безопасный алгоритм хеширования, а AES256 - симметричный алгоритм шифрования. Ну а Mandelbrot - широко известная задача, рассчитанная с двойной точностью вычислений.

Вертикальной прерывистой линией на графике отмечена теоретическая разница в производительности, но данные о скорости показывают, что в трёх из пяти задач скорость нового GPU оказалась значительно выше. Это вызвано всеми изменениями, направленными на увеличение эффективности: уход от VLIW, наличие планировщика в каждом вычислительном блоке, улучшенное кэширование и т. п.

Изменения в качестве рендеринга

Собственно, эту часть вполне можно было бы и пропустить, так как к качеству изображения в последнее время особенных претензий уже нет и быть не может - по разным причинам. Например, качество полноэкранного сглаживания у видеокарт разных производителей весьма близкое, особенно учитывая широкое распространение программных методов сглаживания при помощи фильтров постобработки, выполняемых на всех GPU абсолютно одинаково.

То же самое касается и текстурной фильтрации - сейчас её качество таково, что отличить решения AMD и Nvidia весьма непросто даже если делать попиксельное сравнение. У Radeon HD 6900 - предыдущего поколения компании - анизотропная фильтрация улучшилась ещё немного, и теперь даже «микроскоп» не поможет найти там какие-то значительные недостатки. Единственное замечание в том, что в движении видеокарты Radeon немного уступали Geforce из-за более заметных специфических артефактов, вроде «шума» или «песочка».

С выходом видеочипов нового поколения веса текселей в текстурном фильтре пересмотрели ещё раз, модифицировав их так, чтобы снизить подобные артефакты, иногда видимые на Radeon HD 6900 при наличии текстур определённого вида («высокочастотных», с резкими переходами от тёмного к светлому, например). Изменения в качестве настолько трудно показать на примерах, что AMD не приводит сравнительные картинки HD 7900 против HD 6900, а просто сравнивает качество «аппаратного» алгоритма с чисто программным, выполняемым на потоковых процессорах GPU, а потому - идеальным:

На таком мелком скриншоте разницы в качестве не видно, но AMD уверяет, что все проведённые изменения не привнесли никакого падения производительности и ни в одном из аспектов не ухудшили качество картинки - оно всё так же не зависит от угла и качество фильтрации близко к идеальному. В одном из будущих практических материалов мы это обязательно проверим.

Частично резидентные текстуры (Partially Resident Textures)

Идея Partially Resident Textures (PRT) заключается в использовании аппаратной возможности представленного графического процессора - виртуальной памяти. Наверняка многие пользователи уже видели игру RAGE компании id Software, которая использует технологию виртуального текстурирования, так называемое мегатекстурирование («MegaTexture»), которое обеспечивает возможность использования огромных объёмов текстурных данных и подкачку (streaming) их в видеопамять.

Используя виртуальную видеопамять, очень легко получить эффективную аппаратную поддержку подобных алгоритмов, позволяющих применять в приложении до 32 терабайт текстур, что даёт возможность сделать уникальные локации в играх, без повторяющихся кусков текстур, при полном отсутствии проблем с подгрузкой текстурных данных. Правда, наглядный пример AMD приводит слишком странный, из которого ничего особо непонятно:

PRT позволяет добиться высокого качества картинки и помогает повысить эффективность использования видеопамяти. Подобные алгоритмы уже применяются в движке id Software, и ожидается их появление во многих движках следующего поколения. Игры будущего нуждаются в работе с огромными объёмами данных и преимущество нового GPU в том, что локальная графическая память в алгоритмах а-ля PRT работает как аппаратная кэш-память, и текстуры в неё подгружаются при необходимости. GPU семейства Southern Islands поддерживают «мегатекстуры» объёмом до 32 терабайт (разрешением до 16384×16384) и, что особенно важно, аппаратную текстурную фильтрацию для них, что недоступно на более ранних видеочипах.

Виртуальные текстуры разбиваются на куски размером 64 килобайта (именно килобайты, а не тексели) и этот размер куска фиксирован. И в локальную память видеокарты подгружаются только те из них, которые нужны при рендеринге текущего кадра. Технология работает независимо от текстурного формата, просто размеры кусков в текселях будут отличаться. Например, для обычной несжатой текстуры с 32 бит на цвет, размер куска будет 128×128 текселей, а для сжатой в DXT3-формат - 256×256 текселей.

Технология предполагает и использование мип-уровней текстур (уменьшенных копий, используемых при текстурной фильтрации). При рендеринге и фильтрации к ним требуется многократный доступ. Рассмотрим работу алгоритма на примере.

На этом рисунке выделены четыре разных куска из разных мип-уровней, требуемые при рендеринге. Когда шейдерная программа запрашивает данные из них, некоторые из кусков уже имеются в локальной памяти и эти данные сразу же отправляются в шейдер для дальнейших вычислений. Но некоторые куски отсутствуют в таблице, и приложение должно выбрать последующие действия при таком промахе. Например, можно запросить данные из мип-уровня меньшего разрешения, тогда изображение будет нечётким, но оно хотя бы будет похоже на правду и отрисуется без задержки. А к рендерингу следующего кадра оно уже может быть подгружено в кэш - локальную видеопамять. Игравшие в RAGE нас поймут.

Это - мощнейший алгоритм, позволяющий использовать огромные текстуры, уникальные для каждого из объектов. Аналогичные алгоритмы давно используются при оффлайн-рендеринге, за исключением необходимости расчётов в реальном времени. AMD даже сделала демо-программу, использующую технику наложения текстур Per-Face Texture Mapping, разработанную Walt Disney Animation Studios для их анимационных фильмов. К сожалению, демонстрационная программа ещё не готова, и мы видели лишь скриншоты низкого разрешения.

Суть данной техники наложения текстур в том, чтобы каждому полигону назначить определённый кусок текстуры, без необходимости использования UV-преобразования (нахождения соответствия между координатами поверхности трёхмерного объекта и координатами на двухмерной текстуре). Такой подход решает некоторые проблемы с созданием тесселированного контента, делая алгоритм смещения векторов (displacement mapping) очень простым. А PRT в этом методе используется для эффективного хранения и доступа к текстурных данным.

Инструкции по обработке медиаданных

Интересным нововведением в Southern Islands кажется поддержка специализированных инструкций, используемых при обработке изображений, статичных и динамических. Например, была улучшена широко используемая инструкция под названием «сумма абсолютных разностей», более известная как SAD (Sum of Absolute Differences). Скорость её исполнения - весьма критичное к производительности узкое место многих алгоритмов обработки изображений и видеоданных, вроде определения движения (motion detection), распознавания жестов (gesture recognition), поиска по изображениям, компьютерного зрения и многих других.

Но постойте, в обзоре древней видеокарты Radeon HD 5870 мы уже писали о поддержке SAD! Всё правильно, но теперь кроме обычного SAD (4×1) в Southern Islands появилась новая инструкция - QSAD (счетверённый SAD), объединяющая SAD с операторами сдвига для увеличения производительности и энергоэффективности, а также «маскируемая» инструкция MQSAD, игнорирующая пиксели заднего плана и используемая для изоляции движущихся в кадре объектов от фона.

Новые GPU могут обрабатывать до 256 пикселей на каждый вычислительный блок GCN за такт, что в случае модели AMD Radeon HD 7970 означает возможность обработки до 7,6 триллионов пикселей в секунду в случае 8-битных целочисленных значений цвета. Хотя это теоретическая цифра, возможности новых графических процессоров по обработке визуальных данных весьма впечатляют - многие задачи по обработке видео можно будет выполнять в режиме реального времени.

PCI Express 3.0

Не могли мы пройти и мимо поддержки третьей версии PCI Express всей линейкой новых графических решений Southern Islands, выпущенных сегодня и будущих. Эта поддержка была вполне ожидаемой, так как спецификации третьей версии PCI Express окончательно утвердили ещё осенью 2010 года, но аппаратных решений с её поддержкой до сих пор не было, хотя системные платы уже появляются, видеокарты выпущены сегодня, теперь дело за центральными процессорами.

Обновленный интерфейс обладает скоростью передачи 8 гигатранзакций в секунду вместо 5 ГТ/с для версии 2.0, и его пропускная способность ещё раз выросла вдвое (до 32 Гб/с), по сравнению со стандартом PCI Express 2.0. В новой шине применяется другая схема кодирования пересылаемых по шине данных, но совместимость с предыдущими версиями PCI Express была сохранена.

Первые системные платы с поддержкой PCI Express 3.0 были представлены летом 2011, в основном базе чипсета Intel Z68, а в широкой продаже они появились лишь осенью. Вот и видеокарты подоспели, и AMD по скорости выхода новых графических процессоров с поддержкой самых совершенных технологий снова стала впереди планеты всей. Будет ли от PCI-E 3.0 какой-то практический толк - судить слишком рано, но когда такая возможность появится, мы обязательно протестируем все возможные варианты.

Технология AMD PowerTune

Одним из самых интересных нововведений в Cayman была технология расширенного управления питанием PowerTune. Гибкое управление питанием GPU уже давно применялось, но до Radeon HD 6900 все эти технологий были довольно примитивными и в основном программными методами и изменяли частоту и напряжение ступенчато, не умея отключать большие части видеочипов.

Ещё в семействе Radeon HD 5000 появился ограничитель производительности при превышении определённого уровня потребления, а в Radeon HD 6900 система перешла на качественно иной уровень. Для этого в чип включили специальные датчики во все блоки, которые отслеживают параметры загрузки. Графический процессор постоянно измеряет нагрузку и энергопотребление и не позволяет последнему выйти за определённый порог, автоматически регулируя частоту и напряжение, чтобы параметры оставались в рамках указанного теплопакета.

В отличие от ранних технологий управления питанием, PowerTune обеспечивает прямой контроль над энергопотреблением GPU, в отличие от косвенного управления при помощи изменения частот и напряжений. Эта технология помогает установить высокие частоты GPU, получив высокую производительность в играх, и не бояться, что потребление может выйти за безопасные пределы. Ведь большинство игр и обычных приложений, использующих вычисления на GPU, предъявляют значительно менее высокие требования к питанию и не подходят к опасным пределам энергопотребления, в отличие от тестов стабильности, вроде Furmark и OCCT.

Даже самые тяжёлые игры не требуют максимального потребления энергии, и если ограничить потребление частотой, испытывая видеокарты экстремальными тестами, то в случае 3D-игр останется довольно много неиспользованных возможностей по производительности и питанию. В случае, когда видеокарта не достигла предела безопасного уровня потребления, GPU будет работать на выставленной на фабрике частоте, а в тестах FurMark и OCCT, частота GPU понизится, чтобы оставаться в рамках потребления.

Таким образом, PowerTune помогает выставить более высокие фабричные частоты и настроить систему на максимально эффективное использование ресурсов GPU при установленном максимальном уровне потребления. На показанном выше примере, HD 5870 не использует PowerTune и из-за ограничения частоты GPU высоким потреблением в тестах выносливости не использует все свои возможности. В то время как для Radeon HD 7970 установлен максимальный TDP, и видеочип сбрасывает частоты лишь при его превышении, получая максимально возможную производительность в любых приложениях.

Наглядно это показано на следующей диаграмме. В случае игровых приложений достижение TDP возможно при повышении частоты GPU, а для пиковых нагрузок тестами выносливости частота снижается до безопасного уровня энергопотребления. Без PowerTune пришлось бы выбирать - или получить вероятность выхода из строя видеокарты при длительной работе FurMark и OCCT, или урезать потенциально возможную производительность в играх. Новая технология решает эти вопросы максимально эффективно.

AMD PowerTune отличается быстрой отзывчивостью на изменение условий (микросекунды), так как это аппаратная технология. Также её отличает гибкая настройка частот, а не ступенчатая, как это было в предыдущих чипах. Все измерения не зависят от драйвера, но могут быть скорректированы пользователем при помощи настроек видеокарты.

Отличия PowerTune от общепринятого ранее подхода в том, что в других случаях используется защита от перегрева (thermal throttling), которая переводит графический процессор в режим значительно пониженного потребления, а PowerTune просто плавно снижает его частоту, приводя потребление GPU к установленному ограничителю. При этом достигаются более высокие тактовые частоты и производительность.

Технология AMD ZeroCore

Компания AMD не ограничилась применением уже известной по предыдущим решениям технологии управления питанием. В первых чипах семейства Southern Islands она представляет технологию AMD ZeroCore, которая помогает добиться ещё большей энергетической эффективности в режиме «глубокого простоя» (или «сна») с отключенным устройством отображения, который поддерживается всеми операционными системами.

Ведь практически любая система, даже игровая, большую часть времени проводит в режиме низкой нагрузки на графический процессор. И видеокарта не должна потреблять много энергии в таком режиме. И уж тем более не говоря о режиме с отключенным монитором - в этом случае GPU желательно вовсе отключить. Так в AMD и сделали. Благодаря ZeroCore, в состоянии глубокого простоя новый GPU потребляет менее 5% энергии полноценного режима, отключая большинство функциональных блоков в этом режиме.

AMD приводит схематическое сравнение со своей же Radeon HD 5870, которая поддержкой такой технологии не обладала. ZeroCore - эксклюзивное нововведение Southern Islands, пришедшее в настольные решения из мобильных GPU, предназначенных для ноутбуков. Кстати, преимущества этой технологии связаны не только со снижением потребления. Кроме этого, в режиме длительного простоя при отключении дисплея видеокарта ещё и полностью выключает вентилятор на кулере видеокарты!

Это именно то, чего давно ждали многие пользователи. Самое интересное, что по нашим данным, лабораторные испытания подобных PowerTune и ZeroCore решений проходили ещё несколько поколений видеокарт назад. Некоторые из инженерных сэмплов видеокарт давно ушедших с рынка серий компании AMD именно так и работали, полностью отключая кулер в простое.

Но не только пользователи систем с одной видеокартой получат бонус от снижения шума и потребления энергии с новыми видеокартами AMD с поддержкой ZeroCore. Аналогичные улучшения ожидают и счастливых владельцев CrossFire систем на базе двух, трёх и даже четырёх GPU. Логично ведь, что в режиме отрисовки двухмерного интерфейса операционной системы все видеокарты, кроме главной, не должны бы работать вовсе? Но ведь сейчас они работают именно так!

В случае же CrossFire систем на видеокартах с поддержкой ZeroCore в 2D-режиме все вторичные видеокарты погружены в глубокий сон с минимальным потреблением энергии и отключенным кулером. Такой режим работает и для нескольких одночиповых видеокарт и для двухчиповых решений. Кроме того, первичная видеокарта CrossFire также будет переходить в такой режим в случае длительного простоя, настроенного в Windows. Наглядно разница в работе выглядит так:

Кстати, технология не так проста, как может показаться. Инженерам AMD пришлось решить массу вопросов, связанных с работой операционной системы в режиме простоя. Например, они выяснили, что Windows пытается обновлять информацию на экране даже при отключенном мониторе. Что, естественно, не позволяет отключить GPU вовсе. Поэтому программистам компании пришлось пойти обходным путём, игнорируя все команды отрисовки экрана при отключенном мониторе в режиме сна.

Технология AMD Eyefinity 2.0

Естественно, что в новой архитектуре нашлось место и для улучшений проверенной технологии вывода изображения на несколько мониторов - AMD Eyefinity, теперь в версии 2.0. Она получила новые возможности, большие разрешения, поддержку большего количества дисплеев и расширение гибкости.

Эта технология довольно интересна, хотя крайне малое количество пользователей найдёт в комнате место и наберётся смелости перед семьёй для установки более чем двух мониторов. Но лучше иметь возможность, чтобы всегда смочь ей воспользоваться, чем не иметь её вовсе. Тем более, что цены на мониторы больших диагоналей почти не снижаются, а вот решения среднего уровня постоянно дешевеют.

И действительно, сейчас выгодне купить три монитора с диагональю экрана в 24″, чем один 30-дюймовый. AMD приводит именно такой пример, когда 30″ монитор с разрешением 2560×1600 стоит более $1000, а три 24″ FullHD можно купить за половину этой цены:

Но как тратить свои деньги и пространство в комнате - это личное дело каждого пользователя. Главное, что такая возможность есть. Плюс к этому, Eyefinity 2.0 теперь поддерживает вывод изображения и в стереорежиме HD3D - то, чего не хватало в предыдущих решениях, которые по этому параметру уступали конкурирующим. Объединившая технологии AMD Eyefinity и HD3D видеокарта Radeon HD 7970 является первым одночиповым решением с поддержкой трёх мониторов, работающих в стереорежиме.

Для стереорендеринга в высоком разрешении нужен очень быстрый интерфейс передачи данных. И с предыдущими версиями HDMI выходов, возможности были ограничены 24 Гц на каждый глаз, что вполне достаточно для просмотра кино на Blu-ray 3D, но для любителей игр явно слишком мало.

Для таких задач стали применять формат frame packing, когда кадры для левого и правого глаза объединяются в один, и AMD Radeon HD 7970 поддерживает формат HDMI 1.4a frame packing для вывода стереокартинки. Это первая видеокарта с поддержкой 3-гигагерцового HDMI с frame packing, когда на каждый глаз приходится FullHD картинка с частотой 60 Гц (120 Гц в итоге):

Ещё одной любопытной новинкой нам кажется технология многоканального вывода звука Discrete Digital Multi-Point Audio (DDMA), работающая вместе с Eyefinity. Все предыдущие GPU способны выводить по HDMI и DisplayPort лишь по одному аудиопотоку. То есть, даже если к ПК подключены по HDMI три монитора, находящиеся в разных комнатах, то звуковой канал передаётся лишь один. А вот AMD Radeon HD 7900 получил поддержку одновременного вывода сразу нескольких независимых аудиоканалов, что вполне может пригодиться в некоторых мультимониторных конфигурациях.

Эта же возможность будет весьма полезной для применения в сфере видеоконференций с выводом нескольких собеседников на отдельные экраны, а также многозадачного применения вроде игры на трёх мониторах с игровым аудиосопровождением и просмотром новостей на отдельном экране с независимым звуковым потоком. Ранее для всего этого приходилось применять несколько отдельных аудиосистем, а теперь всё работает максимально удобно.

Не забыта и программная поддержка Eyefinity, почти каждый месяц технология обновляется - появляются новые возможности. Так, ещё в октябре появилась поддержка разрешений вплоть до 16384×16384 и новые мультимониторные конфигурации: горизонтальные и вертикальные 5×1, а также на основе шести мониторов в режиме 3×2.

В декабрьском обновлении видеодрайвера AMD Catalyst стала возможной совместная работа Eyefinity и HD3D, а в феврале обещают поддержку пользовательских разрешений, настройки размещения панели задач и улучшения управления наборами настроек.

Вывод изображения на шесть мониторов может быть осуществлён при помощи двух портов DisplayPort 1.2 и двух концентраторов MST (о которых мы писали ранее), а три или даже четыре монитора потребуют лишь одного порта и соответствующего концентратора. Такие концентраторы позволяют гибко конфигурировать систему вывода изображения, они поддерживают до четырёх FullHD-устройств на один разъём DisplayPort 1.2 и должны появиться в продаже к лету 2012 года.

К слову о разрешении. Высоком разрешении или даже ультравысоком - Ultra High Resolution. Нынешние устройства с разрешением 4000 пикселей по большей стороне требуют подключения при помощи сразу нескольких кабелей: двух DP 1.1 или четырёх DVI. Мониторы такого разрешения следующего поколения будут подключаться лишь по одному кабелю: DP 1.2 HBR2 или HDMI 1.4a 3 ГГц. И новая видеокарта компании AMD уже готова к таким мониторам, снова она стала первой в мире.

Кодирование и декодирование видеоданных

Вполне естественно, что в состав AMD Radeon HD 7970 включён всё тот же блок UVD для декодирования видеоданных, появившийся ещё в предыдущем поколении видеочипов компании. Он просто не нуждается в доработках, поддерживая многопоточный кодек MVC, декодирование форматов MPEG-2/MPEG-4 (DivX), VC-1 и H.264, а также декодирование двух FullHD-потоков во всех поддерживаемых форматах.

Решения AMD обеспечивают максимальное качество декодирования видеопотока, используют несколько десятков специальных алгоритмов улучшения качества и обеспечивают максимальный результат в тестах качества вроде HQV. Среди поддерживаемых особенностей отметим: регулировку цвета и тона, шумоподавление, повышение резкости, качественное масштабирование, динамическую контрастность, продвинутый деинтерлейсинг, а также inverse telecine. Вот пример улучшения контрастности на лету:

Но с декодированием у всех видеочипов давно всё более-менее в порядке. Все новые GPU обеспечивают приличное качество и производительность при просмотре видеоданных. А вот кодирование видео на GPU всё ещё пребывает в зачаточной стадии и основные претензии пользователей направлены на низкое качество получаемой сжатой картинки.

Возможно, новая серия Radeon HD 7000 сможет помочь и в этом, ведь все графические процессоры серии имеют в своём составе блок кодирования видео Video Codec Engine (VCE). Модель Radeon HD 7970 стала первой видеокартой с поддержкой аппаратно ускоренного кодирования и сжатия видео при помощи специализированного блока (ранее в кодировании принимали участие потоковые процессоры).

Качество и производительность должно быть явно лучше, чем раньше, поддерживается кодирование в формат 1080p при 60 кадрах в секунду, причём даже быстрее, чем в реальном времени. Про качество сказать без тестов что-то сложно, но нам обещаны разные уровни оптимизации кодера для видеоданных и игр, а также изменяемое качество сжатия (возможность выбирать между повышением качества или производительности).

Пока что опробовать VCE негде - приложений с его поддержкой просто нет, но компания AMD работает с партнёрами, такими как ArcSoft, для обеспечения поддержки VCE в соответствующих программных продуктах. В будущем планируется выпуск программной библиотеки для ускорения кодирования видеоданных, которая облегчит задачу разработчиков по поддержке продукции AMD нового поколения.

Кодирование может производиться в двух режимах: полное и гибридное (с использованием возможностей потоковых процессоров GPU). Полный режим разработан для задач, которые требуют максимальной энергоэффективности и постоянного уровня производительности. Кодирование в полном режиме на VCE быстрее реального времени и обеспечивает низкие задержки. Но есть и гибридный режим:

В таком режиме вместе с VCE работают и математические блоки GPU. Все хорошо распараллеливающиеся стадии, которые обведены жёлтой линией на схеме, могут использовать мощь вычислительных блоков GCN, а выделенный блок VCE занимается эффективным аппаратным энтропийным кодированием. Такой режим хорошо подходит для видеокарт с большой математической мощью, вроде Radeon HD 7970. Остаются вопрос к качеству этих двух режимов, но это требует тщательного анализа в отдельном материале.

AMD Steady Video

Кроме кодирования и декодирования видеоданных, есть и ещё одна область применения мощи новой графики от компании AMD - улучшение видеороликов плохого качества, снятых с рук, без использования штатива и других аналогичных средств стабилизации изображения. Технология стабилизации видео называется AMD Steady Video, и уже выпущена её вторая версия.

Алгоритм работы программного стабилизатора довольно прост: на основе видеопотока собирается статистика о движении камеры (сдвиг, вращение, приближение) и это движение компенсируется в текущем кадре, относительно предыдущих - изображение сдвигается, поворачивается и масштабируется так, чтобы картинка сильно не прыгала и оставалась стабильной.

Насколько это просто на словах, настолько же сложно в реализации. Просто потому, что пикселей на экране два миллиона, а кадров в секунду до 30 или даже 60. Представьте, сколько вычислений нужно проделать, чтобы отследить все возможные смещения кадра. Мы уже писали выше о функции QSAD, применяемой в видеообработке, как раз она используется и в Steady Video 2.0 для ускорения алгоритма определения движения. Так вот GPU должен обрабатывать случайные сдвиги с амплитудой до 32 пикселей в любом направлении и для этого требуется производительность, соответствующая более чем 500 млрд. операций SAD в секунду (для 1920×1080 при 60 FPS).

За счёт поддержки новых инструкций QSAD в представленном сегодня Radeon HD 7970, его преимущество над мощными CPU в алгоритме motion detection превышает 10x! То есть, качественное видео нам теперь будет обеспечено, причём не только при обработке домашних роликов в видеоредакторах, но и просмотре чужих онлайновых видеороликов, снятых неизвестно чем и неизвестно как. Ну хотя бы трястись всё теперь так не будет…

Программная поддержка

Читатели давно нас спрашивают - когда ж польза от неграфических вычислений на GPU наконец-то достигнет обычных пользователей? Ведь кодированием видео занимаются далеко не все, а вот со сжатием и архивированием любых типов данных сталкивается практически каждый и довольно часто. Что же, у нас есть хорошая новость не только для энтузиастов 3D-графики, но и для нормальных людей - поддержка чипов AMD Fusion и Radeon появилась в широко известном архиваторе WinZip 16.5.

Это приложение известно давно и хотя лучшие его годы позади и уже придуманы более мощные методы сжатия, формат ZIP остаётся одним из наиболее распространённых и быстрых для архивации и сжатия различных типов данных. И теперь он станет ещё быстрее!

Работая в сотрудничестве с AMD, разработчики WinZip смогли ускорить движок этого пакета, используя возможности GPU при помощи OpenCL. Естественно, на GPU пока что ускоряется не всё, но сжатие в формат Deflate (комбинация алгоритмов LZ77 и Хаффмана), декомпрессия Inflate и AES-шифрование получат преимущества от исполнения на потоковых процессорах GPU. Интересно, что OpenCL позволяет даже распределять нагрузку между CPU и GPU, используя оба устройства.

Но топовые видеокарты вроде Radeon HD 7970 предназначены скорее для игровых приложений. Самых современных и работающих на максимальных настройках. Команда программистов AMD находится в постоянном контакте с множеством игровых разработчиков, помогая им внедрять современные технологии, поддерживаемые графическими процессорами компании. AMD всегда поддерживала игровую ПК индустрию, так как они напрямую заинтересованы в её процветании. Так, в 2010 году на игры было потрачено 16,2 миллиарда долларов, а на игровое аппаратное обеспечение для ПК покупатели потратили $16,6 млрд (по оценкам аналитиков, в текущем году цифра вырастет до $22 млрд.). Понятно, что AMD хочет получить часть этих денег.

В наступающем году ожидается большое количество интересных игр, которые выйдут на ПК. Среди таких проектов, к созданию которых AMD приложила руку и которые выйдут в первом полугодии, можно отметить: Blacklight: Retribution, Syndicate, Sniper Elite 2, Max Payne 3, Hitman: Absolution и другие. Но ждать следующего года не обязательно, совсем недавно вышло первое дополнение популярнейшей игры - Battlefield 3: Back to Karkand. Движок там используется всё тот же Frostbite 2, но дополнение Back to Karkand отличается улучшенной разрушаемостью уровней и включает четыре переработанные многопользовательские карты из Battlefield 2, новые транспортные средства, оружие и др. Скриншоты смотрятся просто замечательно:

Чтобы статья была максимально полной, упомянем и основное нововведение AMD Catalyst 12.1 - пользовательские профили для 3D-приложений, позволяющие изменять базовые настройки качества и установки CrossFire отдельно для каждой программы (наконец-то AMD догнала конкурентов):

Ну и чтобы дать закипающим мозгам наших читателей отдых от столь скурпулёзного описания возможностей нового продукта компании AMD, мы наконец-то покажем что-то развлекательное - скриншот из демонстрационной программы, сделанной компанией к анонсу первых решений из семейства Southern Islands. Демка называется «Leo» и показывает забавную сказочную сценку с применением современных графических технологий:

После того, как мы познакомились с теоретическими аспектами новой архитектуры, а также характеристиками и функциональными возможностями Radeon HD 7970, самое время обратиться к практике. Следующая часть материала посвящена практическому исследованию скорости рендеринга новой видеокарты AMD в чисто синтетических тестах. В ней мы определим, как производительность первого решения семейства Southern Islands соотносится со скоростью предыдущих решений компании AMD, а также конкурирующих видеокарт компании Nvidia из верхнего ценового диапазона.

AMD Radeon HD 7970 - Часть 2: видеоплата и синтетические тесты →