Специалисты Chipworks изучили процессор Apple A8 и сравнили с A7. Процессор Apple A8X для iPad стал большой проблемой для Intel, Qualcomm, Samsung и NVIDIA

06.05.2019 Игры

Как правило, мобильные устройства Apple последнего поколения занимают далеко не самые последние позиции в различных бенчмарках, а используемые в их основе SoC отличаются достаточно высоким уровнем производительности как по части CPU, так и по части GPU. И если получить достаточно полное представление о производительности позволяют эти самые бенчмарки, то понять, чем же она обеспечивается, — задача не из легких, поскольку для Apple не свойственно делиться детальными техническими характеристиками.

Без снимка кристалла A8X рассуждения на тему характеристик новейшей SoC можно сравнить с гаданиями на кофейной гуще. Известно было лишь, что в конфигурацию этой однокристальной платформы входят три улучшенных процессорных ядра Cyclone и 2 МБ кэш-памяти второго уровня (L2). Эту информацию раскрывает ОС, за что ей большое спасибо. Настоящей загадкой до недавнего времени оставалась графическая составляющая A8X. Операционная система iOS не давала ответа на вопрос о конфигурации и производительности GPU, данные показатели являлись частью сложного уравнения с множеством переменных и во многом зависят от значения рабочей частоты GPU и количества унифицированных кластеров (Unified Shading Clusters, USC).

Ранее журналисты AnandTech, опираясь на свои внутренние результаты тестирования и предоставленную Apple информацию, сделали предположение, что за обработку графики в A8X отвечает PowerVR GX6650, самое мощное решение из линейки графических ускорителей Imagination Technologies. Однако в результате более детального анализа тестов и изучения снимка кристалла A8X, полученного от Chipworks, в AnandTech пришли к выводу, что в новом чипе Apple используется еще более сложный GPU с 8-кластерным дизайном.

На днях Imagination анонсировала графику следующего поколения PowerVR Series7. И хотя отгрузки новых GPU не начнутся раньше следующего года, из анонса стало ясно, что модель Series7XT может масштабироваться до 16 кластеров USC – вдвое больше, нежели Series6XT. Именно это привернуло внимание журналистов и заставило провести более детальный анализ. Дело в том, что Imagination никогда не выпускала модель с 8-кластером дизайном и применяемый в A8X теоретически должен носить название GXA6850.

На предоставленном ресурсом Chipworks снимке кристалла хорошо видны все восемь кластеров GPU и выглядит все так, как будто перед нами два GX6450, расположенных бок о бок. Как уже отмечалось выше, у Imagination нет 8-кластерного дизайна Series6XT. Иначе говоря, Apple воспользовалась расширенной лицензией и создала собственный дизайн GPU с 8 кластерами на основе GX6450. Его неофициальное название – GXA6850.

Площадь кристалла A8X, выпускаемого, по предварительным данным, TSMC по нормам 20-нм техпроцесса, составляет 125 мм 2 (12,5х10 мм), что немного больше по сравнению с 28-нм чипом NVIDIA GK107 (118 мм 2), но меньше площади 2-ядерного 22-нм процессора Intel Haswell 2C+GT2 (130 мм 2). Что касается количества транзисторов и, соответственно, сложности структуры A8X, в его состав входит около 3 млрд транзисторов. По количеству транзисторов A8X превосходит не только два вышеупомянутых чипа, но и даже 4-ядерный CPU Intel Haswell 4C+GT3 (1,7 млрд транзисторов), занимая свое место между GPU NVIDIA GK104 (3,5 млрд транзисторов) и GK106 (2,5 млрд транзисторов). На графическую составляющую отводится примерно 30% площади кристалла A8X (38 мм 2).

Суммарное количество блоков FP32 ALU в GPU A8X составляет 256, или 32 на один кластер. Графический процессор поддерживает OpenGL ES 3.1. В численном выражении производительность составляет 512/1024 (FP32/FP16) FLOPS и 16 текселей за такт в 8-кластерной конфигурации. Для сравнения, производительность модели PowerVR GX6650 (192 блока FP32 ALU) составляет 384 (в режиме FP32) или 768 (FP16) FLOPS и 12 текселей за такт.

По мнению журналистов AnandTech, Apple приняла решение отказаться от 6-кластерного дизайна в пользу 8-кластерного не столько для повышения производительности, хотя 30% прирост над iPhone 6 Plus по показателю графической мощности в расчете на один пиксель выставляет iPad Air 2 в более приглядном свете, сколько для увеличения пропускной способности шины памяти. Шина шириной 128-бит требует много контактов, которые нужны и для других компонентов SoC: флэш-памяти, дисплея, звука, USB, Wi-Fi, и т.д. Этого можно было добиться только увеличив площадь чипа, поэтому Apple решила добавить два дополнительных кластера GPU, что соответствует примерно 10 мм 2 .

С 256 процессорными блоками FP32 ALU в SoC A8X компания Apple практически вплотную приблизилась к возможностям настольных видеокарт начального уровня. Как бы там ни было, но платформы Apple A8X и NVIDIA Tegra K1 в настоящее время с точки зрения графической производительности достаточно хорошо смотрятся в сравнении с остальными планшетными SoC.

Apple, как правило, не раскрывает все особенности своих мобильных продуктов, так что дело приходится брать в свои руки независимым исследователям. Помимо оценивающего ремонтопригодность портала iFixit внутрь новых iPhone 6 и iPhone 6 Plus заглянули специалисты с сайта Chipworks, изучившие новый процессор Apple A8. Чуть позже этот кристалл найдет своё применение и в обновлённых iPad Air и iPad mini третьего поколения.

Процессор A8 произведён на предприятиях тайваньской компании TSMC по 20 нм технологическому процессу, тогда как прошлый чип А7 на 28 нм техпроцессе выпускала Samsung. Это первый раз, когда чип для Apple выпускает не южнокорейская компания, хотя слухи о намерении Apple снизить зависимость от своего главного конкурента на рынке мобильных устройств ходили уже давно.

Однако зависимость эта пока не снята окончательно, и примерно 40% процессоров, по данным информированных источников, продолжает производить Samsung. За счёт перехода на более передовой технологический процесс удалось увеличить количество транзисторов до 2 млрд. При этом площадь кристалла составляет 89 мм², что на 13% меньше, чем у A7 (102 мм²)


Процессор 2-ядерный, так что Apple не спешит ввязываться в гонку наращивания числа ядер, как это делают Android-производители. Используемые ядра являются производными от первого 64-битного процессора Apple Cyclone на архитектуре ARMv8. Кеш L2 реорганизован для работы с каждым ядром отдельно, для CPU и GPU имеется общий кеш памяти типа SRAM объёмом 4 Мб.


Графическим чипом является 4-ядерный Imagination Technologies GX6450, обеспечивающий по сравнению с А7 рост производительности на 50%. Наиболее это заметно в 64-разрядных играх и приложениях. Также по сравнению с А7 реже происходит троттлинг процессора при большой нагрузке.

На презентации iPhone 7 в сентябре 2016 года Apple похвасталась, что за десять лет производительность процессоров в iPhone выросла аж в 120 раз:

Цифра мне показалась великоватой, так что давайте ее проверим. Однако есть одна проблема - самый первый iPhone получил поддержку лишь iPhone OS 3.1.3, тогда как, например, минимальная iOS для iPhone 7 - это 10. И поэтому мне удалось найти лишь один бенчмарк, тестирующий производительность процессора и работающий на всех версиях iOS - это Geekbench 2. Да, его актуальность уже под вопросом - к примеру, он не поддерживает х64 инструкции, однако для оценки производительности его вполне хватит.

  • iPhone 2G (Samsung S3C6400 ARM11 620 МГц, работающий на частоте 412 МГц, 65 нм, 128 Мб EDRAM, 2007 год) - 150 очков.
    Самый первый айфон вышел почти 10 лет назад, в 2007 году. Железо сейчас вызывает улыбку - 400 МГц процессор и 128 Мб ОЗУ даже в умные часы уже никто не ставит. Однако на момент выхода оно было достаточно мощным, и из-за закрытости iPhone OS первый iPhone работал достаточно быстро.
  • iPhone 3G (Samsung S3C6400 ARM11 620 МГц, работающий на частоте 412 МГц, 65 нм, 128 Мб EDRAM, 2008 год) - 150 очков
    Основным техническим изменением в iPhone 3G была поддержка 3G (откуда, собственно, и название). Все остальное железо осталось тем же, так что результат в бенчмарке тот же.
  • iPhone 3GS (Samsung S5PC100 ARM Cortex A8 833 МГц, работающий на частоте 600 МГц, 65 нм, 256 Мб EDRAM, 2009 год) - 300 очков.
    Литеру S в этом iPhone расшифровывали как Speed - скорость, и есть почему: процессор перешел с архаичной ARM11 середины нулевых на современную (по тем меркам) Cortex A8, и несколько нарастил частоту - в итоге он стал вдвое быстрее. Удвоенный объем ОЗУ позволил лучше использовать многозадачность, и в итоге телефон обновлялся вплоть до 2013 года - последней ОС для него была iOS 6.
  • iPhone 4 (Apple A4 ARM Cortex A8 1 ГГц, работающий на частоте в 800 МГц, 45 нм, 512 Мб EDRAM, 2010 год) - 400 очков.
    Это первый iPhone, где процессор был частично сделан Apple, однако в основном он все еще был построен на Cortex A8. Оптимизации ядра, рост его частоты и увеличенный вдвое объем ОЗУ делали iPhone 4 на 25% быстрее 3GS, однако, увы, на последней для него версии iOS 7 он работал достаточно медленно.
  • iPhone 4S (Apple A5 ARM Cortex A9 1 ГГц, работающий на частоте в 800 МГц, 2 ядра, 32 нм, 512 Мб LPDDR2, 2011 год) - 860 очков.
    Первый двухядерный процессор в iPhone, использующий новую (по тем временам) архитектуру Cortex A9, однако частота ядер осталась прежней - 800 МГц, так что результат стал в среднем в 2 раза выше. Это самый популярный процессор от Apple - он ставился кроме iPhone 4S еще и в iPod Touch 5, iPad 2/3/Mini (в них частота была увеличена до 1 ГГц). Увы - возможности процессора все же не безграничны, и на iOS 9 перечисленные выше устройства работают достаточно медленно.
  • iPhone 5 (Apple A6 Swift 1.2 ГГц, 2 ядра, 32 нм, 1 Гб LPDDR2, 2012 год) - 1680 очков.
    Наконец-то частота процессора в iPhone переползла за 1 ГГц. К тому же это первый процессор, в основном построенный на собственной архитектуре Apple - Swift (однако так же частично была задействована архитектура Cortex A15) - это позволило практически вдвое увеличить производительность процессора. Вкупе с 1 Гб ОЗУ телефон неплохо работает даже на самой современной на данный момент iOS 10.
  • iPhone 5S (Apple A7 Cyclone 1.3 ГГц, 2 ядра, 28 нм, 1 Гб LPDDR3, 2013 год) - 2250 очков.
    Этот iPhone можно назвать, пожалуй, самым прорывным по технологиям - это был первый телефон на х64 процессоре, построенный полностью на собственной архитектуре Apple - Cyclone. Производительность внушала уважение - двухядерный A7 с частотой в 1.3 ГГц находился на уровне топового тогда Snapdragon 800 - 4ядерного монстра с частотой до 2.2 ГГц! Пожалуй, этот iPhone можно назвать актуальным - он летает на iOS 10 и поддерживает большинство приложений из App Store.
  • iPhone 6 (Apple A8 Cyclone v2 1.4 ГГц, 2 ядра, 20 нм, 1 Гб LPDDR3, 2014 год) - 2470 очков.
    В iPhone 6 Apple сконцентрировалась на дизайне, так что производительность выросла незначительно. В итоге процессор оказался значительно хуже топового на тот момент Snapdragon 805, что, в прочем, не повлияло на его работу из-за хорошей оптимизации iOS.
  • iPhone 6S (Apple A9 Cyclone v3 1.85 ГГц, 2 ядра, 14 нм, 2 Гб LPDDR4, 2015 год) - 3170 очков.
    В 6S Apple сконцентрировалась на производительности - процессор стал на 40% быстрее, и, наконец-то, спустя три года, объем ОЗУ вырос до 2 Гб. На момент выхода процессор конкурировал на равных с самыми мощными представителями линеек Snapdragon и Exynos, да и сейчас отстает от топа не так уж и сильно, на 20-30%.
  • iPhone 7 (Apple A10 Fusion, 2 ядра по 2.34 ГГц и 2 по 1.05 Ггц, 14 нм, 2/3 Гб LPDDR4, 2016 год) - 3650 очков.
    Спустя 5 лет с момента выхода своего первого двухядерного процессора Apple выпустила 4ядерный процессор для iPhone, построенный по технологии big.LITTLE - для тяжелых задач используется кластер из 2 мощных ядер, для простых - кластер из 2 слабых, одновременно они работать не могут. К тому же впервые между простой линейкой и Plus возникло серьезное различие в железе - у 7 Plus 3 Гб ОЗУ против 2 у 7, что позволяет ему лучше использовать многозадачность. Процессор оказался настолько мощным, что iPhone 7+ до сих пор удерживает Топ-1 в Antutu.
Что же мы видим в итоге? iPhone 2G набирает в бенчмарке 150 очков, iPhone 7 - 3650, то есть производительность процессора увеличилась... всего в 24 раза. Разумеется, бенчмарк не является точным показателем производительности устройства (к тому же не использует х64 инструкции, которые могут увеличить производительность еще на 20-30%), но все же между приростом в 24 раза по бенчмарку и в 120 раз по словам Apple разница в 5 раз, так что или Apple где-то обсчиталась, или использовала свой собственный, никому больше неизвестный, бенчмарк.

Сводный график:


Как видно, застоя в мобильном сегменте нет и близко - если у Intel и AMD прирост за поколение не превышает 5-10%, то здесь прирост может быть и двухкратным. И это понятно - мобильные процессоры все время были в роли догоняющих, и использовали наработки десктопных процессоров, поэтому и развились так быстро. Причем, что самое интересное, мобильные процессоры уже стали технологичнее десктопных - если Intel «увяз» на 14 нм аж на три года, а AMD только-только выпустила свои решения на этом техпроцессе, то новый Snapdragon 835 уже построен по нормам 10 нм техпроцесса, и скоро появится в флагманах на Android. Да и процессор Apple A9X в iPad Pro уже находится на уровне ультрабучной линейки intel Core m, потребляя при этом меньше энергии. К тому же ARM-процессорами в ноутбуках заинтересовались и Apple, и Microsoft - кто знает, возможно архитектуре х86-х64, по крайней мере в пользовательском сегменте, пора на покой?