MacRumors

Skip to Content

Детальный обзор улучшений процессоров Apple для iPhone 7 и Apple Watch

На прошедшем в среду мероприятии Apple представила два новых процессора — A10 Fusion для iPhone 7 и 7 Plus, а также S2 для Apple Watch Series 2. Хотя Apple лишь кратко упомянула S2 во время презентации, значительное время было посвящено A10 Fusion. Суффикс «Fusion» указывает на гетерогенную архитектуру A10, которая включает два высокопроизводительных ядра и два более мелких, более энергоэффективных ядра.

Apple также представила еще один очень важный самостоятельный чип в своих новых AirPods — чип W1. В совокупности это представляет собой огромный объем инженерной работы, проделанной Apple за последний год, а A10 является самым значительным усовершенствованием в линейке систем-на-чипе (SoC) Apple со времен перехода компании на 64-битную архитектуру.

a10_transistors
Apple в самом начале представила основные технические изменения A10, заявив о четырехъядерном процессоре с 3,3 миллиарда транзисторов. Хотя Apple никогда не раскрывала количество транзисторов для A9, оно, скорее всего, находилось где-то между 2 миллиардами у A8 и 3,3 миллиарда у нового A10. Количество транзисторов значительно меньше 3 миллиардов кажется вероятным для A9; в противном случае этим стоило бы гордиться отдельно.

3,3 миллиарда транзисторов у A10 более чем на 50% больше, чем у A8, и такое значительное увеличение, вероятно, в основном связано с добавлением двух новых, хотя и небольших, процессорных ядер, а также с значительно улучшенным процессором обработки изображений (ISP). Apple также сообщила, что GPU по-прежнему имеет шестикластерную конструкцию, в то время как результаты тестов предполагают, что размеры кэша L1 и L2 остались неизменными.

Учитывая, что технологический процесс, как ожидается, не изменится по сравнению с A9, произведенным по 16-нм FinFET процессу TSMC, весьма вероятно, что мы увидим больший размер кристалла по сравнению с предшественником. Однако также вероятно, что Apple смогла оптимизировать размещение и размеры на более зрелом процессе, без дополнительной сложности производства двойной конструкции на конкурирующем 14-нм FinFET процессе Samsung.

Утечки изображений материнской платы также предполагают больший размер корпуса устройства, чем у Apple A9, хотя неясно, оказывает ли новый процессор упаковки InFO какое-либо влияние на размер корпуса устройства.

a10_core_speed


Apple также сообщила, что пиковая производительность A10 может быть до 40% выше, чем у A9, использовавшегося в предыдущем поколении. Тактовая частота 2,33 ГГц, показанная в тестах, примерно на 25% быстрее, чем 1,85 ГГц у A9, что означает, что Apple достигла еще 25% прироста производительности за счет архитектурных усовершенствований.

Увеличение тактовой частоты на 25% является значительным, учитывая, что технологический процесс, вероятно, не изменился, что означает, что увеличение было, скорее всего, обусловлено лучшей теплопроизводительностью упаковки InFO. Это также, вероятно, возможно благодаря гетерогенной архитектуре Apple, которая теперь включает пару высокоскоростных ядер наряду с парой низкоскоростных, энергоэффективных ядер.

Увеличение тактовой частоты Apple, вероятно, больше, чем просто увеличение напряжения для ускорения работы ядер. Внедряя пару низкоскоростных ядер, Apple открыла совершенно новый спектр опций динамического масштабирования напряжения и частоты (DVFS) для полного отключения ядер или их подчастей. Apple разработала собственный контроллер производительности для управления рабочими нагрузками между ядрами, и мы знаем из отраслевых источников, что Apple осуществляет совместное использование кэшей, чтобы кэшам не приходилось постоянно считывать содержимое друг друга для готовности к переключению, чтобы избежать задержек в получении текущих данных при переключении.

Эта концепция может показаться знакомой, поскольку ARM представила ее еще в 2011 году с дизайном Cortex-A15 «Eagle» в 2012 году под названием «big.LITTLE». Схема ARM big.LITTLE также включает контроллер производительности и механизмы согласованности кэшей, но она должна была быть разработана с учетом управления производительностью ОС Linux, в то время как Apple может перенастраивать iOS по мере необходимости для любых программных интерфейсов к контроллеру производительности. Со временем мы можем узнать больше о том, какие кэши используются совместно, а какие обновляются с помощью какого-либо механизма согласованности.

Увеличение тактовой частоты до 2,33 ГГц приближает Apple к тактовой частоте конкурентов от производителей SoC, таких как Qualcomm и Samsung, и Apple также могла внести некоторые изменения в транзисторы для достижения этих скоростей. Увеличивая напряжение и выбирая транзисторы с более высокой утечкой статического тока (неизбежная потеря мощности), Apple может достичь этих более высоких тактовых частот. Команда разработчиков чипов Apple также может создавать архитектурные решения с более высоким энергопотреблением в целом, будь то большее количество транзисторов, избыточные затраты на управление или большая активность переключения за счет другого метода реализации логики.

Вывод заключается в том, что теперь допустимо идти на эти компромиссы, поскольку они лучше справляются с тепловыми последствиями и им не приходится иметь дело со статическим энергопотреблением всех этих изменений, когда схема не используется активно, поскольку они могут просто отключить ее и переключиться на низкоэнергетическое ядро.

a10_small_cores


Два небольших ядра A10 от Apple вызвали не меньший интерес, чем их более крупные аналоги, с большим количеством спекуляций относительно того, являются ли они также разработкой Apple или вариантом стандартного низкопроизводительного ядра от ARM, такого как Cortex-A53. После стольких лет полностью заказных разработок справедливо спросить, почему Apple выбрала бы готовое решение для своего низкопроизводительного ЦП, но прецеденты для этого, безусловно, есть.

По всем признакам, Apple Watch первого поколения используют дизайн процессора Cortex-A7. Сравнение с Apple Watch интересно, поскольку Series 2 была просто увеличена до двухъядерной конструкции, на 50% более быстрой, чем оригинал. Тот же вопрос о заказной против стандартной конструкции здесь актуален, и вполне возможно, что двухъядерный процессор в S2 — это тот же двухъядерный процессор, который используется в качестве низкопроизводительного варианта в A10.

Основной вопрос, связанный с этим архитектурным сдвигом, заключается в том, почему именно сейчас Apple решила перейти на гетерогенную архитектуру. Одна из возможностей заключается в том, что основные разработки ядер Apple были настолько оптимизированы, что осталось мало возможностей для улучшения, и эти улучшения имели бы серьезную убывающую доходность. Повышение тактовой частоты — это простой способ получить больше производительности, но связанные с этим тепловые и энергетические затраты, возможно, были движущей силой разделения.

Размер кристалла также не безграничен, и до тех пор, пока были возможности для увеличения процессоров, Apple могла выбрать этот путь. Улучшенные функции ISP также могли быть веской причиной для увеличения кэша L3 SRAM с 4 МБ до 8 МБ, что также влияет на размер кристалла. В дальнейшем важно помнить, что тактовая частота процессоров также не будет безграничной, например, высокопроизводительные настольные процессоры остаются в пределах от 3 ГГц до 4 ГГц последние десять лет.

a10_graphics_speed


Apple завершила свой технический обзор, рассказав о графической мощности A10. К счастью, Фил Шиллер упомянул, что это шестикластерная конструкция, так что мы знаем, что она соответствует количеству кластеров в A9. Заявления Apple о производительности также предполагают, что GPU A10 может быть до 50% быстрее, чем GPU A9, потребляя при этом только 2/3 энергии.

a10_graphics_power


Мы также знаем, что Apple использовала тот же технологический процесс для A10, что и для A9. Поскольку после анонса серии GPU 7XT от Imagination Technologies, использовавшейся в A9, от ImgTec был представлен только один новый тип высокопроизводительного GPU, который был просто добавлен для улучшений производительности компьютерного зрения и вычислений в существующую линейку 7XT.

Само по себе снижение энергопотребления исключает увеличение тактовой частоты Apple для обеспечения этих заявлений о производительности, поэтому мы, вероятно, рассматриваем некоторые значительные изменения, включающие неанонсированный GPU, разработанный Apple GPU или какой-либо другой важный архитектурный сдвиг, о котором мы не знаем. Возможно, Apple может заявить о некотором приросте за счет улучшений в Metal, но до 50% ускорения кажутся довольно высоким заявлением для этого.

Заявления Apple о повышении производительности исторически склонны находить отражение в тестах, поэтому это будет областью особого интереса, когда GPU будет полностью протестирован и рассмотрен под микроскопом.

apple_w1


Представление AirPods от Apple также было важным моментом, поскольку они оснащены новым чипом беспроводной связи W1 от Apple. В своем объявлении Фил Шиллер особо подчеркнул, что это первый беспроводной чип Apple, предполагая, что их будет больше. Мы ждали несколько лет с тех пор, как Apple впервые наняла нескольких инженеров по радиочастотам из Broadcom, и этот небольшой чип Bluetooth может стать ступенькой к тому, чтобы Apple предоставляла свои собственные радиочастотные компоненты, такие как чип Wi-Fi или даже сотовый базовый модем в будущих устройствах.

Однако выйти на этот рынок и стать конкурентоспособным в общем сегменте очень сложно, как, например, видно по собственным предложениям Intel в области LTE, вероятно, представленным в новом iPhone. Вместо того чтобы создаваться с нуля, эти чипы являются продуктом приобретения Infineon компанией Intel и производятся по техпроцессу TSMC, а не собственному техпроцессу Intel. Потенциальные выгоды от заказных беспроводных чипов также менее очевидны, чем от полностью заказных процессорных решений, используемых в SoC, поэтому это не обязательно означает, что амбиции Apple простираются так далеко.

Мы, вероятно, узнаем гораздо больше в ближайшие недели, когда начнутся разборки устройств, будут проведены исчерпывающие тесты и начнут появляться более детальные аналитические данные от таких фирм, как Chipworks. Оттуда мы получим лучшее представление о конкретных методах и приемах, которые Apple использовала для повышения производительности чипов, и, возможно, получим лучшее представление о том, что будет дальше.