Подробное знакомство с новыми процессорами Arm Cortex-X925 и Immortalis-G925 для мобильных устройств

Подробное знакомство с новыми процессорами Arm Cortex-X925 и Immortalis-G925 для мобильных устройств

Компания Arm представила свои последние предложения для мобильных процессоров, включая процессор Cortex-X925 и графический процессор Immortalis G925. Новые компоненты обещают значительное улучшение производительности и энергоэффективности по сравнению со своими предшественниками.


Как аналитик мобильных технологий, я рад сообщить, что инновации в области мобильных чипсетов быстро развиваются. Этот импульс обеспечивает нам улучшенные игровые возможности, более быстрое внедрение передовых возможностей искусственного интеллекта и более энергоэффективные компьютеры. Среди компаний, возглавляющих эту инициативу, — Arm, которая недавно представила выбранные ядра ЦП и графического процессора, выпуск которых запланирован на 2024 год, чтобы удовлетворить эти расширяющиеся варианты использования.

Как технический энтузиаст, я с нетерпением жду предстоящего выпуска некоторых смартфонов следующего поколения в 2025 году, которые будут оснащены новейшими процессорными и графическими ядрами Arm. Хотя в последние годы компания Arm стала более скрытной в отношении особенностей своих технологий, давайте углубимся в анонсы, чтобы узнать, чего мы можем ожидать от этих передовых процессоров.

Самый большой: ядро ​​Arm Cortex-X925

В линейке процессоров Arm 2024 года выдающейся моделью является высокопроизводительный Arm Cortex-X925. Хотя его название было изменено, он представляет собой преемника Armv9.2 Cortex-X4 предыдущего поколения, такого как тот, который использовался в процессорах Qualcomm Snapdragon 8 Gen 3. Изначально мы ожидали, что это ядро ​​будет называться Cortex-X5; однако Arm выбрала соглашение об именах, соответствующее другим продуктам, представленным в том году.

Статистика титулов для Arm Cortex-X925 показывает, что прогресс IPC на 15% выше, чем у Cortex-X4. Эта цифра возрастает до 36%, если учесть преимущества перехода на 3-нм производство, увеличение тактовой частоты, превышающей 3,6 ГГц, и расширение кэша. Производительность искусственного интеллекта возросла еще больше: выполнение процессором некоторых моделей ускорено на 46%. Подводя итог, можно сказать, что возможности одноядерных процессоров в следующем поколении будут значительно улучшены.

Кортекс-X925Рука Cortex-X4Рука Кортекс-X3Рука Кортекс-X2
Пиковая тактовая частота~3,6 ГГц~3,4 ГГц~3,25 ГГц~3,0 ГГц
Ширина декодирования10 инструкций10 инструкций6 инструкций
(8 швабр)
5 инструкций
Глубина отгрузочного трубопровода10 циклов10 циклов11 циклов для инструкций
(9 циклов для швабры)
10 циклов
Окно выполнения ОоО1500
(2x 750)
768
(2x 384)
640
(2x 320)
448
(2x 288)
Единицы исполнения(предполагается)
6x ALU (около 2 тактов)
2x ALU/MAC
2x ALU/MAC/DIV

3x ответвления

6x ALU
1x ALU/MAC
1x ALU/MAC/DIV

3x ответвления

4x ALU
1x ALU/MUL
1x ALU/MAC/DIV

2x ответвления

2x ALU
1x ALU/MAC
1x ALU/MAC/DIV

2x ответвления

АрхитектураARMv9.2ARMv9.2ARMv9ARMv9

Преимущества, полученные от 3-нм технологии, в значительной степени способствуют повышению производительности, ожидаемому для этого поколения. Компания Arm приложила значительные усилия для адаптации своей конструкции для своих производителей, включая TSMC и Samsung, используя процессы FinFET и GAA. Это приводит к заметному улучшению на 15% по сравнению с предыдущей моделью, что можно объяснить несколькими значительными изменениями в микроархитектуре X925.

В основе X925 теперь имеется шесть процессоров SIMD, что является улучшением по сравнению с предыдущими четырьмя. Эти подразделения отвечают за интенсивные математические операции, такие как вычисления с плавающей запятой и задачи искусственного интеллекта. Такое значительное увеличение в первую очередь объясняет повышение производительности ядра в области искусственного интеллекта и машинного обучения. Кроме того, были добавлены дополнительный блок целочисленного умножения и блок сравнения с плавающей запятой, что еще больше увеличивает общую вычислительную мощность ядра при правильном оснащении. Arm больше не раскрывает подробности о размерах кристалла, но X925, вероятно, станет весьма значительным.

Подробное знакомство с новыми процессорами Arm Cortex-X925 и Immortalis-G925 для мобильных устройств

В некоторые АЛУ были внесены интригующие изменения, которые были преобразованы в специальные версии двухтактных инструкций. Эта модификация предотвращает задержки в стандартных однотактных устройствах, но может ограничить их способность выполнять определенные основные арифметические операции. Детальный анализ вариантов использования позволит выявить преимущества этого изменения конструкции.

Отправка инструкций в процессоре Arm X925 по-прежнему поддерживает ширину 10. Примечательно, что Arm увеличил максимальное количество инструкций, которые могут обрабатываться одновременно, с предыдущего предела до впечатляющих 1500. Кроме того, теперь вдвое увеличена пропускная способность для выборки инструкций из кэша инструкций L1 и вдвое увеличен размер таблицы поиска инструкций L1. Кроме того, серверная часть включает дополнительный конвейер загрузки для улучшения извлечения данных из памяти. По сути, это означает, что для обработки доступно большее количество инструкций, в результате чего ядра заняты интенсивными вычислениями.

X925 может использовать те же темы, что и его предшественник X4, но с более широким интерфейсом ввода и более мощным процессором. Это обновление, а не полный пересмотр, сохраняет знакомую структуру. Однако в 2025 году производительность значительно улучшится, причем некоторые улучшения будут связаны с переходом на 3-нм технологию.

Энергоэффективный Arm Cortex-A725 и A520

С сожалением приходится отметить, что компания Arm не столь охотно предоставила информацию о Cortex-A725, который должен послужить основой для их будущей мобильной системы на чипах (SoC).

Как исследователь, я столкнулся с заявлением компании Arm о том, что их новый процессор A725 на 25% эффективнее своего предшественника A720. Утверждается, что такое повышение эффективности достижимо без необходимости перехода на меньший 3-нм технологический узел, который еще не имеет стандартного показателя, связанного с приростом производительности IPC (операций на такт) от Arm. Однако они упомянули об улучшении на 20% возможностей обработки трафика L3 для этого нового процессора. Такое увеличение трафика L3 может помочь реализовать некоторые дополнительные преимущества в производительности.

На уровне микроархитектуры Arm расширил возможности буфера повторного заказа и очереди выдачи инструкций, тем самым повысив пропускную способность. Кроме того, новая настройка кэша L2 объемом 1 МБ позволяет ядру работать с более высокой производительностью. Однако, если это единственные улучшения, A725 представляет собой незначительное обновление по сравнению с A720, которое само по себе является улучшением процессорного ядра A710 2022 года.

Подробное знакомство с новыми процессорами Arm Cortex-X925 и Immortalis-G925 для мобильных устройств

Как поклонник передовых технологий, я очень рад познакомиться с обновленным Cortex-A520. Хотя он, возможно, и не может похвастаться самыми захватывающими инновациями среди трио процессоров этого года, его базовая архитектура остается неизменной. Тем не менее, Arm умело оптимизировала A520 для будущих 3-нм процессов, что привело к значительному повышению энергоэффективности на 15%.

Основываясь на анализе диаграмм энергоэффективности Arm для этого нового поколения, между Cortex-A725 и A520 существует значительное совпадение с точки зрения энергопотребления. A520 продолжает превосходно обеспечивать минимальное энергопотребление в режиме ожидания и при выполнении задач с низкой интенсивностью. С другой стороны, A725 предлагает значительно улучшенную производительность при использовании тех же уровней мощности, что и полностью загруженный A520. Следовательно, многие задачи на A725 выполняются намного быстрее и с одинаковой эффективностью. Неудивительно, что эталонный дизайн Arm 2024 года предлагает использовать всего два процессора A520 вместо большего количества ядер меньшего размера, наблюдаемых в современных чипсетах.

Значительно улучшенный игровой процесс с Immortalis G925.

Предложения графических процессоров Arm продолжают развиваться, представляя Immortalis G925, Mali G725 и Mali G625. Как и в случае с прошлогодними моделями, производители полупроводников должны увеличить количество ядер, чтобы обеспечить надежные возможности трассировки лучей и использовать бренд Immortalis. Для графических процессоров класса Immortalis количество ядер варьируется от десяти до 24 по сравнению с 16 в предыдущем поколении. Конфигурация от шести до девяти ядер относится к категории Mali G725, а бюджетная конфигурация — от одного до пяти ядер для Mali G625.

Как наблюдатель, я бы сказал это так: я заметил, что каждое ядро ​​G925 обещает значительные улучшения при изготовлении с использованием 3-нм технологии. В частности, речь идет о потенциальном снижении энергопотребления до 30 %, возможном повышении производительности до 37 % и впечатляющем увеличении производительности в гонках на целых 52 % по сравнению с предыдущим Immortalis G720. поколение. Однако важно отметить, что последнее повышение производительности связано с оговоркой: разработчикам необходимо использовать новые API для обозначения определенных объектов как «сложных», которые G925 затем обрабатывает с пониженной точностью. Эти сложные объекты, такие как листья или трава, могут потребовать больших вычислительных затрат, но могут не сильно отличаться от игроков, если трассировка лучей выполняется с более низкой точностью. Это инновационная концепция, но ее эффективность полностью зависит от того, знают ли разработчики и внедряют ли эти новые API в свой код.

Подробное знакомство с новыми процессорами Arm Cortex-X925 и Immortalis-G925 для мобильных устройств

В реальных игровых сценариях Arm сообщает о больших улучшениях с 14 ядрами Immortalis G925 по сравнению с 12 старыми ядрами G720. Однако важно отметить, что это не прямое сравнение. Поверив Arm на слово, я бы оценил, что вы сможете разместить 14 ядер G925 там, где раньше было только 12 старых G720. Это всего лишь моя гипотеза.

Несмотря на то, что для этого требуется всего два дополнительных ядра, Arm заявляет о впечатляющем повышении производительности. В Call of Duty улучшение составило 72%; Genshin Impact увеличился на 49%; Diablo Immortal увеличился на 46%; а Fortnite получает преимущество в 29%. Фундаментальное нововведение заключается в новой технологии Fragment Prepass для отсеивания скрытых объектов. Проще говоря, это значительно улучшает обнаружение объектов или игроков, скрытых структурами, тем самым снижая нагрузку на процессор и приводя к существенному повышению производительности. Игры со сложной геометрией приносят наибольшую выгоду, что объясняет разницу между преимуществами CoD и Fortnite.

Я заметил, что вместо обычных методов удаления скрытых поверхностей (HSR) из Z-буфера, таких как прямое уничтожение пикселей и переупорядочение примитивов, Arm использует технологию предварительного прохода фрагмента. Основное отличие заключается в устранении необходимости переупорядочивания Z-буфера для принятия решений по отбраковке, тем самым сокращая циклы ЦП примерно на 43% на поток. Этот процесс происходит на аппаратном уровне и не требует дополнительных затрат для разработчиков. Однако это не может принести одинаковые преимущества для всех типов игр.

А что насчет ИИ?

Подробное знакомство с новыми процессорами Arm Cortex-X925 и Immortalis-G925 для мобильных устройств

Анонс продуктов на 2024 год требует внедрения технологии искусственного интеллекта, и хотя у Arm нет специального ускорителя искусственного интеллекта, она все же продемонстрировала свои предложения в этой области. Arm полагается на универсальность и удобство для разработчиков процессоров, а также на некоторые возможности графического процессора, чтобы подчеркнуть свои возможности искусственного интеллекта.

Как технический энтузиаст, я могу вам сказать, что Arm подчеркивает тот факт, что большинство сторонних приложений искусственного интеллекта для Android работают на центральном процессоре (ЦП), а не на специализированных ускорителях, из-за ограниченных инвестиций в поддержку различных интерфейсов прикладного программирования (API). предоставляемые SoC. Поскольку пока еще не существует широко распространенного универсального API, Arm рассчитывает, что процессоры продолжат играть жизненно важную роль в искусственном интеллекте для мобильных устройств. Однако важно отметить, что эта точка зрения могла бы измениться, если бы я лично участвовал в рынке мобильных ускорителей искусственного интеллекта.

Несмотря на это, Arm представляет впечатляющие показатели нового Arm Cortex-X925. Он может похвастаться более быстрым временем отклика на 42 % с моделью LLaMA 3 с 8 миллиардами параметров и улучшением на 46 % для модели с 3,8 миллиардами Phi 3 с точки зрения вывода AI CPU. Кроме того, количество выводов AI CPU увеличилось на 59%, а возможности вывода GPU были расширены на 36% по сравнению с предыдущей платформой. Кроме того, новейший графический процессор (в конфигурации с 14 ядрами по сравнению с 12 ядрами) обеспечивает ускорение обработки естественного языка до 50 %, сегментацию изображений на 41 % и преобразование речи в текст на 32 %.

Я заметил, что эти улучшения действительно полезны для повышения скорости реагирования приложений ИИ. Однако важно помнить, что ни центральный процессор (ЦП), ни графический процессор (ГП) не могут сравниться по скорости и эффективности со специальным ускорителем искусственного интеллекта.

Чего ожидать от продуктов нового поколения?

Подробное знакомство с новыми процессорами Arm Cortex-X925 и Immortalis-G925 для мобильных устройств

Как исследователь, я обнаружил некоторые интригующие идеи о будущем технологий мобильной обработки. К 2025 году ядра Arm следующего поколения будут использоваться во флагманских смартфонах таких крупных производителей, как Samsung и MediaTek. Ожидается, что эти компании включат эти передовые технологии в свои предложения по производству полупроводников. Qualcomm, напротив, планирует перейти на новое ядро ​​процессора Snapdragon 8 Gen 4. Следовательно, большинство высокопроизводительных телефонов Android в 2025 году вряд ли будут иметь ядра Arm Cortex-X925 или Immortalis-G925.

Как аналитик, я заметил, что следующее поколение ноутбуков с Windows on Arm будет базироваться на платформе Qualcomm Snapdragon X Elite. Примечательно, что эта платформа включает в себя специальные ядра ЦП вместо ядер серии Arm Cortex. Хотя компания Arm не раскрыла конкретных планов относительно ПК на базе Arm, вполне вероятно, что другие производители полупроводников могут использовать ядра Arm Cortex-X, такие как новый X925, для создания конкурирующих чипсетов примерно в 2025 году. Гипотетически процессор, разработанный Arm, может состоять из до двенадцати ядер Cortex-X925, стремясь превзойти пороговые значения производительности мобильных устройств.

В первой половине года компания Arm представила свои новейшие клиентские технологии. Однако партнерские чипсеты для этих технологий будут представлены не раньше конца 2024 года. Впоследствии смартфоны с процессорами Cortex-X925 и/или Immortalis-G925, по прогнозам, станут доступны потребителям примерно в начале 2025 года.

Смотрите также

2024-05-29 18:12