Ryzen AI Max+ 395: обгон Lunar Lake в ИИ | ru

Сравнение Ryzen AI Max+ 395 и Core Ultra 7 258V

AMD представила данные о производительности своего процессора Ryzen AI Max+ 395, демонстрирующие значительное преимущество над энергоэффективными процессорами Intel Lunar Lake, в частности, Core Ultra 7 258V, в ряде тестов, связанных с искусственным интеллектом (ИИ). В недавнем сообщении в блоге компании освещаются возможности нового чипа Zen 5 + RDNA 3.5, утверждается о превосходстве в производительности до 12,2 раз в определенных рабочих нагрузках ИИ.

Чтобы продемонстрировать мощь Ryzen AI Max+ 395, AMD провела серию тестов, сравнив его с Intel Core Ultra 7 258V (оснащенным графикой Arc 140V). Тесты были сосредоточены на различных больших языковых моделях (LLM) и конфигурациях LLM, включая такие известные модели, как DeepSeek R1 и Llama.

Примечание о конфигурациях памяти:

Для обеспечения честного сравнения размеры моделей были ограничены 16 ГБ. Это ограничение было введено для учета ограничений памяти ноутбуков на базе Lunar Lake, которые в настоящее время доступны с максимальным объемом памяти 32 ГБ. Использовались следующие тестовые системы:

Ryzen AI Max+ 395: Asus ROG Flow Z13 с 64 ГБ памяти.
Core Ultra 7 258V: Asus Zenbook S14 с 32 ГБ памяти.

Производительность DeepSeek R1: значительное преимущество

В тестах DeepSeek R1 чип Ryzen продемонстрировал уверенное лидерство. Результаты, измеренные в токенах в секунду, были следующими:

Distill Qwen 1.5b: до 2,1 раза быстрее, чем аналог Intel.
Distill Qwen 7b: до 2,2 раза быстрее.
Distill Llama 8b: до 2,1 раза быстрее.
Distill Qwen 14b: до 2,2 раза быстрее.

Тесты Phi 4 и Llama 3.2: сохранение доминирования

Ryzen AI Max+ 395 продолжал превосходить Core Ultra 7 258V в тестах с использованием моделей Phi 4 и Llama 3.2:

Phi 4 Mini Instruct 3.8b: до 2,1 раза быстрее.
Phi 4 14b: до 2,2 раза быстрее.
Llama 3.2 3b Instruct: до 2,1 раза быстрее.

Время до первого токена: ключевой показатель

AMD также сосредоточилась на показателе ‘время до первого токена’, который является важнейшим индикатором отзывчивости в приложениях ИИ. В этих тестах Ryzen AI Max+ 395 продемонстрировал еще более существенное преимущество:

DeepSeek R1 Distill Qwen 14b: до 12,2 раза быстрее.
Даже в тех сценариях, где преимущество чипа Zen 5 в производительности было наименее выраженным (Phi 4 Mini Instruct 3.8b и Llama 3.2 3b Instruct), чип AMD все равно сохранял 4-кратное преимущество в скорости над Core Ultra 7 258V.

Модели компьютерного зрения: дальнейшее увеличение отрыва

Превосходство Ryzen AI Max+ 395 в производительности распространилось и на модели компьютерного зрения, опять же с использованием подхода к тестированию ‘время до первого токена’:

IBM Granite Vision 3.2 2B: до 7 раз быстрее, чем 258V.
Google Gemma 3.4b: до 4,6 раз быстрее.
Google Gemma 3 12b: до 6 раз быстрее.

Архитектурные преимущества: источник превосходной производительности

Впечатляющие показатели производительности, продемонстрированные AMD Ryzen AI Max+ 395, во многом объясняются несколькими ключевыми архитектурными преимуществами:

Мощная интегрированная графика: Интегрированный графический чип в процессоре Ryzen AI Max CPU может похвастаться 40 вычислительными блоками (CU) RDNA 3.5, обеспечивая производительность, сравнимую с дискретными графическими решениями.
Больше ядер: Ryzen AI Max+ 395 имеет на восемь процессорных ядер больше, чем Core Ultra 7 258V, что способствует повышению вычислительных возможностей.
Настраиваемый TDP: Чип Ryzen имеет значительно более высокий настраиваемый TDP (Thermal Design Power), рассчитанный на мощность до 120 Вт, что обеспечивает больший запас производительности.

Соображения по энергопотреблению:

Важно признать, что Ryzen AI Max+ 395 потребляет значительно больше энергии, чем Core Ultra 7 258V, максимальная турбо-мощность которого составляет 37 Вт. Однако, несмотря на эту разницу, оба чипа нацелены на один и тот же сегмент рынка и предназначены для тонких и легких ноутбуков.

Взгляд в будущее: конкуренция с NVIDIA RTX 50-й серии

Рынок мобильных вычислений постоянно развивается, и следующим вызовом для новых мобильных APU AMD, вероятно, станут мобильные графические процессоры NVIDIA RTX 50-й серии. Хотя сообщения указывают на потенциальные проблемы с цепочкой поставок и задержки с запуском этих графических процессоров в будущих игровых ноутбуках серии RTX 50, они, несомненно, будут представлять собой основную конкуренцию AMD с точки зрения чистой производительности, независимо от различий в форм-факторе.

Ранние заявления против дискретных графических процессоров:

Интересно, что AMD уже заявляла о превосходстве Ryzen AI Max+ 395 в производительности ИИ по сравнению с графическим процессором NVIDIA RTX 4090 для ноутбуков, что предполагает сильную конкурентную позицию даже по сравнению с дискретными графическими решениями. Это упреждающее заявление, и оно, несомненно, вызовет большой интерес у тех, кто ожидает независимых обзоров.

Более глубокое изучение результатов тестов

Предоставленные данные тестов ясно показывают, что AMD уделяет особое внимание производительности ИИ. Выбор моделей и конфигураций подчеркивает растущую важность эффективной и отзывчивой обработки ИИ в современных вычислительных задачах.

Большие языковые модели (LLM):

Использование DeepSeek R1 и Llama, двух известных LLM, демонстрирует способность Ryzen AI Max+ 395 обрабатывать сложные задачи обработки естественного языка. Показатель ‘токены в секунду’ является стандартной мерой производительности в этой области, показывающей, насколько быстро процессор может генерировать текст или обрабатывать языковые входные данные.

Дистилляция:

Включение ‘Distill’ версий моделей (например, Distill Qwen 1.5b) предполагает акцент на эффективности модели. Дистилляция - это метод, используемый для создания меньших и более быстрых версий больших моделей, сохраняя при этом большую часть их точности. Это особенно актуально для мобильных устройств, где энергопотребление и ограничения памяти имеют решающее значение.

Phi 4 и Llama 3.2:

Добавление моделей Phi 4 и Llama 3.2 обеспечивает более широкое представление о производительности чипа в различных архитектурах ИИ и размерах моделей.

Время до первого токена (TTFT):

Особого внимания заслуживает акцент на ‘времени до первого токена’. TTFT измеряет задержку между вводом пользователя и первоначальным ответом модели ИИ. Более низкий TTFT означает более отзывчивый и интерактивный пользовательский интерфейс, что имеет решающее значение для таких приложений, как чат-боты, перевод в реальном времени и завершение кода.

Модели компьютерного зрения:

Включение моделей компьютерного зрения (IBM Granite Vision и Google Gemma) демонстрирует универсальность Ryzen AI Max+ 395. Эти модели используются для таких задач, как распознавание изображений, обнаружение объектов и анализ видео. Высокая производительность в этих тестах свидетельствует о пригодности чипа для приложений, выходящих за рамки обработки языка.

Важность архитектурных преимуществ

Архитектурные решения AMD играют решающую роль в наблюдаемых различиях в производительности.

Интегрированная графика (RDNA 3.5):

Мощный интегрированный графический блок является ключевым отличием. В отличие от традиционных интегрированных графических решений, которые часто испытывают трудности с требовательными рабочими нагрузками, архитектура RDNA 3.5 обеспечивает значительный прирост производительности, позволяя Ryzen AI Max+ 395 более эффективно справляться с задачами ИИ. 40 CU представляют собой значительную вычислительную мощность.

Количество ядер:

Более высокое количество ядер (на восемь ядер больше, чем у Core Ultra 7 258V) обеспечивает общее преимущество в многопоточных рабочих нагрузках. Хотя обработка ИИ часто в значительной степени зависит от графического процессора, центральный процессор по-прежнему играет роль в управлении задачами и обработке определенных аспектов вычислений.

Настраиваемый TDP:

Более высокий TDP обеспечивает большую гибкость в управлении питанием. Хотя это и означает более высокое энергопотребление, это также позволяет чипу работать на более высоких тактовых частотах и поддерживать производительность в течение более длительных периодов времени, особенно при выполнении требовательных рабочих нагрузок ИИ. Возможность настройки TDP до 120 Вт обеспечивает значительное преимущество по сравнению с более ограниченной максимальной турбо-мощностью 37 Вт Core Ultra 7 258V. Это решающий фактор в достижении наблюдаемого превосходства в производительности.

Рынок мобильных вычислений: меняющееся поле битвы

Конкуренция между AMD и Intel в мобильном пространстве усилилась в последние годы, и обе компании раздвигают границы производительности и эффективности. Выпуск Lunar Lake продемонстрировал ориентацию Intel на энергоэффективность, в то время как Ryzen AI Max+ 395 от AMD явно отдает приоритет производительности, особенно в рабочих нагрузках ИИ.

Предстоящая битва с мобильными графическими процессорами NVIDIA RTX 50-й серии станет серьезным испытанием для AMD. Хотя NVIDIA традиционно доминировала на рынке высокопроизводительной мобильной графики, достижения AMD в области интегрированной графики и возможностей обработки ИИ позиционируют ее как сильного конкурента. Сообщения о проблемах с цепочкой поставок, с которыми сталкивается NVIDIA, потенциально могут дать AMD преимущество с точки зрения доступности и проникновения на рынок.

Заявления о превосходной производительности ИИ по сравнению с графическим процессором RTX 4090 для ноутбуков смелы, но если они подтвердятся, это будет означать значительный сдвиг в конкурентной среде. Это будет означать, что интегрированное решение AMD может конкурировать с дискретными графическими решениями и, возможно, превосходить их в определенных приложениях, ориентированных на ИИ. Это было бы большим достижением и могло бы иметь значительные последствия для будущего мобильных вычислений. Акцент на производительности ИИ является четким указанием на то, в каком направлении движется отрасль. По мере того, как ИИ все больше интегрируется в повседневные приложения, спрос на процессоры, способные эффективно и результативно справляться с этими рабочими нагрузками, будет продолжать расти.

обновлено 2025-03-18

# AIGC # AMD # Llama