Ryzen AI Max+ 395 surpasse Lunar Lake d'Intel en IA

Confrontation directe : Ryzen AI Max+ 395 contre Core Ultra 7 258V

Pour démontrer la prouesse du Ryzen AI Max+ 395, AMD a mené une série de tests, l’opposant au Core Ultra 7 258V d’Intel (équipé de la carte graphique Arc 140V). Les benchmarks se sont concentrés sur divers grands modèles de langage (LLM) et configurations de LLM, y compris des modèles importants comme DeepSeek R1 et Llama.

Remarque sur les configurations de mémoire :

Pour garantir une comparaison équitable, la taille des modèles a été limitée à 16 Go. Cette contrainte a été mise en œuvre pour tenir compte des limitations de mémoire des ordinateurs portables équipés de Lunar Lake, qui sont actuellement disponibles avec un maximum de 32 Go de mémoire. Les systèmes de test utilisés étaient :

  • Ryzen AI Max+ 395 : Asus ROG Flow Z13 avec 64 Go de mémoire.
  • Core Ultra 7 258V : Asus Zenbook S14 avec 32 Go de mémoire.

Performances de DeepSeek R1 : une avance significative

Dans les benchmarks DeepSeek R1, la puce Ryzen a démontré une avance considérable. Les résultats, mesurés en tokens par seconde, étaient les suivants :

  • Distill Qwen 1.5b : Jusqu’à 2,1 fois plus rapide que son homologue Intel.
  • Distill Qwen 7b : Jusqu’à 2,2 fois plus rapide.
  • Distill Llama 8b : Jusqu’à 2,1 fois plus rapide.
  • Distill Qwen 14b : Jusqu’à 2,2 fois plus rapide.

Benchmarks Phi 4 et Llama 3.2 : maintien de la domination

Le Ryzen AI Max+ 395 a continué à surpasser le Core Ultra 7 258V dans les tests utilisant les modèles Phi 4 et Llama 3.2 :

  • Phi 4 Mini Instruct 3.8b : Jusqu’à 2,1 fois plus rapide.
  • Phi 4 14b : Jusqu’à 2,2 fois plus rapide.
  • Llama 3.2 3b Instruct : Jusqu’à 2,1 fois plus rapide.

Temps jusqu’au premier token : une métrique clé

AMD s’est également concentré sur la métrique du “temps jusqu’au premier token”, un indicateur crucial de la réactivité dans les applications d’IA. Dans ces benchmarks, le Ryzen AI Max+ 395 a affiché des avances encore plus substantielles :

  • DeepSeek R1 Distill Qwen 14b : Jusqu’à 12,2 fois plus rapide.
  • Même dans les scénarios où l’avantage de performance de la puce Zen 5 était le moins prononcé (Phi 4 Mini Instruct 3.8b et Llama 3.2 3b Instruct), la puce AMD maintenait toujours un avantage de vitesse de 4x par rapport au Core Ultra 7 258V.

Modèles de vision IA : élargissement de l’avance

La domination des performances du Ryzen AI Max+ 395 s’étendait aux modèles de vision IA, en utilisant à nouveau l’approche de benchmarking “temps jusqu’au premier token” :

  • IBM Granite Vision 3.2 2B : Jusqu’à 7 fois plus rapide que le 258V.
  • Google Gemma 3.4b : Jusqu’à 4,6 fois plus rapide.
  • Google Gemma 3 12b : Jusqu’à 6 fois plus rapide.

Avantages architecturaux : la source de performances supérieures

Les chiffres de performance impressionnants démontrés par le Ryzen AI Max+ 395 d’AMD sont largement attribués à plusieurs avantages architecturaux clés :

  • Graphiques intégrés puissants : La puce graphique intégrée au sein du CPU Ryzen AI Max dispose de 40 unités de calcul (CU) RDNA 3.5, offrant des performances qui rivalisent avec les solutions graphiques discrètes.
  • Nombre de cœurs plus élevé : Le Ryzen AI Max+ 395 dispose de huit cœurs de CPU de plus que le Core Ultra 7 258V, ce qui contribue à améliorer les capacités de traitement.
  • TDP configurable : La puce Ryzen a un TDP (Thermal Design Power) configurable considérablement plus élevé, évalué jusqu’à 120 W, ce qui permet une plus grande marge de performance.

Considérations sur la consommation d’énergie :

Il est important de reconnaître que le Ryzen AI Max+ 395 consomme beaucoup plus d’énergie que le Core Ultra 7 258V, qui a une puissance turbo maximale de 37 W. Cependant, malgré cette différence, les deux puces ciblent le même segment de marché et sont conçues pour les ordinateurs portables fins et légers.

Perspectives d’avenir : concurrence avec la série RTX 50 de NVIDIA

Le paysage de l’informatique mobile est en constante évolution, et le prochain défi pour les nouveaux APU mobiles d’AMD viendra probablement des GPU mobiles de la série RTX 50 de NVIDIA. Bien que des rapports suggèrent des problèmes potentiels de chaîne d’approvisionnement et des retards pour le lancement de ces GPU dans les prochains ordinateurs portables de jeu de la série RTX 50, ils représenteront sans aucun doute la principale concurrence d’AMD en termes de performances brutes, quelles que soient les différences de facteur de forme.

Premières indications contre les GPU discrets :

Il est intéressant de noter qu’AMD a déjà fait des déclarations sur les performances supérieures en IA du Ryzen AI Max+ 395 par rapport au GPU pour ordinateur portable RTX 4090 de NVIDIA, suggérant une position concurrentielle forte, même contre les solutions graphiques discrètes. C’est une déclaration préventive, et qui ne manquera pas d’enthousiasmer ceux qui attendent des critiques indépendantes.

Analyse approfondie des résultats des benchmarks

Les données de benchmark fournies dressent un tableau clair de l’accent mis par AMD sur les performances de l’IA. Le choix des modèles et des configurations souligne l’importance croissante d’un traitement de l’IA efficace et réactif dans les tâches informatiques modernes.

Grands modèles de langage (LLM) :

L’utilisation de DeepSeek R1 et Llama, deux LLM importants, démontre la capacité du Ryzen AI Max+ 395 à gérer des tâches complexes de traitement du langage naturel. La métrique “tokens par seconde” est une mesure standard des performances dans ce domaine, indiquant la rapidité avec laquelle le processeur peut générer du texte ou traiter des entrées basées sur le langage.

Distillation :

L’inclusion de versions “Distill” des modèles (par exemple, Distill Qwen 1.5b) suggère un accent sur l’efficacité du modèle. La distillation est une technique utilisée pour créer des versions plus petites et plus rapides de modèles plus grands tout en conservant une grande partie de leur précision. Ceci est particulièrement pertinent pour les appareils mobiles où la consommation d’énergie et les contraintes de mémoire sont critiques.

Phi 4 et Llama 3.2 :

L’ajout des modèles Phi 4 et Llama 3.2 offre une perspective plus large sur les performances de la puce sur différentes architectures d’IA et tailles de modèles.

Temps jusqu’au premier token (TTFT) :

L’accent mis sur le “temps jusqu’au premier token” est particulièrement remarquable. Le TTFT mesure la latence entre l’entrée d’un utilisateur et la réponse initiale du modèle d’IA. Un TTFT plus faible se traduit par une expérience utilisateur plus réactive et interactive, ce qui est crucial pour des applications telles que les chatbots, la traduction en temps réel et la complétion de code.

Modèles de vision IA :

L’inclusion de modèles de vision IA (IBM Granite Vision et Google Gemma) démontre la polyvalence du Ryzen AI Max+ 395. Ces modèles sont utilisés pour des tâches telles que la reconnaissance d’images, la détection d’objets et l’analyse vidéo. Les bonnes performances dans ces benchmarks suggèrent que la puce convient à des applications allant au-delà du simple traitement du langage.

L’importance des avantages architecturaux

Les décisions architecturales d’AMD jouent un rôle crucial dans les différences de performances observées.

Graphiques intégrés (RDNA 3.5) :

La puissante unité graphique intégrée est un facteur de différenciation clé. Contrairement aux solutions graphiques intégrées traditionnelles, qui ont souvent du mal avec les charges de travail exigeantes, l’architecture RDNA 3.5 offre une augmentation significative des performances, permettant au Ryzen AI Max+ 395 de gérer les tâches d’IA plus efficacement. Les 40 CU représentent une capacité de calcul substantielle.

Nombre de cœurs :

Le nombre de cœurs plus élevé (huit cœurs de plus que le Core Ultra 7 258V) offre un avantage général dans les charges de travail multithread. Bien que le traitement de l’IA repose souvent fortement sur le GPU, le CPU joue toujours un rôle dans la gestion des tâches et la gestion de certains aspects du calcul.

TDP configurable :

Le TDP plus élevé permet une plus grande flexibilité dans la gestion de l’alimentation. Bien que cela signifie une consommation d’énergie plus élevée, cela permet également à la puce de fonctionner à des vitesses d’horloge plus élevées et de maintenir les performances pendant des périodes plus longues, en particulier dans les charges de travail d’IA exigeantes. La possibilité de configurer le TDP jusqu’à 120 W offre un avantage significatif par rapport à la puissance turbo maximale plus limitée de 37 W du Core Ultra 7 258V. C’est un facteur crucial pour atteindre les performances observées.

Le paysage de l’informatique mobile : un champ de bataille en mutation

La concurrence entre AMD et Intel dans le domaine mobile s’est intensifiée ces dernières années, les deux sociétés repoussant les limites de la performance et de l’efficacité. L’introduction de Lunar Lake représentait l’accent mis par Intel sur l’efficacité énergétique, tandis que le Ryzen AI Max+ 395 d’AMD privilégie clairement les performances, en particulier dans les charges de travail d’IA.

La bataille à venir avec les GPU mobiles de la série RTX 50 de NVIDIA sera un test important pour AMD. Alors que NVIDIA a traditionnellement dominé le marché des cartes graphiques mobiles haut de gamme, les avancées d’AMD en matière de graphiques intégrés et de capacités de traitement de l’IA le positionnent comme un concurrent sérieux. Les problèmes de chaîne d’approvisionnement signalés auxquels NVIDIA est confronté pourraient potentiellement donner à AMD un avantage en termes de disponibilité et de pénétration du marché.

Les affirmations de performances supérieures en IA par rapport au GPU pour ordinateur portable RTX 4090 sont audacieuses, mais si elles sont confirmées, elles représenteraient un changement significatif dans le paysage concurrentiel. Cela indiquerait que la solution intégrée d’AMD peut rivaliser avec, et potentiellement surpasser, les solutions graphiques discrètes dans certaines applications axées sur l’IA. Ce serait une réalisation majeure et pourrait avoir des implications significatives pour l’avenir de l’informatique mobile. L’accent mis sur les performances de l’IA est une indication claire de la direction que prend l’industrie. À mesure que l’IA s’intègre de plus en plus dans les applications quotidiennes, la demande de processeurs capables de gérer ces charges de travail de manière efficace et efficiente continuera de croître.