Frente a Frente: Ryzen AI Max+ 395 vs. Core Ultra 7 258V
Para demostrar la destreza del Ryzen AI Max+ 395, AMD realizó una serie de pruebas, enfrentándolo al Core Ultra 7 258V de Intel (equipado con gráficos Arc 140V). Los benchmarks se centraron en varios modelos de lenguaje grandes (LLM) y configuraciones de LLM, incluyendo modelos prominentes como DeepSeek R1 y Llama.
Una nota sobre las configuraciones de memoria:
Para asegurar una comparación justa, los tamaños de los modelos se limitaron a 16 GB. Esta restricción se implementó para tener en cuenta las limitaciones de memoria de las laptops con tecnología Lunar Lake, que actualmente están disponibles con un máximo de 32 GB de memoria. Los sistemas de prueba utilizados fueron:
- Ryzen AI Max+ 395: Asus ROG Flow Z13 con 64 GB de memoria.
- Core Ultra 7 258V: Asus Zenbook S14 con 32 GB de memoria.
Rendimiento de DeepSeek R1: Una ventaja significativa
En los benchmarks de DeepSeek R1, el chip Ryzen demostró una ventaja dominante. Los resultados, medidos en tokens por segundo, fueron los siguientes:
- Distill Qwen 1.5b: Hasta 2.1 veces más rápido que su contraparte de Intel.
- Distill Qwen 7b: Hasta 2.2 veces más rápido.
- Distill Llama 8b: Hasta 2.1 veces más rápido.
- Distill Qwen 14b: Hasta 2.2 veces más rápido.
Benchmarks de Phi 4 y Llama 3.2: Manteniendo el dominio
El Ryzen AI Max+ 395 continuó superando al Core Ultra 7 258V en pruebas usando los modelos Phi 4 y Llama 3.2:
- Phi 4 Mini Instruct 3.8b: Hasta 2.1 veces más rápido.
- Phi 4 14b: Hasta 2.2 veces más rápido.
- Llama 3.2 3b Instruct: Hasta 2.1 veces más rápido.
Tiempo hasta el primer token: Una métrica clave
AMD también se centró en la métrica ‘tiempo hasta el primer token’, un indicador crucial de la capacidad de respuesta en las aplicaciones de IA. En estos benchmarks, el Ryzen AI Max+ 395 mostró ventajas aún más sustanciales:
- DeepSeek R1 Distill Qwen 14b: Hasta 12.2 veces más rápido.
- Incluso en los escenarios donde la ventaja de rendimiento del chip Zen 5 fue menos pronunciada (Phi 4 Mini Instruct 3.8b y Llama 3.2 3b Instruct), el chip de AMD aún mantuvo una ventaja de velocidad de 4x sobre el Core Ultra 7 258V.
Modelos de visión de IA: Ampliando aún más la ventaja
El dominio de rendimiento del Ryzen AI Max+ 395 se extendió a los modelos de visión de IA, nuevamente utilizando el enfoque de benchmarking ‘tiempo hasta el primer token’:
- IBM Granite Vision 3.2 2B: Hasta 7 veces más rápido que el 258V.
- Google Gemma 3.4b: Hasta 4.6 veces más rápido.
- Google Gemma 3 12b: Hasta 6 veces más rápido.
Ventajas arquitectónicas: La fuente del rendimiento superior
Las impresionantes cifras de rendimiento demostradas por el Ryzen AI Max+ 395 de AMD se atribuyen en gran medida a varias ventajas arquitectónicas clave:
- Potentes gráficos integrados: El chip de gráficos integrado dentro de la CPU Ryzen AI Max cuenta con 40 unidades de cómputo (CU) RDNA 3.5, proporcionando un rendimiento que rivaliza con las soluciones de gráficos discretos.
- Mayor número de núcleos: El Ryzen AI Max+ 395 cuenta con ocho núcleos de CPU más que el Core Ultra 7 258V, lo que contribuye a mejorar las capacidades de procesamiento.
- TDP configurable: El chip Ryzen tiene un TDP (Thermal Design Power) configurable significativamente más alto, clasificado hasta 120W, lo que permite un mayor margen de rendimiento.
Consideraciones sobre el consumo de energía:
Es importante reconocer que el Ryzen AI Max+ 395 consume significativamente más energía que el Core Ultra 7 258V, que tiene una potencia turbo máxima de 37W. Sin embargo, a pesar de esta diferencia, ambos chips se dirigen al mismo segmento de mercado y están diseñados para laptops delgadas y ligeras.
Mirando hacia el futuro: Competencia con la serie RTX 50 de NVIDIA
El panorama de la computación móvil está en constante evolución, y el próximo desafío para las nuevas APU móviles de AMD probablemente provendrá de las GPU móviles de la serie RTX 50 de NVIDIA. Si bien los informes sugieren posibles problemas en la cadena de suministro y retrasos para el lanzamiento de estas GPU en las próximas laptops para juegos de la serie RTX 50, sin duda representarán la principal competencia de AMD en términos de rendimiento bruto, independientemente de las diferencias de factor de forma.
Indicaciones tempranas contra las GPU discretas:
Curiosamente, AMD ya ha hecho afirmaciones sobre el rendimiento superior de IA del Ryzen AI Max+ 395 en comparación con la GPU para laptops RTX 4090 de NVIDIA, lo que sugiere una fuerte postura competitiva incluso contra las soluciones de gráficos discretos. Es una declaración preventiva, y una que seguramente entusiasmará a aquellos que esperan revisiones independientes.
Profundizando en los resultados de los benchmarks
Los datos de los benchmarks proporcionados pintan una imagen clara del enfoque de AMD en el rendimiento de la IA. La elección de modelos y configuraciones destaca la creciente importancia del procesamiento de IA eficiente y receptivo en las tareas informáticas modernas.
Modelos de lenguaje grandes (LLM):
El uso de DeepSeek R1 y Llama, dos LLM prominentes, demuestra la capacidad del Ryzen AI Max+ 395 para manejar tareas complejas de procesamiento del lenguaje natural. La métrica ‘tokens por segundo’ es una medida estándar de rendimiento en esta área, que indica la rapidez con la que el procesador puede generar texto o procesar entradas basadas en el lenguaje.
Destilación:
La inclusión de versiones ‘Distill’ de los modelos (por ejemplo, Distill Qwen 1.5b) sugiere un enfoque en la eficiencia del modelo. La destilación es una técnica utilizada para crear versiones más pequeñas y rápidas de modelos más grandes, conservando gran parte de su precisión. Esto es particularmente relevante para los dispositivos móviles, donde el consumo de energía y las limitaciones de memoria son críticos.
Phi 4 y Llama 3.2:
La adición de los modelos Phi 4 y Llama 3.2 proporciona una perspectiva más amplia sobre el rendimiento del chip en diferentes arquitecturas de IA y tamaños de modelos.
Tiempo hasta el primer token (TTFT):
El énfasis en el ‘tiempo hasta el primer token’ es particularmente notable. TTFT mide la latencia entre la entrada de un usuario y la respuesta inicial del modelo de IA. Un TTFT más bajo se traduce en una experiencia de usuario más receptiva e interactiva, lo que es crucial para aplicaciones como chatbots, traducción en tiempo real y finalización de código.
Modelos de visión de IA:
La inclusión de modelos de visión de IA (IBM Granite Vision y Google Gemma) demuestra la versatilidad del Ryzen AI Max+ 395. Estos modelos se utilizan para tareas como el reconocimiento de imágenes, la detección de objetos y el análisis de video. El sólido rendimiento en estos benchmarks sugiere la idoneidad del chip para aplicaciones más allá del procesamiento del lenguaje.
La importancia de las ventajas arquitectónicas
Las decisiones arquitectónicas de AMD juegan un papel crucial en las diferencias de rendimiento observadas.
Gráficos integrados (RDNA 3.5):
La potente unidad de gráficos integrada es un diferenciador clave. A diferencia de las soluciones de gráficos integradas tradicionales, que a menudo tienen dificultades con cargas de trabajo exigentes, la arquitectura RDNA 3.5 proporciona un aumento significativo en el rendimiento, lo que permite al Ryzen AI Max+ 395 manejar las tareas de IA de manera más efectiva. Las 40 CU representan una capacidad computacional sustancial.
Número de núcleos:
El mayor número de núcleos (ocho núcleos más que el Core Ultra 7 258V) proporciona una ventaja general en las cargas de trabajo multiproceso. Si bien el procesamiento de IA a menudo depende en gran medida de la GPU, la CPU aún juega un papel en la gestión de tareas y el manejo de ciertos aspectos del cálculo.
TDP configurable:
El TDP más alto permite una mayor flexibilidad en la gestión de la energía. Si bien significa un mayor consumo de energía, también permite que el chip funcione a velocidades de reloj más altas y mantenga el rendimiento durante períodos más largos, particularmente en cargas de trabajo de IA exigentes. La capacidad de configurar el TDP hasta 120W proporciona una ventaja significativa sobre la potencia turbo máxima más restringida de 37W del Core Ultra 7 258V. Este es un factor crucial para lograr las ventajas de rendimiento observadas.
El panorama de la computación móvil: Un campo de batalla cambiante
La competencia entre AMD e Intel en el espacio móvil se ha intensificado en los últimos años, con ambas compañías superando los límites del rendimiento y la eficiencia. La introducción de Lunar Lake representó el enfoque de Intel en la eficiencia energética, mientras que el Ryzen AI Max+ 395 de AMD prioriza claramente el rendimiento, particularmente en las cargas de trabajo de IA.
La próxima batalla con las GPU móviles de la serie RTX 50 de NVIDIA será una prueba significativa para AMD. Si bien NVIDIA ha dominado tradicionalmente el mercado de gráficos móviles de gama alta, los avances de AMD en gráficos integrados y capacidades de procesamiento de IA lo posicionan como un fuerte contendiente. Los problemas de la cadena de suministro que enfrenta NVIDIA podrían darle a AMD una ventaja en términos de disponibilidad y penetración en el mercado.
Las afirmaciones de un rendimiento de IA superior frente a la GPU para laptops RTX 4090 son audaces, pero si se corroboran, representarían un cambio significativo en el panorama competitivo. Indicaría que la solución integrada de AMD puede competir con, y potencialmente superar, las soluciones de gráficos discretos en ciertas aplicaciones centradas en la IA. Este sería un logro importante y podría tener implicaciones significativas para el futuro de la computación móvil. El énfasis en el rendimiento de la IA es una clara indicación de la dirección en la que se dirige la industria. A medida que la IA se integra cada vez más en las aplicaciones cotidianas, la demanda de procesadores que puedan manejar estas cargas de trabajo de manera eficiente y efectiva seguirá creciendo.