Ryzen AI 395: Intel Lunar Lake KO

Confronto Diretto: Ryzen AI Max+ 395 vs. Core Ultra 7 258V

AMD ha presentato le prestazioni del suo Ryzen AI Max+ 395, mostrando un vantaggio significativo rispetto alle CPU Lunar Lake di Intel, focalizzate sull’efficienza, in particolare il Core Ultra 7 258V, in una serie di benchmark AI. Un recente post sul blog dell’azienda evidenzia le capacità del nuovo chip Zen 5 + RDNA 3.5, affermando un vantaggio prestazionale fino a 12,2 volte in determinati carichi di lavoro AI.

Per dimostrare la potenza del Ryzen AI Max+ 395, AMD ha condotto una serie di test, confrontandolo con il Core Ultra 7 258V di Intel (dotato di grafica Arc 140V). I benchmark si sono concentrati su vari modelli linguistici di grandi dimensioni (LLM) e configurazioni LLM, inclusi modelli importanti come DeepSeek R1 e Llama.

Nota sulle Configurazioni di Memoria:

Per garantire un confronto equo, le dimensioni dei modelli sono state limitate a 16 GB. Questa limitazione è stata implementata per tenere conto delle limitazioni di memoria dei laptop basati su Lunar Lake, che sono attualmente disponibili con un massimo di 32 GB di memoria. I sistemi di test utilizzati sono stati:

  • Ryzen AI Max+ 395: Asus ROG Flow Z13 con 64 GB di memoria.
  • Core Ultra 7 258V: Asus Zenbook S14 con 32 GB di memoria.

Prestazioni DeepSeek R1: Un Vantaggio Significativo

Nei benchmark DeepSeek R1, il chip Ryzen ha dimostrato un vantaggio dominante. I risultati, misurati in token al secondo, sono stati i seguenti:

  • Distill Qwen 1.5b: Fino a 2,1 volte più veloce della controparte Intel.
  • Distill Qwen 7b: Fino a 2,2 volte più veloce.
  • Distill Llama 8b: Fino a 2,1 volte più veloce.
  • Distill Qwen 14b: Fino a 2,2 volte più veloce.

Benchmark Phi 4 e Llama 3.2: Mantenimento del Dominio

Il Ryzen AI Max+ 395 ha continuato a superare il Core Ultra 7 258V nei test utilizzando i modelli Phi 4 e Llama 3.2:

  • Phi 4 Mini Instruct 3.8b: Fino a 2,1 volte più veloce.
  • Phi 4 14b: Fino a 2,2 volte più veloce.
  • Llama 3.2 3b Instruct: Fino a 2,1 volte più veloce.

Tempo al Primo Token: Una Metrica Chiave

AMD si è anche concentrata sulla metrica del “tempo al primo token”, un indicatore cruciale della reattività nelle applicazioni AI. In questi benchmark, il Ryzen AI Max+ 395 ha mostrato vantaggi ancora più sostanziali:

  • DeepSeek R1 Distill Qwen 14b: Fino a 12,2 volte più veloce.
  • Anche negli scenari in cui il vantaggio prestazionale del chip Zen 5 era meno pronunciato (Phi 4 Mini Instruct 3.8b e Llama 3.2 3b Instruct), il chip AMD ha comunque mantenuto un vantaggio di velocità di 4 volte rispetto al Core Ultra 7 258V.

Modelli di Visione AI: Ulteriore Estensione del Vantaggio

Il dominio prestazionale del Ryzen AI Max+ 395 si è esteso ai modelli di visione AI, sempre utilizzando l’approccio di benchmarking “tempo al primo token”:

  • IBM Granite Vision 3.2 2B: Fino a 7 volte più veloce del 258V.
  • Google Gemma 3.4b: Fino a 4,6 volte più veloce.
  • Google Gemma 3 12b: Fino a 6 volte più veloce.

Vantaggi Architetturali: La Fonte di Prestazioni Superiori

Le impressionanti prestazioni dimostrate dal Ryzen AI Max+ 395 di AMD sono in gran parte attribuite a diversi vantaggi architetturali chiave:

  • Potente Grafica Integrata: Il chip grafico integrato all’interno della CPU Ryzen AI Max vanta 40 unità di calcolo (CU) RDNA 3.5, fornendo prestazioni che rivaleggiano con le soluzioni grafiche discrete.
  • Conteggio Core Superiore: Il Ryzen AI Max+ 395 presenta otto core CPU in più rispetto al Core Ultra 7 258V, contribuendo a migliorare le capacità di elaborazione.
  • TDP Configurabile: Il chip Ryzen ha un TDP (Thermal Design Power) configurabile significativamente più alto, fino a 120 W, consentendo un maggiore margine di prestazioni.

Considerazioni sul Consumo Energetico:

È importante riconoscere che il Ryzen AI Max+ 395 consuma molta più energia rispetto al Core Ultra 7 258V, che ha una potenza turbo massima di 37 W. Tuttavia, nonostante questa differenza, entrambi i chip si rivolgono allo stesso segmento di mercato e sono progettati per PC portatili sottili e leggeri.

Guardando Avanti: Competizione con la Serie RTX 50 di NVIDIA

Il panorama del mobile computing è in continua evoluzione e la prossima sfida per le nuove APU mobili di AMD verrà probabilmente dalle GPU mobili della serie RTX 50 di NVIDIA. Mentre i rapporti suggeriscono potenziali problemi alla catena di approvvigionamento e ritardi per il lancio di queste GPU nei prossimi laptop da gioco della serie RTX 50, rappresenteranno senza dubbio la principale concorrenza di AMD in termini di prestazioni pure, indipendentemente dalle differenze di fattore di forma.

Prime Indicazioni Contro le GPU Discrete:

È interessante notare che AMD ha già affermato la superiorità delle prestazioni AI del Ryzen AI Max+ 395 rispetto alla GPU per laptop RTX 4090 di NVIDIA, suggerendo una forte posizione competitiva anche contro le soluzioni grafiche discrete. È una dichiarazione preventiva, e sicuramente entusiasmerà coloro che attendono recensioni indipendenti.

Approfondimento dei Risultati dei Benchmark

I dati di benchmark forniti dipingono un quadro chiaro dell’attenzione di AMD sulle prestazioni AI. La scelta dei modelli e delle configurazioni evidenzia la crescente importanza di un’elaborazione AI efficiente e reattiva nelle moderne attività di elaborazione.

Modelli Linguistici di Grandi Dimensioni (LLM):

L’uso di DeepSeek R1 e Llama, due importanti LLM, dimostra la capacità del Ryzen AI Max+ 395 di gestire complesse attività di elaborazione del linguaggio naturale. La metrica “token al secondo” è una misura standard delle prestazioni in quest’area, che indica la velocità con cui il processore può generare testo o elaborare input basati sul linguaggio.

Distillazione:

L’inclusione delle versioni “Distill” dei modelli (ad esempio, Distill Qwen 1.5b) suggerisce un’attenzione all’efficienza del modello. La distillazione è una tecnica utilizzata per creare versioni più piccole e veloci di modelli più grandi, pur mantenendo gran parte della loro accuratezza. Ciò è particolarmente rilevante per i dispositivi mobili in cui il consumo energetico e i vincoli di memoria sono fondamentali.

Phi 4 e Llama 3.2:

L’aggiunta dei modelli Phi 4 e Llama 3.2 fornisce una prospettiva più ampia sulle prestazioni del chip su diverse architetture AI e dimensioni del modello.

Tempo al Primo Token (TTFT):

L’enfasi sul “tempo al primo token” è particolarmente degna di nota. Il TTFT misura la latenza tra l’input di un utente e la risposta iniziale del modello AI. Un TTFT inferiore si traduce in un’esperienza utente più reattiva e interattiva, che è cruciale per applicazioni come chatbot, traduzione in tempo reale e completamento del codice.

Modelli di Visione AI:

L’inclusione di modelli di visione AI (IBM Granite Vision e Google Gemma) dimostra la versatilità del Ryzen AI Max+ 395. Questi modelli vengono utilizzati per attività come il riconoscimento di immagini, il rilevamento di oggetti e l’analisi video. Le ottime prestazioni in questi benchmark suggeriscono l’idoneità del chip per applicazioni che vanno oltre la semplice elaborazione del linguaggio.

L’Importanza dei Vantaggi Architetturali

Le decisioni architetturali di AMD giocano un ruolo cruciale nelle differenze di prestazioni osservate.

Grafica Integrata (RDNA 3.5):

La potente unità grafica integrata è un fattore di differenziazione chiave. A differenza delle tradizionali soluzioni grafiche integrate, che spesso faticano con carichi di lavoro impegnativi, l’architettura RDNA 3.5 fornisce un significativo aumento delle prestazioni, consentendo al Ryzen AI Max+ 395 di gestire le attività AI in modo più efficace. Le 40 CU rappresentano una notevole capacità computazionale.

Conteggio Core:

Il conteggio core più elevato (otto core in più rispetto al Core Ultra 7 258V) fornisce un vantaggio generale nei carichi di lavoro multithread. Mentre l’elaborazione AI si basa spesso pesantemente sulla GPU, la CPU svolge comunque un ruolo nella gestione delle attività e nella gestione di alcuni aspetti del calcolo.

TDP Configurabile:

Il TDP più elevato consente una maggiore flessibilità nella gestione dell’alimentazione. Sebbene significhi un consumo energetico maggiore, consente anche al chip di funzionare a velocità di clock più elevate e di sostenere le prestazioni per periodi più lunghi, in particolare in carichi di lavoro AI impegnativi. La possibilità di configurare il TDP fino a 120 W offre un vantaggio significativo rispetto alla potenza turbo massima di 37 W, più limitata, del Core Ultra 7 258V. Questo è un fattore cruciale per ottenere i vantaggi prestazionali osservati.

Il Panorama del Mobile Computing: Un Campo di Battaglia in Evoluzione

La competizione tra AMD e Intel nel settore mobile si è intensificata negli ultimi anni, con entrambe le società che spingono i limiti delle prestazioni e dell’efficienza. L’introduzione di Lunar Lake ha rappresentato l’attenzione di Intel sull’efficienza energetica, mentre il Ryzen AI Max+ 395 di AMD dà chiaramente la priorità alle prestazioni, in particolare nei carichi di lavoro AI.

La prossima battaglia con le GPU mobili della serie RTX 50 di NVIDIA sarà un test significativo per AMD. Mentre NVIDIA ha tradizionalmente dominato il mercato della grafica mobile di fascia alta, i progressi di AMD nella grafica integrata e nelle capacità di elaborazione AI la posizionano come un forte contendente. I problemi segnalati alla catena di approvvigionamento che NVIDIA deve affrontare potrebbero potenzialmente dare ad AMD un vantaggio in termini di disponibilità e penetrazione del mercato.

Le affermazioni di prestazioni AI superiori rispetto alla GPU per laptop RTX 4090 sono audaci, ma se confermate, rappresenterebbero un cambiamento significativo nel panorama competitivo. Indicherebbe che la soluzione integrata di AMD può competere con, e potenzialmente superare, le soluzioni grafiche discrete in determinate applicazioni focalizzate sull’AI. Questo sarebbe un risultato importante e potrebbe avere implicazioni significative per il futuro del mobile computing. L’enfasi sulle prestazioni AI è una chiara indicazione della direzione in cui si sta muovendo il settore. Man mano che l’AI diventa sempre più integrata nelle applicazioni quotidiane, la domanda di processori in grado di gestire questi carichi di lavoro in modo efficiente ed efficace continuerà a crescere.