Ryzen AI 395+ verplettert Intel in AI | nl

Head-to-Head: Ryzen AI Max+ 395 vs. Core Ultra 7 258V

AMD heeft prestatieclaims onthuld voor zijn Ryzen AI Max+ 395, waarmee een aanzienlijk voordeel wordt aangetoond ten opzichte van Intel’s op efficiëntie gerichte Lunar Lake CPU’s, met name de Core Ultra 7 258V, in een reeks AI-benchmarks. Een recent blogbericht van het bedrijf benadrukt de mogelijkheden van de nieuwe Zen 5 + RDNA 3.5-chip, met een prestatievoorsprong tot 12,2 keer in bepaalde AI-workloads.

Om de kracht van de Ryzen AI Max+ 395 te demonstreren, voerde AMD een reeks tests uit, waarbij deze werd vergeleken met Intel’s Core Ultra 7 258V (uitgerust met Arc 140V graphics). De benchmarks waren gericht op verschillende grote taalmodellen (LLM’s) en LLM-configuraties, waaronder prominente modellen zoals DeepSeek R1 en Llama.

Een opmerking over geheugenconfiguraties:

Om een eerlijke vergelijking te garanderen, werden modelgroottes beperkt tot 16 GB. Deze beperking werd geïmplementeerd om rekening te houden met de geheugenbeperkingen van laptops met Lunar Lake, die momenteel beschikbaar zijn met maximaal 32 GB geheugen. De gebruikte testsystemen waren:

Ryzen AI Max+ 395: Asus ROG Flow Z13 met 64 GB geheugen.
Core Ultra 7 258V: Asus Zenbook S14 met 32 GB geheugen.

DeepSeek R1 Prestaties: Een aanzienlijke voorsprong

In de DeepSeek R1-benchmarks liet de Ryzen-chip een indrukwekkende voorsprong zien. De resultaten, gemeten in tokens per seconde, waren als volgt:

Distill Qwen 1.5b: Tot 2,1 keer sneller dan de Intel-tegenhanger.
Distill Qwen 7b: Tot 2,2 keer sneller.
Distill Llama 8b: Tot 2,1 keer sneller.
Distill Qwen 14b: Tot 2,2 keer sneller.

Phi 4 en Llama 3.2 Benchmarks: Behoud van dominantie

De Ryzen AI Max+ 395 bleef de Core Ultra 7 258V overtreffen in tests met Phi 4 en Llama 3.2 modellen:

Phi 4 Mini Instruct 3.8b: Tot 2,1 keer sneller.
Phi 4 14b: Tot 2,2 keer sneller.
Llama 3.2 3b Instruct: Tot 2,1 keer sneller.

Time to First Token: Een belangrijke metriek

AMD richtte zich ook op de “time to the first token”-metriek, een cruciale indicator voor de responsiviteit in AI-toepassingen. In deze benchmarks liet de Ryzen AI Max+ 395 nog grotere voorsprongen zien:

DeepSeek R1 Distill Qwen 14b: Tot 12,2 keer sneller.
Zelfs in de scenario’s waarin het prestatievoordeel van de Zen 5-chip het minst uitgesproken was (Phi 4 Mini Instruct 3.8b en Llama 3.2 3b Instruct), behield de AMD-chip nog steeds een 4x snelheidsvoordeel ten opzichte van de Core Ultra 7 258V.

AI Vision Modellen: Verdere uitbreiding van de voorsprong

De prestatiedominantie van de Ryzen AI Max+ 395 strekte zich uit tot AI-visiemodellen, opnieuw met behulp van de “time to the first token” benchmarking-aanpak:

IBM Granite Vision 3.2 2B: Tot 7 keer sneller dan de 258V.
Google Gemma 3.4b: Tot 4,6 keer sneller.
Google Gemma 3 12b: Tot 6 keer sneller.

Architecturale voordelen: De bron van superieure prestaties

De indrukwekkende prestatiecijfers van AMD’s Ryzen AI Max+ 395 worden grotendeels toegeschreven aan verschillende belangrijke architecturale voordelen:

Krachtige geïntegreerde graphics: De geïntegreerde grafische chip in de Ryzen AI Max CPU beschikt over 40 RDNA 3.5 compute units (CU’s), die prestaties leveren die vergelijkbaar zijn met discrete grafische oplossingen.
Hoger aantal cores: De Ryzen AI Max+ 395 heeft acht CPU-cores meer dan de Core Ultra 7 258V, wat bijdraagt aan verbeterde verwerkingsmogelijkheden.
Configureerbare TDP: De Ryzen-chip heeft een aanzienlijk hogere configureerbare TDP (Thermal Design Power), tot 120W, wat zorgt voor meer prestatieruimte.

Overwegingen met betrekking tot het stroomverbruik:

Het is belangrijk om te erkennen dat de Ryzen AI Max+ 395 aanzienlijk meer stroom verbruikt dan de Core Ultra 7 258V, die een maximaal turbovvermogen van 37W heeft. Ondanks dit verschil richten beide chips zich op hetzelfde marktsegment en zijn ze ontworpen voor dunne-en-lichte laptop-pc’s.

Vooruitblik: Concurrentie met NVIDIA’s RTX 50-serie

Het landschap van mobiel computergebruik evolueert voortdurend en de volgende uitdaging voor AMD’s nieuwe mobiele APU’s zal waarschijnlijk komen van NVIDIA’s RTX 50-serie mobiele GPU’s. Hoewel rapporten wijzen op potentiële problemen in de toeleveringsketen en vertragingen voor de lancering van deze GPU’s in aankomende RTX 50-serie gaming-laptops, zullen ze ongetwijfeld AMD’s belangrijkste concurrentie vormen in termen van ruwe prestaties, ongeacht de verschillen in vormfactor.

Vroege indicaties tegen discrete GPU’s:

Interessant is dat AMD al claims heeft gemaakt over de superieure AI-prestaties van de Ryzen AI Max+ 395 in vergelijking met NVIDIA’s RTX 4090 laptop-GPU, wat wijst op een sterke concurrentiepositie, zelfs tegen discrete grafische oplossingen. Het is een preventieve verklaring, en een die degenen die wachten op onafhankelijke beoordelingen zeker erg enthousiast zal maken.

Dieper ingaan op de benchmarkresultaten

De verstrekte benchmarkgegevens schetsen een duidelijk beeld van AMD’s focus op AI-prestaties. De keuze van modellen en configuraties benadrukt het groeiende belang van efficiënte en responsieve AI-verwerking in moderne computertaken.

Grote Taalmodellen (LLM’s):

Het gebruik van DeepSeek R1 en Llama, twee prominente LLM’s, toont het vermogen van de Ryzen AI Max+ 395 om complexe natuurlijke taalverwerkingstaken aan te kunnen. De metriek “tokens per seconde” is een standaard prestatiemaatstaf op dit gebied, die aangeeft hoe snel de processor tekst kan genereren of op taal gebaseerde invoer kan verwerken.

Distillatie:

De opname van “Distill”-versies van de modellen (bijv. Distill Qwen 1.5b) suggereert een focus op modelefficiëntie. Distillatie is een techniek die wordt gebruikt om kleinere, snellere versies van grotere modellen te maken, terwijl veel van hun nauwkeurigheid behouden blijft. Dit is met name relevant voor mobiele apparaten waar stroomverbruik en geheugenbeperkingen cruciaal zijn.

Phi 4 en Llama 3.2:

De toevoeging van Phi 4 en Llama 3.2 modellen biedt een breder perspectief op de prestaties van de chip over verschillende AI-architecturen en modelgroottes.

Time to First Token (TTFT):

De nadruk op “time to the first token” is bijzonder opmerkelijk. TTFT meet de latentie tussen de invoer van een gebruiker en de eerste reactie van het AI-model. Een lagere TTFT vertaalt zich in een responsievere en interactievere gebruikerservaring, wat cruciaal is voor toepassingen zoals chatbots, real-time vertaling en code-aanvulling.

AI Vision Modellen:

De opname van AI-visiemodellen (IBM Granite Vision en Google Gemma) toont de veelzijdigheid van de Ryzen AI Max+ 395. Deze modellen worden gebruikt voor taken zoals beeldherkenning, objectdetectie en videoanalyse. De sterke prestaties in deze benchmarks suggereren dat de chip geschikt is voor toepassingen die verder gaan dan alleen taalverwerking.

Het belang van architecturale voordelen

De architecturale beslissingen van AMD spelen een cruciale rol in de waargenomen prestatieverschillen.

Geïntegreerde Graphics (RDNA 3.5):

De krachtige geïntegreerde grafische eenheid is een belangrijke onderscheidende factor. In tegenstelling tot traditionele geïntegreerde grafische oplossingen, die vaak worstelen met veeleisende workloads, biedt de RDNA 3.5-architectuur een aanzienlijke prestatieverbetering, waardoor de Ryzen AI Max+ 395 AI-taken effectiever kan afhandelen. De 40 CU’s vertegenwoordigen een aanzienlijke rekencapaciteit.

Aantal Cores:

Het hogere aantal cores (acht meer cores dan de Core Ultra 7 258V) biedt een algemeen voordeel in multithreaded workloads. Hoewel AI-verwerking vaak sterk afhankelijk is van de GPU, speelt de CPU nog steeds een rol bij het beheren van taken en het afhandelen van bepaalde aspecten van de berekening.

Configureerbare TDP:

De hogere TDP zorgt voor meer flexibiliteit in energiebeheer. Hoewel het een hoger stroomverbruik betekent, stelt het de chip ook in staat om op hogere kloksnelheden te werken en de prestaties gedurende langere perioden te behouden, met name in veeleisende AI-workloads. De mogelijkheid om de TDP te configureren tot 120W biedt een aanzienlijk voordeel ten opzichte van het meer beperkte 37W maximale turbovvermogen van de Core Ultra 7 258V. Dit is een cruciale factor bij het behalen van de waargenomen prestatievoorsprongen.

Het landschap van mobiel computergebruik: Een verschuivend slagveld

De concurrentie tussen AMD en Intel in de mobiele ruimte is de afgelopen jaren geïntensiveerd, waarbij beide bedrijven de grenzen van prestaties en efficiëntie verleggen. De introductie van Lunar Lake vertegenwoordigde Intel’s focus op energie-efficiëntie, terwijl AMD’s Ryzen AI Max+ 395 duidelijk prioriteit geeft aan prestaties, met name in AI-workloads.

De aanstaande strijd met NVIDIA’s RTX 50-serie mobiele GPU’s zal een belangrijke test zijn voor AMD. Hoewel NVIDIA van oudsher de high-end mobiele grafische markt domineert, positioneren AMD’s vorderingen in geïntegreerde graphics en AI-verwerkingsmogelijkheden het als een sterke concurrent. De gerapporteerde problemen met de toeleveringsketen waarmee NVIDIA wordt geconfronteerd, zouden AMD potentieel een voordeel kunnen geven in termen van beschikbaarheid en marktpenetratie.

De claims van superieure AI-prestaties ten opzichte van de RTX 4090 laptop-GPU zijn gedurfd, maar als ze worden onderbouwd, zouden ze een aanzienlijke verschuiving in het concurrentielandschap betekenen. Het zou erop wijzen dat AMD’s geïntegreerde oplossing kan concurreren met, en mogelijk beter kan presteren dan, discrete grafische oplossingen in bepaalde AI-gerichte toepassingen. Dit zou een belangrijke prestatie zijn en zou aanzienlijke gevolgen kunnen hebben voor de toekomst van mobiel computergebruik. De nadruk op AI-prestaties is een duidelijke indicatie van de richting waarin de industrie zich beweegt. Naarmate AI steeds meer wordt geïntegreerd in alledaagse toepassingen, zal de vraag naar processors die deze workloads efficiënt en effectief kunnen afhandelen, blijven groeien.

bijgewerkt op 2025-03-18

# AIGC # AMD # Llama