Ryzen AI Max+ 395 miażdży Lunar Lake

Bezpośrednie porównanie: Ryzen AI Max+ 395 kontra Core Ultra 7 258V

Aby zademonstrować możliwości Ryzen AI Max+ 395, AMD przeprowadziło serię testów, porównując go z Core Ultra 7 258V firmy Intel (wyposażonym w grafikę Arc 140V). Testy porównawcze koncentrowały się na różnych dużych modelach językowych (LLM) i konfiguracjach LLM, w tym na znanych modelach, takich jak DeepSeek R1 i Llama.

Uwaga dotycząca konfiguracji pamięci:

Aby zapewnić uczciwe porównanie, rozmiary modeli zostały ograniczone do 16 GB. To ograniczenie zostało wprowadzone, aby uwzględnić ograniczenia pamięci laptopów z procesorami Lunar Lake, które są obecnie dostępne z maksymalnie 32 GB pamięci. Wykorzystane systemy testowe to:

  • Ryzen AI Max+ 395: Asus ROG Flow Z13 z 64 GB pamięci.
  • Core Ultra 7 258V: Asus Zenbook S14 z 32 GB pamięci.

Wydajność DeepSeek R1: Znacząca przewaga

W testach porównawczych DeepSeek R1 układ Ryzen wykazał się imponującą przewagą. Wyniki, mierzone w tokenach na sekundę, były następujące:

  • Distill Qwen 1.5b: Do 2,1 razy szybciej niż odpowiednik Intela.
  • Distill Qwen 7b: Do 2,2 razy szybciej.
  • Distill Llama 8b: Do 2,1 razy szybciej.
  • Distill Qwen 14b: Do 2,2 razy szybciej.

Testy porównawcze Phi 4 i Llama 3.2: Utrzymanie dominacji

Ryzen AI Max+ 395 nadal przewyższał Core Ultra 7 258V w testach wykorzystujących modele Phi 4 i Llama 3.2:

  • Phi 4 Mini Instruct 3.8b: Do 2,1 razy szybciej.
  • Phi 4 14b: Do 2,2 razy szybciej.
  • Llama 3.2 3b Instruct: Do 2,1 razy szybciej.

Czas do pierwszego tokena: Kluczowy wskaźnik

AMD skupiło się również na wskaźniku ‘czasu do pierwszego tokena’, kluczowym wskaźniku responsywności w aplikacjach AI. W tych testach porównawczych Ryzen AI Max+ 395 wykazał jeszcze większą przewagę:

  • DeepSeek R1 Distill Qwen 14b: Do 12,2 razy szybciej.
  • Nawet w scenariuszach, w których przewaga wydajności układu Zen 5 była najmniej wyraźna (Phi 4 Mini Instruct 3.8b i Llama 3.2 3b Instruct), układ AMD nadal utrzymywał 4-krotną przewagę prędkości nad Core Ultra 7 258V.

Modele AI Vision: Dalsze zwiększanie przewagi

Dominacja wydajności Ryzen AI Max+ 395 rozszerzyła się na modele AI Vision, ponownie przy użyciu podejścia benchmarkingowego ‘czas do pierwszego tokena’:

  • IBM Granite Vision 3.2 2B: Do 7 razy szybciej niż 258V.
  • Google Gemma 3.4b: Do 4,6 razy szybciej.
  • Google Gemma 3 12b: Do 6 razy szybciej.

Zalety architektury: Źródło doskonałej wydajności

Imponujące wyniki wydajności zaprezentowane przez Ryzen AI Max+ 395 firmy AMD są w dużej mierze przypisywane kilku kluczowym zaletom architektury:

  • Wydajna zintegrowana grafika: Zintegrowany układ graficzny w procesorze Ryzen AI Max posiada 40 jednostek obliczeniowych (CU) RDNA 3.5, zapewniając wydajność, która konkuruje z dedykowanymi rozwiązaniami graficznymi.
  • Wyższa liczba rdzeni: Ryzen AI Max+ 395 ma o osiem więcej rdzeni CPU niż Core Ultra 7 258V, co przyczynia się do zwiększonych możliwości przetwarzania.
  • Konfigurowalne TDP: Układ Ryzen ma znacznie wyższe konfigurowalne TDP (Thermal Design Power), oceniane na maksymalnie 120 W, co pozwala na większy zapas wydajności.

Uwagi dotyczące zużycia energii:

Należy zauważyć, że Ryzen AI Max+ 395 zużywa znacznie więcej energii niż Core Ultra 7 258V, który ma maksymalną moc turbo 37 W. Jednak pomimo tej różnicy oba układy są przeznaczone dla tego samego segmentu rynku i są przeznaczone do cienkich i lekkich laptopów.

Spojrzenie w przyszłość: Konkurencja z mobilnymi GPU NVIDIA RTX serii 50

Krajobraz komputerów mobilnych stale się zmienia, a kolejnym wyzwaniem dla nowych mobilnych APU firmy AMD będą prawdopodobnie mobilne układy GPU NVIDIA RTX serii 50. Chociaż raporty sugerują potencjalne problemy z łańcuchem dostaw i opóźnienia w premierze tych układów GPU w nadchodzących laptopach do gier z serii RTX 50, niewątpliwie będą one stanowić główną konkurencję dla AMD pod względem surowej wydajności, niezależnie od różnic w obudowie.

Wczesne wskazania przeciwko dedykowanym GPU:

Co ciekawe, AMD już ogłosiło, że Ryzen AI Max+ 395 ma lepszą wydajność AI w porównaniu z laptopowym GPU NVIDIA RTX 4090, co sugeruje silną pozycję konkurencyjną nawet w stosunku do dedykowanych rozwiązań graficznych. Jest to oświadczenie wyprzedzające i z pewnością ekscytuje tych, którzy czekają na niezależne recenzje.

Głębsze spojrzenie na wyniki testów porównawczych

Dostarczone dane z testów porównawczych jasno pokazują, że AMD koncentruje się na wydajności AI. Wybór modeli i konfiguracji podkreśla rosnące znaczenie wydajnego i responsywnego przetwarzania AI w nowoczesnych zadaniach obliczeniowych.

Duże modele językowe (LLM):

Wykorzystanie DeepSeek R1 i Llama, dwóch znanych LLM, demonstruje zdolność Ryzen AI Max+ 395 do obsługi złożonych zadań przetwarzania języka naturalnego. Wskaźnik ‘tokenów na sekundę’ jest standardową miarą wydajności w tym obszarze, wskazując, jak szybko procesor może generować tekst lub przetwarzać dane wejściowe oparte na języku.

Destylacja:

Włączenie wersji ‘Distill’ modeli (np. Distill Qwen 1.5b) sugeruje skupienie się na wydajności modelu. Destylacja to technika używana do tworzenia mniejszych, szybszych wersji większych modeli przy zachowaniu dużej części ich dokładności. Jest to szczególnie istotne w przypadku urządzeń mobilnych, gdzie zużycie energii i ograniczenia pamięci są krytyczne.

Phi 4 i Llama 3.2:

Dodanie modeli Phi 4 i Llama 3.2 zapewnia szerszą perspektywę wydajności układu w różnych architekturach AI i rozmiarach modeli.

Czas do pierwszego tokena (TTFT):

Nacisk na ‘czas do pierwszego tokena’ jest szczególnie godny uwagi. TTFT mierzy opóźnienie między danymi wejściowymi użytkownika a początkową odpowiedzią modelu AI. Niższy TTFT przekłada się na bardziej responsywne i interaktywne doświadczenie użytkownika, co jest kluczowe dla aplikacji takich jak chatboty, tłumaczenie w czasie rzeczywistym i uzupełnianie kodu.

Modele AI Vision:

Włączenie modeli AI Vision (IBM Granite Vision i Google Gemma) demonstruje wszechstronność Ryzen AI Max+ 395. Modele te są używane do zadań takich jak rozpoznawanie obrazów, wykrywanie obiektów i analiza wideo. Wysoka wydajność w tych testach porównawczych sugeruje, że układ nadaje się do zastosowań wykraczających poza samo przetwarzanie języka.

Znaczenie zalet architektury

Decyzje architektoniczne AMD odgrywają kluczową rolę w obserwowanych różnicach wydajności.

Zintegrowana grafika (RDNA 3.5):

Wydajna zintegrowana jednostka graficzna jest kluczowym wyróżnikiem. W przeciwieństwie do tradycyjnych zintegrowanych rozwiązań graficznych, które często mają trudności z wymagającymi obciążeniami, architektura RDNA 3.5 zapewnia znaczny wzrost wydajności, umożliwiając Ryzen AI Max+ 395 bardziej efektywną obsługę zadań AI. 40 CU reprezentuje znaczną moc obliczeniową.

Liczba rdzeni:

Wyższa liczba rdzeni (o osiem więcej rdzeni niż Core Ultra 7 258V) zapewnia ogólną przewagę w obciążeniach wielowątkowych. Chociaż przetwarzanie AI często w dużym stopniu opiera się na GPU, CPU nadal odgrywa rolę w zarządzaniu zadaniami i obsłudze niektórych aspektów obliczeń.

Konfigurowalne TDP:

Wyższe TDP pozwala na większą elastyczność w zarządzaniu energią. Chociaż oznacza to wyższe zużycie energii, umożliwia również układowi pracę z wyższymi częstotliwościami taktowania i utrzymanie wydajności przez dłuższy czas, szczególnie w wymagających obciążeniach AI. Możliwość skonfigurowania TDP do 120 W zapewnia znaczną przewagę nad bardziej ograniczoną maksymalną mocą turbo 37 W Core Ultra 7 258V. Jest to kluczowy czynnik w osiąganiu obserwowanych przewag wydajności.

Krajobraz komputerów mobilnych: Zmieniające się pole bitwy

Konkurencja między AMD i Intelem w przestrzeni mobilnej nasiliła się w ostatnich latach, a obie firmy przesuwają granice wydajności i efektywności. Wprowadzenie Lunar Lake reprezentowało skupienie się Intela na efektywności energetycznej, podczas gdy Ryzen AI Max+ 395 firmy AMD wyraźnie priorytetyzuje wydajność, szczególnie w obciążeniach AI.

Nadchodząca bitwa z mobilnymi układami GPU NVIDIA RTX serii 50 będzie znaczącym testem dla AMD. Chociaż NVIDIA tradycyjnie dominuje na rynku wysokiej klasy mobilnych układów graficznych, postępy AMD w zakresie zintegrowanej grafiki i możliwości przetwarzania AI pozycjonują ją jako silnego konkurenta. Zgłaszane problemy z łańcuchem dostaw, z którymi boryka się NVIDIA, mogą potencjalnie dać AMD przewagę pod względem dostępności i penetracji rynku.

Twierdzenia o wyższej wydajności AI w porównaniu z laptopowym GPU RTX 4090 są odważne, ale jeśli zostaną potwierdzone, będą oznaczać znaczącą zmianę w krajobrazie konkurencyjnym. Wskazywałoby to, że zintegrowane rozwiązanie AMD może konkurować, a potencjalnie przewyższać, dedykowane rozwiązania graficzne w niektórych aplikacjach zorientowanych na AI. Byłoby to duże osiągnięcie i mogłoby mieć znaczące implikacje dla przyszłości komputerów mobilnych. Nacisk na wydajność AI jest wyraźnym wskazaniem kierunku, w którym zmierza branża. W miarę jak AI staje się coraz bardziej zintegrowana z codziennymi aplikacjami, zapotrzebowanie na procesory, które mogą obsługiwać te obciążenia wydajnie i skutecznie, będzie nadal rosło.