Ryzen AI 300: До 12 пъти по-бърз от Lunar Lake | bg

Сравнение: Ryzen AI Max+ 395 срещу Core Ultra 7 258V

За да демонстрира възможностите на Ryzen AI Max+ 395, AMD провежда серия от тестове, изправяйки го срещу Intel Core Ultra 7 258V (оборудван с Arc 140V графика). Бенчмарковете се фокусират върху различни големи езикови модели (LLMs) и LLM конфигурации, включително известни модели като DeepSeek R1 и Llama.

Бележка за конфигурациите на паметта:

За да се осигури честно сравнение, размерите на моделите са ограничени до 16GB. Това ограничение е въведено, за да се вземат предвид ограниченията на паметта на лаптопите, задвижвани от Lunar Lake, които в момента се предлагат с максимум 32GB памет. Използваните тестови системи са:

Ryzen AI Max+ 395: Asus ROG Flow Z13 с 64GB памет.
Core Ultra 7 258V: Asus Zenbook S14 с 32GB памет.

Производителност на DeepSeek R1: Значителна преднина

В бенчмарковете на DeepSeek R1, чипът на Ryzen демонстрира значителна преднина. Резултатите, измерени в токени в секунда, са както следва:

Distill Qwen 1.5b: До 2.1 пъти по-бърз от аналога на Intel.
Distill Qwen 7b: До 2.2 пъти по-бърз.
Distill Llama 8b: До 2.1 пъти по-бърз.
Distill Qwen 14b: До 2.2 пъти по-бърз.

Бенчмаркове на Phi 4 и Llama 3.2: Поддържане на доминация

Ryzen AI Max+ 395 продължава да превъзхожда Core Ultra 7 258V в тестове, използващи модели Phi 4 и Llama 3.2:

Phi 4 Mini Instruct 3.8b: До 2.1 пъти по-бърз.
Phi 4 14b: До 2.2 пъти по-бърз.
Llama 3.2 3b Instruct: До 2.1 пъти по-бърз.

Време до първия токен: Ключов показател

AMD също така се фокусира върху показателя „време до първия токен“, ключов индикатор за отзивчивостта в AI приложенията. В тези бенчмаркове, Ryzen AI Max+ 395 показва още по-значителни преднини:

DeepSeek R1 Distill Qwen 14b: До 12.2 пъти по-бърз.
Дори в сценариите, където предимството в производителността на Zen 5 чипа е най-малко изразено (Phi 4 Mini Instruct 3.8b и Llama 3.2 3b Instruct), чипът на AMD все още поддържа 4 пъти по-висока скорост от Core Ultra 7 258V.

AI Vision модели: Допълнително разширяване на преднината

Доминацията в производителността на Ryzen AI Max+ 395 се разпростира и върху AI vision моделите, отново използвайки подхода за бенчмаркинг „време до първия токен“:

IBM Granite Vision 3.2 2B: До 7 пъти по-бърз от 258V.
Google Gemma 3.4b: До 4.6 пъти по-бърз.
Google Gemma 3 12b: До 6 пъти по-бърз.

Архитектурни предимства: Източникът на превъзходна производителност

Впечатляващите данни за производителността, демонстрирани от Ryzen AI Max+ 395 на AMD, се дължат до голяма степен на няколко ключови архитектурни предимства:

Мощна интегрирана графика: Интегрираният графичен чип в Ryzen AI Max CPU разполага с 40 RDNA 3.5 изчислителни единици (CUs), осигуряващи производителност, която съперничи на дискретните графични решения.
По-голям брой ядра: Ryzen AI Max+ 395 разполага с осем повече CPU ядра от Core Ultra 7 258V, което допринася за подобрени възможности за обработка.
Конфигурируем TDP: Чипът на Ryzen има значително по-висок конфигурируем TDP (Thermal Design Power), оценен до 120W, което позволява по-голям запас от производителност.

Съображения за консумация на енергия:

Важно е да се признае, че Ryzen AI Max+ 395 консумира значително повече енергия от Core Ultra 7 258V, който има максимална турбо мощност от 37W. Въпреки тази разлика, и двата чипа са насочени към един и същ пазарен сегмент и са предназначени за тънки и леки лаптопи.

Поглед напред: Конкуренция с RTX 50-серията на NVIDIA

Пейзажът на мобилните компютри непрекъснато се развива и следващото предизвикателство за новите мобилни APU на AMD вероятно ще дойде от мобилните GPU от серията RTX 50 на NVIDIA. Докато докладите сочат потенциални проблеми с веригата за доставки и закъснения за пускането на тези GPU в предстоящите геймърски лаптопи от серията RTX 50, те несъмнено ще представляват основната конкуренция на AMD по отношение на сурова производителност, независимо от разликите във форм фактора.

Ранни индикации срещу дискретни GPU:

Интересното е, че AMD вече направи изявления за превъзходната AI производителност на Ryzen AI Max+ 395 в сравнение с лаптопния GPU RTX 4090 на NVIDIA, което предполага силна конкурентна позиция дори срещу дискретни графични решения. Това е изпреварващо изявление и такова, което със сигурност ще развълнува онези, които очакват независими ревюта.

По-задълбочено вникване в резултатите от бенчмарковете

Предоставените данни от бенчмарковете рисуват ясна картина на фокуса на AMD върху AI производителността. Изборът на модели и конфигурации подчертава нарастващото значение на ефективната и отзивчива AI обработка в съвременните изчислителни задачи.

Големи езикови модели (LLMs):

Използването на DeepSeek R1 и Llama, два известни LLM, демонстрира способността на Ryzen AI Max+ 395 да се справя със сложни задачи за обработка на естествен език. Показателят „токени в секунда“ е стандартна мярка за производителност в тази област, показваща колко бързо процесорът може да генерира текст или да обработва езикови входове.

Дестилация (Distillation):

Включването на „Distill“ версии на моделите (напр. Distill Qwen 1.5b) предполага фокус върху ефективността на модела. Дестилацията е техника, използвана за създаване на по-малки, по-бързи версии на по-големи модели, като същевременно се запазва голяма част от тяхната точност. Това е особено важно за мобилни устройства, където консумацията на енергия и ограниченията на паметта са критични.

Phi 4 и Llama 3.2:

Добавянето на моделите Phi 4 и Llama 3.2 осигурява по-широка перспектива за производителността на чипа в различни AI архитектури и размери на моделите.

Време до първия токен (TTFT):

Акцентът върху „времето до първия токен“ е особено забележителен. TTFT измерва латентността между въвеждането на потребителя и първоначалния отговор от AI модела. По-ниският TTFT се превръща в по-отзивчиво и интерактивно потребителско изживяване, което е от решаващо значение за приложения като чатботове, превод в реално време и завършване на код.

AI Vision модели:

Включването на AI vision модели (IBM Granite Vision и Google Gemma) демонстрира гъвкавостта на Ryzen AI Max+ 395. Тези модели се използват за задачи като разпознаване на изображения, откриване на обекти и видео анализ. Силната производителност в тези бенчмаркове предполага пригодността на чипа за приложения извън обработката на езици.

Значението на архитектурните предимства

Архитектурните решения на AMD играят решаваща роля в наблюдаваните разлики в производителността.

Интегрирана графика (RDNA 3.5):

Мощният интегриран графичен модул е ключов отличителен белег. За разлика от традиционните интегрирани графични решения, които често се борят с взискателни работни натоварвания, архитектурата RDNA 3.5 осигурява значително повишаване на производителността, позволявайки на Ryzen AI Max+ 395 да се справя с AI задачите по-ефективно. 40-те CUs представляват значителен изчислителен капацитет.

Брой ядра:

По-големият брой ядра (осем повече ядра от Core Ultra 7 258V) осигурява общо предимство при многонишкови работни натоварвания. Докато AI обработката често разчита в голяма степен на GPU, CPU все още играе роля в управлението на задачите и обработката на определени аспекти на изчислението.

Конфигурируем TDP:

По-високият TDP позволява по-голяма гъвкавост в управлението на захранването. Въпреки че означава по-висока консумация на енергия, той също така позволява на чипа да работи на по-високи тактови честоти и да поддържа производителност за по-дълги периоди, особено при взискателни AI работни натоварвания. Възможността за конфигуриране на TDP до 120W осигурява значително предимство пред по-ограничената 37W максимална турбо мощност на Core Ultra 7 258V. Това е решаващ фактор за постигане на наблюдаваните преднини в производителността.

Пейзажът на мобилните компютри: Променящо се бойно поле

Конкуренцията между AMD и Intel в мобилното пространство се засили през последните години, като и двете компании разширяват границите на производителността и ефективността. Въвеждането на Lunar Lake представлява фокуса на Intel върху енергийната ефективност, докато Ryzen AI Max+ 395 на AMD ясно дава приоритет на производителността, особено в AI работните натоварвания.

Предстоящата битка с мобилните GPU от серията RTX 50 на NVIDIA ще бъде значителен тест за AMD. Докато NVIDIA традиционно доминира на пазара на мобилни графични карти от висок клас, напредъкът на AMD в интегрираната графика и възможностите за AI обработка го позиционират като силен претендент. Докладваните проблеми с веригата за доставки, пред които е изправена NVIDIA, биха могли потенциално да дадат на AMD предимство по отношение на наличността и навлизането на пазара.

Твърденията за превъзходна AI производителност спрямо лаптопния GPU RTX 4090 са смели, но ако бъдат обосновани, те биха представлявали значителна промяна в конкурентния пейзаж. Това би означавало, че интегрираното решение на AMD може да се конкурира с и потенциално да превъзхожда дискретните графични решения в определени AI-фокусирани приложения. Това би било голямо постижение и би могло да има значителни последици за бъдещето на мобилните компютри. Акцентът върху AI производителността е ясна индикация за посоката, в която се движи индустрията. Тъй като AI става все по-интегриран в ежедневните приложения, търсенето на процесори, които могат да се справят с тези работни натоварвания ефективно и ефикасно, ще продължи да расте.

актуализирано на 2025-03-18

# AIGC # AMD # Llama