Ryzen AI Max+ 395: شکست Lunar Lake اینتل در هوش مصنوعی

رویارویی: Ryzen AI Max+ 395 در مقابل Core Ultra 7 258V

برای نشان دادن قدرت Ryzen AI Max+ 395، AMD یک سری آزمایش‌ها را انجام داد و آن را در مقابل Core Ultra 7 258V اینتل (مجهز به گرافیک Arc 140V) قرار داد. این بنچمارک‌ها بر روی مدل‌های مختلف زبان بزرگ (LLM) و پیکربندی‌های LLM، از جمله مدل‌های برجسته‌ای مانند DeepSeek R1 و Llama متمرکز بودند.

یادداشتی در مورد پیکربندی‌های حافظه:

برای اطمینان از مقایسه عادلانه، اندازه مدل‌ها به 16 گیگابایت محدود شد. این محدودیت برای در نظر گرفتن محدودیت‌های حافظه لپ‌تاپ‌های مجهز به Lunar Lake اعمال شد که در حال حاضر حداکثر با 32 گیگابایت حافظه در دسترس هستند. سیستم‌های آزمایشی مورد استفاده عبارت بودند از:

  • Ryzen AI Max+ 395: ایسوس ROG Flow Z13 با 64 گیگابایت حافظه.
  • Core Ultra 7 258V: ایسوس Zenbook S14 با 32 گیگابایت حافظه.

عملکرد DeepSeek R1: یک پیشروی قابل توجه

در بنچمارک‌های DeepSeek R1، تراشه Ryzen یک پیشروی چشمگیر را نشان داد. نتایج، که بر حسب توکن در ثانیه اندازه‌گیری شدند، به شرح زیر بودند:

  • Distill Qwen 1.5b: تا 2.1 برابر سریع‌تر از همتای اینتل.
  • Distill Qwen 7b: تا 2.2 برابر سریع‌تر.
  • Distill Llama 8b: تا 2.1 برابر سریع‌تر.
  • Distill Qwen 14b: تا 2.2 برابر سریع‌تر.

بنچمارک‌های Phi 4 و Llama 3.2: حفظ تسلط

Ryzen AI Max+ 395 همچنان در تست‌های انجام شده با استفاده از مدل‌های Phi 4 و Llama 3.2 از Core Ultra 7 258V پیشی گرفت:

  • Phi 4 Mini Instruct 3.8b: تا 2.1 برابر سریع‌تر.
  • Phi 4 14b: تا 2.2 برابر سریع‌تر.
  • Llama 3.2 3b Instruct: تا 2.1 برابر سریع‌تر.

زمان تا اولین توکن: یک معیار کلیدی

AMD همچنین بر معیار “زمان تا اولین توکن” تمرکز کرد، که یک شاخص مهم پاسخگویی در برنامه‌های کاربردی هوش مصنوعی است. در این بنچمارک‌ها، Ryzen AI Max+ 395 پیشروی‌های چشمگیرتری را نشان داد:

  • DeepSeek R1 Distill Qwen 14b: تا 12.2 برابر سریع‌تر.
  • حتی در سناریوهایی که مزیت عملکرد تراشه Zen 5 کمترین میزان را داشت (Phi 4 Mini Instruct 3.8b و Llama 3.2 3b Instruct)، تراشه AMD همچنان 4 برابر سریعتر از Core Ultra 7 258V بود.

مدل‌های بینایی هوش مصنوعی: گسترش بیشتر پیشروی

برتری عملکرد Ryzen AI Max+ 395 به مدل‌های بینایی هوش مصنوعی نیز گسترش یافت، و باز هم از روش بنچمارک “زمان تا اولین توکن” استفاده شد:

  • IBM Granite Vision 3.2 2B: تا 7 برابر سریع‌تر از 258V.
  • Google Gemma 3.4b: تا 4.6 برابر سریع‌تر.
  • Google Gemma 3 12b: تا 6 برابر سریع‌تر.

مزایای معماری: منبع عملکرد برتر

ارقام عملکرد چشمگیر نشان داده شده توسط Ryzen AI Max+ 395 AMD عمدتاً به چندین مزیت کلیدی معماری نسبت داده می‌شود:

  • گرافیک یکپارچه قدرتمند: تراشه گرافیکی یکپارچه در CPU Ryzen AI Max دارای 40 واحد محاسباتی (CU) RDNA 3.5 است که عملکردی را ارائه می‌دهد که با راه‌حل‌های گرافیکی مجزا رقابت می‌کند.
  • تعداد هسته بالاتر: Ryzen AI Max+ 395 دارای هشت هسته CPU بیشتر از Core Ultra 7 258V است که به قابلیت‌های پردازشی پیشرفته کمک می‌کند.
  • TDP قابل تنظیم: تراشه Ryzen دارای TDP (توان طراحی حرارتی) قابل تنظیم به طور قابل توجهی بالاتر است که تا 120 وات رتبه‌بندی شده است و امکان عملکرد بیشتر را فراهم می‌کند.

ملاحظات مصرف برق:

مهم است که بدانیم Ryzen AI Max+ 395 به طور قابل توجهی بیشتر از Core Ultra 7 258V انرژی مصرف می‌کند، که حداکثر توان توربو آن 37 وات است. با این حال، با وجود این تفاوت، هر دو تراشه یک بخش بازار را هدف قرار می‌دهند و برای لپ‌تاپ‌های PC نازک و سبک طراحی شده‌اند.

نگاهی به آینده: رقابت با سری RTX 50 انویدیا

چشم‌انداز محاسبات موبایل دائماً در حال تحول است و چالش بعدی برای APUهای موبایل جدید AMD احتمالاً از GPUهای موبایل سری RTX 50 انویدیا خواهد بود. در حالی که گزارش‌ها حاکی از مشکلات احتمالی زنجیره تامین و تاخیر در عرضه این GPUها در لپ‌تاپ‌های گیمینگ سری RTX 50 آینده است، آنها بدون شک رقابت اصلی AMD را از نظر عملکرد خام، صرف نظر از تفاوت‌های ظاهری، نشان خواهند داد.

نشانه‌های اولیه در برابر GPUهای مجزا:

جالب توجه است که AMD قبلاً ادعاهایی در مورد عملکرد برتر هوش مصنوعی Ryzen AI Max+ 395 در مقایسه با GPU لپ‌تاپ RTX 4090 انویدیا داشته است، که نشان‌دهنده موضع رقابتی قوی حتی در برابر راه‌حل‌های گرافیکی مجزا است. این یک اظهار نظر پیشگیرانه است، و مطمئناً کسانی را که منتظر بررسی‌های مستقل هستند بسیار هیجان زده خواهد کرد.

بررسی عمیق‌تر نتایج بنچمارک

داده‌های بنچمارک ارائه شده، تصویر واضحی از تمرکز AMD بر عملکرد هوش مصنوعی را نشان می‌دهد. انتخاب مدل‌ها و پیکربندی‌ها، اهمیت روزافزون پردازش هوش مصنوعی کارآمد و پاسخگو را در وظایف محاسباتی مدرن برجسته می‌کند.

مدل‌های زبان بزرگ (LLM):

استفاده از DeepSeek R1 و Llama، دو LLM برجسته، توانایی Ryzen AI Max+ 395 را برای انجام وظایف پیچیده پردازش زبان طبیعی نشان می‌دهد. معیار “توکن در ثانیه” یک معیار استاندارد عملکرد در این زمینه است که نشان می‌دهد پردازنده با چه سرعتی می‌تواند متن تولید کند یا ورودی‌های مبتنی بر زبان را پردازش کند.

تقطیر (Distillation):

گنجاندن نسخه‌های “Distill” مدل‌ها (به عنوان مثال، Distill Qwen 1.5b) نشان دهنده تمرکز بر کارایی مدل است. تقطیر تکنیکی است که برای ایجاد نسخه‌های کوچکتر و سریعتر از مدل‌های بزرگتر استفاده می‌شود، در حالی که بخش زیادی از دقت آنها حفظ می‌شود. این امر به ویژه برای دستگاه‌های تلفن همراه که مصرف برق و محدودیت‌های حافظه در آنها حیاتی است، اهمیت دارد.

Phi 4 و Llama 3.2:

افزودن مدل‌های Phi 4 و Llama 3.2 چشم‌انداز وسیع‌تری از عملکرد تراشه در معماری‌های مختلف هوش مصنوعی و اندازه‌های مدل ارائه می‌دهد.

زمان تا اولین توکن (TTFT):

تاکید بر “زمان تا اولین توکن” به ویژه قابل توجه است. TTFT تاخیر بین ورودی کاربر و پاسخ اولیه مدل هوش مصنوعی را اندازه گیری می‌کند. TTFT پایین‌تر به معنای تجربه کاربری پاسخگوتر و تعاملی‌تر است که برای برنامه‌هایی مانند ربات‌های گفتگو، ترجمه همزمان و تکمیل کد بسیار مهم است.

مدل‌های بینایی هوش مصنوعی:

گنجاندن مدل‌های بینایی هوش مصنوعی (IBM Granite Vision و Google Gemma) تطبیق پذیری Ryzen AI Max+ 395 را نشان می‌دهد. این مدل‌ها برای وظایفی مانند تشخیص تصویر، تشخیص اشیا و تجزیه و تحلیل ویدیو استفاده می‌شوند. عملکرد قوی در این بنچمارک‌ها نشان دهنده مناسب بودن تراشه برای برنامه‌های کاربردی فراتر از پردازش زبان است.

اهمیت مزایای معماری

تصمیمات معماری AMD نقش مهمی در تفاوت‌های عملکرد مشاهده شده ایفا می‌کند.

گرافیک یکپارچه (RDNA 3.5):

واحد گرافیکی یکپارچه قدرتمند یک عامل متمایز کننده کلیدی است. برخلاف راه‌حل‌های گرافیکی یکپارچه سنتی، که اغلب با بارهای کاری سنگین دست و پنجه نرم می‌کنند، معماری RDNA 3.5 افزایش قابل توجهی در عملکرد ارائه می‌دهد و Ryzen AI Max+ 395 را قادر می‌سازد تا وظایف هوش مصنوعی را به طور موثرتری انجام دهد. 40 واحد CU نشان دهنده ظرفیت محاسباتی قابل توجهی است.

تعداد هسته:

تعداد هسته بالاتر (هشت هسته بیشتر از Core Ultra 7 258V) یک مزیت کلی در بارهای کاری چند رشته‌ای فراهم می‌کند. در حالی که پردازش هوش مصنوعی اغلب به شدت به GPU متکی است، CPU همچنان در مدیریت وظایف و رسیدگی به جنبه‌های خاصی از محاسبات نقش دارد.

TDP قابل تنظیم:

TDP بالاتر امکان انعطاف پذیری بیشتر در مدیریت توان را فراهم می‌کند. در حالی که به معنای مصرف برق بالاتر است، همچنین تراشه را قادر می‌سازد تا در سرعت‌های کلاک بالاتر کار کند و عملکرد را برای دوره‌های طولانی‌تر، به ویژه در بارهای کاری هوش مصنوعی سخت، حفظ کند. توانایی پیکربندی TDP تا 120 وات، مزیت قابل توجهی نسبت به حداکثر توان توربو 37 وات محدودتر Core Ultra 7 258V ارائه می‌دهد. این یک عامل حیاتی در دستیابی به پیشروی‌های عملکرد مشاهده شده است.

چشم انداز محاسبات موبایل: یک میدان نبرد در حال تغییر

رقابت بین AMD و اینتل در فضای موبایل در سال‌های اخیر تشدید شده است و هر دو شرکت مرزهای عملکرد و کارایی را جابجا کرده‌اند. معرفی Lunar Lake نشان دهنده تمرکز اینتل بر بهره‌وری انرژی بود، در حالی که Ryzen AI Max+ 395 AMD به وضوح عملکرد، به ویژه در بارهای کاری هوش مصنوعی را در اولویت قرار می‌دهد.

نبرد آتی با GPUهای موبایل سری RTX 50 انویدیا یک آزمایش مهم برای AMD خواهد بود. در حالی که انویدیا به طور سنتی بر بازار گرافیک موبایل رده بالا تسلط داشته است، پیشرفت‌های AMD در گرافیک یکپارچه و قابلیت‌های پردازش هوش مصنوعی، آن را به عنوان یک رقیب قوی معرفی می‌کند. مشکلات زنجیره تامین گزارش شده که انویدیا با آن مواجه است، می‌تواند به طور بالقوه به AMD از نظر در دسترس بودن و نفوذ در بازار مزیتی بدهد.

ادعاهای عملکرد برتر هوش مصنوعی در برابر GPU لپ‌تاپ RTX 4090 جسورانه هستند، اما اگر اثبات شوند، نشان دهنده تغییر قابل توجهی در چشم انداز رقابتی خواهند بود. این نشان می‌دهد که راه‌حل یکپارچه AMD می‌تواند با راه‌حل‌های گرافیکی مجزا در برنامه‌های خاص متمرکز بر هوش مصنوعی رقابت کند و بالقوه از آنها پیشی بگیرد. این یک دستاورد بزرگ خواهد بود و می‌تواند پیامدهای قابل توجهی برای آینده محاسبات موبایل داشته باشد. تاکید بر عملکرد هوش مصنوعی نشانه روشنی از مسیری است که صنعت به آن سمت می‌رود. از آنجایی که هوش مصنوعی به طور فزاینده‌ای در برنامه‌های روزمره ادغام می‌شود، تقاضا برای پردازنده‌هایی که بتوانند این بارهای کاری را به طور موثر و کارآمد انجام دهند، همچنان افزایش خواهد یافت.