رویارویی: Ryzen AI Max+ 395 در مقابل Core Ultra 7 258V
برای نشان دادن قدرت Ryzen AI Max+ 395، AMD یک سری آزمایشها را انجام داد و آن را در مقابل Core Ultra 7 258V اینتل (مجهز به گرافیک Arc 140V) قرار داد. این بنچمارکها بر روی مدلهای مختلف زبان بزرگ (LLM) و پیکربندیهای LLM، از جمله مدلهای برجستهای مانند DeepSeek R1 و Llama متمرکز بودند.
یادداشتی در مورد پیکربندیهای حافظه:
برای اطمینان از مقایسه عادلانه، اندازه مدلها به 16 گیگابایت محدود شد. این محدودیت برای در نظر گرفتن محدودیتهای حافظه لپتاپهای مجهز به Lunar Lake اعمال شد که در حال حاضر حداکثر با 32 گیگابایت حافظه در دسترس هستند. سیستمهای آزمایشی مورد استفاده عبارت بودند از:
- Ryzen AI Max+ 395: ایسوس ROG Flow Z13 با 64 گیگابایت حافظه.
- Core Ultra 7 258V: ایسوس Zenbook S14 با 32 گیگابایت حافظه.
عملکرد DeepSeek R1: یک پیشروی قابل توجه
در بنچمارکهای DeepSeek R1، تراشه Ryzen یک پیشروی چشمگیر را نشان داد. نتایج، که بر حسب توکن در ثانیه اندازهگیری شدند، به شرح زیر بودند:
- Distill Qwen 1.5b: تا 2.1 برابر سریعتر از همتای اینتل.
- Distill Qwen 7b: تا 2.2 برابر سریعتر.
- Distill Llama 8b: تا 2.1 برابر سریعتر.
- Distill Qwen 14b: تا 2.2 برابر سریعتر.
بنچمارکهای Phi 4 و Llama 3.2: حفظ تسلط
Ryzen AI Max+ 395 همچنان در تستهای انجام شده با استفاده از مدلهای Phi 4 و Llama 3.2 از Core Ultra 7 258V پیشی گرفت:
- Phi 4 Mini Instruct 3.8b: تا 2.1 برابر سریعتر.
- Phi 4 14b: تا 2.2 برابر سریعتر.
- Llama 3.2 3b Instruct: تا 2.1 برابر سریعتر.
زمان تا اولین توکن: یک معیار کلیدی
AMD همچنین بر معیار “زمان تا اولین توکن” تمرکز کرد، که یک شاخص مهم پاسخگویی در برنامههای کاربردی هوش مصنوعی است. در این بنچمارکها، Ryzen AI Max+ 395 پیشرویهای چشمگیرتری را نشان داد:
- DeepSeek R1 Distill Qwen 14b: تا 12.2 برابر سریعتر.
- حتی در سناریوهایی که مزیت عملکرد تراشه Zen 5 کمترین میزان را داشت (Phi 4 Mini Instruct 3.8b و Llama 3.2 3b Instruct)، تراشه AMD همچنان 4 برابر سریعتر از Core Ultra 7 258V بود.
مدلهای بینایی هوش مصنوعی: گسترش بیشتر پیشروی
برتری عملکرد Ryzen AI Max+ 395 به مدلهای بینایی هوش مصنوعی نیز گسترش یافت، و باز هم از روش بنچمارک “زمان تا اولین توکن” استفاده شد:
- IBM Granite Vision 3.2 2B: تا 7 برابر سریعتر از 258V.
- Google Gemma 3.4b: تا 4.6 برابر سریعتر.
- Google Gemma 3 12b: تا 6 برابر سریعتر.
مزایای معماری: منبع عملکرد برتر
ارقام عملکرد چشمگیر نشان داده شده توسط Ryzen AI Max+ 395 AMD عمدتاً به چندین مزیت کلیدی معماری نسبت داده میشود:
- گرافیک یکپارچه قدرتمند: تراشه گرافیکی یکپارچه در CPU Ryzen AI Max دارای 40 واحد محاسباتی (CU) RDNA 3.5 است که عملکردی را ارائه میدهد که با راهحلهای گرافیکی مجزا رقابت میکند.
- تعداد هسته بالاتر: Ryzen AI Max+ 395 دارای هشت هسته CPU بیشتر از Core Ultra 7 258V است که به قابلیتهای پردازشی پیشرفته کمک میکند.
- TDP قابل تنظیم: تراشه Ryzen دارای TDP (توان طراحی حرارتی) قابل تنظیم به طور قابل توجهی بالاتر است که تا 120 وات رتبهبندی شده است و امکان عملکرد بیشتر را فراهم میکند.
ملاحظات مصرف برق:
مهم است که بدانیم Ryzen AI Max+ 395 به طور قابل توجهی بیشتر از Core Ultra 7 258V انرژی مصرف میکند، که حداکثر توان توربو آن 37 وات است. با این حال، با وجود این تفاوت، هر دو تراشه یک بخش بازار را هدف قرار میدهند و برای لپتاپهای PC نازک و سبک طراحی شدهاند.
نگاهی به آینده: رقابت با سری RTX 50 انویدیا
چشمانداز محاسبات موبایل دائماً در حال تحول است و چالش بعدی برای APUهای موبایل جدید AMD احتمالاً از GPUهای موبایل سری RTX 50 انویدیا خواهد بود. در حالی که گزارشها حاکی از مشکلات احتمالی زنجیره تامین و تاخیر در عرضه این GPUها در لپتاپهای گیمینگ سری RTX 50 آینده است، آنها بدون شک رقابت اصلی AMD را از نظر عملکرد خام، صرف نظر از تفاوتهای ظاهری، نشان خواهند داد.
نشانههای اولیه در برابر GPUهای مجزا:
جالب توجه است که AMD قبلاً ادعاهایی در مورد عملکرد برتر هوش مصنوعی Ryzen AI Max+ 395 در مقایسه با GPU لپتاپ RTX 4090 انویدیا داشته است، که نشاندهنده موضع رقابتی قوی حتی در برابر راهحلهای گرافیکی مجزا است. این یک اظهار نظر پیشگیرانه است، و مطمئناً کسانی را که منتظر بررسیهای مستقل هستند بسیار هیجان زده خواهد کرد.
بررسی عمیقتر نتایج بنچمارک
دادههای بنچمارک ارائه شده، تصویر واضحی از تمرکز AMD بر عملکرد هوش مصنوعی را نشان میدهد. انتخاب مدلها و پیکربندیها، اهمیت روزافزون پردازش هوش مصنوعی کارآمد و پاسخگو را در وظایف محاسباتی مدرن برجسته میکند.
مدلهای زبان بزرگ (LLM):
استفاده از DeepSeek R1 و Llama، دو LLM برجسته، توانایی Ryzen AI Max+ 395 را برای انجام وظایف پیچیده پردازش زبان طبیعی نشان میدهد. معیار “توکن در ثانیه” یک معیار استاندارد عملکرد در این زمینه است که نشان میدهد پردازنده با چه سرعتی میتواند متن تولید کند یا ورودیهای مبتنی بر زبان را پردازش کند.
تقطیر (Distillation):
گنجاندن نسخههای “Distill” مدلها (به عنوان مثال، Distill Qwen 1.5b) نشان دهنده تمرکز بر کارایی مدل است. تقطیر تکنیکی است که برای ایجاد نسخههای کوچکتر و سریعتر از مدلهای بزرگتر استفاده میشود، در حالی که بخش زیادی از دقت آنها حفظ میشود. این امر به ویژه برای دستگاههای تلفن همراه که مصرف برق و محدودیتهای حافظه در آنها حیاتی است، اهمیت دارد.
Phi 4 و Llama 3.2:
افزودن مدلهای Phi 4 و Llama 3.2 چشمانداز وسیعتری از عملکرد تراشه در معماریهای مختلف هوش مصنوعی و اندازههای مدل ارائه میدهد.
زمان تا اولین توکن (TTFT):
تاکید بر “زمان تا اولین توکن” به ویژه قابل توجه است. TTFT تاخیر بین ورودی کاربر و پاسخ اولیه مدل هوش مصنوعی را اندازه گیری میکند. TTFT پایینتر به معنای تجربه کاربری پاسخگوتر و تعاملیتر است که برای برنامههایی مانند رباتهای گفتگو، ترجمه همزمان و تکمیل کد بسیار مهم است.
مدلهای بینایی هوش مصنوعی:
گنجاندن مدلهای بینایی هوش مصنوعی (IBM Granite Vision و Google Gemma) تطبیق پذیری Ryzen AI Max+ 395 را نشان میدهد. این مدلها برای وظایفی مانند تشخیص تصویر، تشخیص اشیا و تجزیه و تحلیل ویدیو استفاده میشوند. عملکرد قوی در این بنچمارکها نشان دهنده مناسب بودن تراشه برای برنامههای کاربردی فراتر از پردازش زبان است.
اهمیت مزایای معماری
تصمیمات معماری AMD نقش مهمی در تفاوتهای عملکرد مشاهده شده ایفا میکند.
گرافیک یکپارچه (RDNA 3.5):
واحد گرافیکی یکپارچه قدرتمند یک عامل متمایز کننده کلیدی است. برخلاف راهحلهای گرافیکی یکپارچه سنتی، که اغلب با بارهای کاری سنگین دست و پنجه نرم میکنند، معماری RDNA 3.5 افزایش قابل توجهی در عملکرد ارائه میدهد و Ryzen AI Max+ 395 را قادر میسازد تا وظایف هوش مصنوعی را به طور موثرتری انجام دهد. 40 واحد CU نشان دهنده ظرفیت محاسباتی قابل توجهی است.
تعداد هسته:
تعداد هسته بالاتر (هشت هسته بیشتر از Core Ultra 7 258V) یک مزیت کلی در بارهای کاری چند رشتهای فراهم میکند. در حالی که پردازش هوش مصنوعی اغلب به شدت به GPU متکی است، CPU همچنان در مدیریت وظایف و رسیدگی به جنبههای خاصی از محاسبات نقش دارد.
TDP قابل تنظیم:
TDP بالاتر امکان انعطاف پذیری بیشتر در مدیریت توان را فراهم میکند. در حالی که به معنای مصرف برق بالاتر است، همچنین تراشه را قادر میسازد تا در سرعتهای کلاک بالاتر کار کند و عملکرد را برای دورههای طولانیتر، به ویژه در بارهای کاری هوش مصنوعی سخت، حفظ کند. توانایی پیکربندی TDP تا 120 وات، مزیت قابل توجهی نسبت به حداکثر توان توربو 37 وات محدودتر Core Ultra 7 258V ارائه میدهد. این یک عامل حیاتی در دستیابی به پیشرویهای عملکرد مشاهده شده است.
چشم انداز محاسبات موبایل: یک میدان نبرد در حال تغییر
رقابت بین AMD و اینتل در فضای موبایل در سالهای اخیر تشدید شده است و هر دو شرکت مرزهای عملکرد و کارایی را جابجا کردهاند. معرفی Lunar Lake نشان دهنده تمرکز اینتل بر بهرهوری انرژی بود، در حالی که Ryzen AI Max+ 395 AMD به وضوح عملکرد، به ویژه در بارهای کاری هوش مصنوعی را در اولویت قرار میدهد.
نبرد آتی با GPUهای موبایل سری RTX 50 انویدیا یک آزمایش مهم برای AMD خواهد بود. در حالی که انویدیا به طور سنتی بر بازار گرافیک موبایل رده بالا تسلط داشته است، پیشرفتهای AMD در گرافیک یکپارچه و قابلیتهای پردازش هوش مصنوعی، آن را به عنوان یک رقیب قوی معرفی میکند. مشکلات زنجیره تامین گزارش شده که انویدیا با آن مواجه است، میتواند به طور بالقوه به AMD از نظر در دسترس بودن و نفوذ در بازار مزیتی بدهد.
ادعاهای عملکرد برتر هوش مصنوعی در برابر GPU لپتاپ RTX 4090 جسورانه هستند، اما اگر اثبات شوند، نشان دهنده تغییر قابل توجهی در چشم انداز رقابتی خواهند بود. این نشان میدهد که راهحل یکپارچه AMD میتواند با راهحلهای گرافیکی مجزا در برنامههای خاص متمرکز بر هوش مصنوعی رقابت کند و بالقوه از آنها پیشی بگیرد. این یک دستاورد بزرگ خواهد بود و میتواند پیامدهای قابل توجهی برای آینده محاسبات موبایل داشته باشد. تاکید بر عملکرد هوش مصنوعی نشانه روشنی از مسیری است که صنعت به آن سمت میرود. از آنجایی که هوش مصنوعی به طور فزایندهای در برنامههای روزمره ادغام میشود، تقاضا برای پردازندههایی که بتوانند این بارهای کاری را به طور موثر و کارآمد انجام دهند، همچنان افزایش خواهد یافت.