Ryzen AI Max+ 395 يتفوق على Lunar Lake

Ryzen AI Max+ 395 ضد Core Ultra 7 258V: المواجهة

لإظهار براعة Ryzen AI Max+ 395، أجرت AMD سلسلة من الاختبارات، ووضعتها في مواجهة Core Ultra 7 258V من Intel (المجهز برسومات Arc 140V). ركزت المعايير على نماذج لغوية كبيرة (LLMs) وتكوينات LLM مختلفة، بما في ذلك نماذج بارزة مثل DeepSeek R1 و Llama.

ملاحظة حول تكوينات الذاكرة:

لضمان إجراء مقارنة عادلة، تم تحديد أحجام النماذج بـ 16 جيجابايت. تم تنفيذ هذا القيد لمراعاة قيود الذاكرة لأجهزة الكمبيوتر المحمولة التي تعمل بنظام Lunar Lake، والمتوفرة حاليًا بحد أقصى 32 جيجابايت من الذاكرة. كانت أنظمة الاختبار المستخدمة هي:

  • Ryzen AI Max+ 395: Asus ROG Flow Z13 مع 64 جيجابايت من الذاكرة.
  • Core Ultra 7 258V: Asus Zenbook S14 مع 32 جيجابايت من الذاكرة.

أداء DeepSeek R1: تقدم كبير

في معايير DeepSeek R1، أظهرت شريحة Ryzen تقدمًا كبيرًا. كانت النتائج، التي تم قياسها بالرموز المميزة في الثانية، كما يلي:

  • Distill Qwen 1.5b: أسرع بما يصل إلى 2.1 مرة من نظيره Intel.
  • Distill Qwen 7b: أسرع بما يصل إلى 2.2 مرة.
  • Distill Llama 8b: أسرع بما يصل إلى 2.1 مرة.
  • Distill Qwen 14b: أسرع بما يصل إلى 2.2 مرة.

معايير Phi 4 و Llama 3.2: الحفاظ على الهيمنة

واصل Ryzen AI Max+ 395 التفوق على Core Ultra 7 258V في الاختبارات التي تستخدم نماذج Phi 4 و Llama 3.2:

  • Phi 4 Mini Instruct 3.8b: أسرع بما يصل إلى 2.1 مرة.
  • Phi 4 14b: أسرع بما يصل إلى 2.2 مرة.
  • Llama 3.2 3b Instruct: أسرع بما يصل إلى 2.1 مرة.

وقت الرمز المميز الأول: مقياس رئيسي

ركزت AMD أيضًا على مقياس ‘وقت الرمز المميز الأول’، وهو مؤشر حاسم للاستجابة في تطبيقات الذكاء الاصطناعي. في هذه المعايير، أظهر Ryzen AI Max+ 395 تقدمًا أكبر:

  • DeepSeek R1 Distill Qwen 14b: أسرع بما يصل إلى 12.2 مرة.
  • حتى في السيناريوهات التي كان فيها تفوق أداء شريحة Zen 5 هو الأقل وضوحًا (Phi 4 Mini Instruct 3.8b و Llama 3.2 3b Instruct)، لا تزال شريحة AMD تحتفظ بميزة سرعة 4x على Core Ultra 7 258V.

نماذج رؤية الذكاء الاصطناعي: توسيع نطاق التقدم

امتد تفوق أداء Ryzen AI Max+ 395 إلى نماذج رؤية الذكاء الاصطناعي، مرة أخرى باستخدام نهج قياس ‘وقت الرمز المميز الأول’:

  • IBM Granite Vision 3.2 2B: أسرع بما يصل إلى 7 مرات من 258V.
  • Google Gemma 3.4b: أسرع بما يصل إلى 4.6 مرات.
  • Google Gemma 3 12b: أسرع بما يصل إلى 6 مرات.

المزايا المعمارية: مصدر الأداء المتفوق

تُعزى أرقام الأداء الرائعة التي أظهرها Ryzen AI Max+ 395 من AMD إلى حد كبير إلى العديد من المزايا المعمارية الرئيسية:

  • رسومات مدمجة قوية: تفتخر شريحة الرسومات المدمجة داخل وحدة المعالجة المركزية Ryzen AI Max بـ 40 وحدة حساب RDNA 3.5 (CUs)، مما يوفر أداءً ينافس حلول الرسومات المنفصلة.
  • عدد نوى أعلى: يتميز Ryzen AI Max+ 395 بثمانية نوى CPU أكثر من Core Ultra 7 258V، مما يساهم في تحسين قدرات المعالجة.
  • TDP قابل للتكوين: تتمتع شريحة Ryzen بـ TDP (طاقة التصميم الحراري) أعلى بكثير وقابل للتكوين، يصل إلى 120 واط، مما يسمح بمساحة أكبر للأداء.

اعتبارات استهلاك الطاقة:

من المهم الاعتراف بأن Ryzen AI Max+ 395 يستهلك طاقة أكبر بكثير من Core Ultra 7 258V، الذي يبلغ الحد الأقصى لطاقة التوربو 37 واط. ومع ذلك، على الرغم من هذا الاختلاف، تستهدف كلتا الشريحتين نفس قطاع السوق ومصممتان لأجهزة الكمبيوتر المحمولة الرقيقة والخفيفة.

التطلع إلى الأمام: المنافسة مع سلسلة RTX 50 من NVIDIA

يتطور مشهد الحوسبة المتنقلة باستمرار، ومن المرجح أن يأتي التحدي التالي لوحدات APU المحمولة الجديدة من AMD من وحدات معالجة الرسومات المحمولة RTX 50-series من NVIDIA. في حين تشير التقارير إلى وجود مشكلات محتملة في سلسلة التوريد وتأخيرات في إطلاق وحدات معالجة الرسومات هذه في أجهزة الكمبيوتر المحمولة المخصصة للألعاب من سلسلة RTX 50 القادمة، إلا أنها ستمثل بلا شك المنافسة الأساسية لـ AMD من حيث الأداء الخام، بغض النظر عن اختلافات عامل الشكل.

مؤشرات مبكرة ضد وحدات معالجة الرسومات المنفصلة:

ومن المثير للاهتمام، أن AMD قد قدمت بالفعل ادعاءات حول أداء الذكاء الاصطناعي المتفوق لـ Ryzen AI Max+ 395 مقارنة بوحدة معالجة الرسومات المحمولة RTX 4090 من NVIDIA، مما يشير إلى موقف تنافسي قوي حتى ضد حلول الرسومات المنفصلة. إنه بيان استباقي، ومن المؤكد أنه سيثير حماس أولئك الذين ينتظرون مراجعات مستقلة.

التعمق في نتائج المعايير

ترسم بيانات المعايير المقدمة صورة واضحة لتركيز AMD على أداء الذكاء الاصطناعي. يسلط اختيار النماذج والتكوينات الضوء على الأهمية المتزايدة لمعالجة الذكاء الاصطناعي الفعالة والمتجاوبة في مهام الحوسبة الحديثة.

نماذج اللغة الكبيرة (LLMs):

يوضح استخدام DeepSeek R1 و Llama، وهما نموذجان لغويان كبيران بارزان، قدرة Ryzen AI Max+ 395 على التعامل مع مهام معالجة اللغة الطبيعية المعقدة. يعد مقياس ‘الرموز المميزة في الثانية’ مقياسًا قياسيًا للأداء في هذا المجال، مما يشير إلى مدى سرعة المعالج في إنشاء نص أو معالجة المدخلات القائمة على اللغة.

التقطير (Distillation):

يشير تضمين إصدارات ‘Distill’ من النماذج (على سبيل المثال، Distill Qwen 1.5b) إلى التركيز على كفاءة النموذج. التقطير هو أسلوب يستخدم لإنشاء إصدارات أصغر وأسرع من النماذج الأكبر مع الاحتفاظ بالكثير من دقتها. هذا مهم بشكل خاص للأجهزة المحمولة حيث يكون استهلاك الطاقة وقيود الذاكرة أمرًا بالغ الأهمية.

Phi 4 و Llama 3.2:

توفر إضافة نماذج Phi 4 و Llama 3.2 منظورًا أوسع لأداء الشريحة عبر معماريات ونماذج ذكاء اصطناعي مختلفة.

وقت الرمز المميز الأول (TTFT):

التركيز على ‘وقت الرمز المميز الأول’ جدير بالملاحظة بشكل خاص. يقيس TTFT زمن الوصول بين إدخال المستخدم والاستجابة الأولية من نموذج الذكاء الاصطناعي. يترجم TTFT الأقل إلى تجربة مستخدم أكثر استجابة وتفاعلية، وهو أمر بالغ الأهمية لتطبيقات مثل روبوتات الدردشة والترجمة في الوقت الفعلي وإكمال التعليمات البرمجية.

نماذج رؤية الذكاء الاصطناعي:

يوضح تضمين نماذج رؤية الذكاء الاصطناعي (IBM Granite Vision و Google Gemma) تعدد استخدامات Ryzen AI Max+ 395. تُستخدم هذه النماذج لمهام مثل التعرف على الصور واكتشاف الكائنات وتحليل الفيديو. يشير الأداء القوي في هذه المعايير إلى ملاءمة الشريحة للتطبيقات التي تتجاوز مجرد معالجة اللغة.

أهمية المزايا المعمارية

تلعب القرارات المعمارية لـ AMD دورًا حاسمًا في اختلافات الأداء الملحوظة.

الرسومات المدمجة (RDNA 3.5):

تعد وحدة الرسومات المدمجة القوية عاملاً مميزًا رئيسيًا. على عكس حلول الرسومات المدمجة التقليدية، التي غالبًا ما تعاني من أعباء العمل الصعبة، توفر بنية RDNA 3.5 دفعة كبيرة في الأداء، مما يمكّن Ryzen AI Max+ 395 من التعامل مع مهام الذكاء الاصطناعي بشكل أكثر فعالية. تمثل 40 وحدة CU قدرة حسابية كبيرة.

عدد النوى:

يوفر عدد النوى الأعلى (ثمانية نوى أكثر من Core Ultra 7 258V) ميزة عامة في أعباء العمل متعددة الخيوط. في حين أن معالجة الذكاء الاصطناعي غالبًا ما تعتمد بشكل كبير على وحدة معالجة الرسومات، إلا أن وحدة المعالجة المركزية لا تزال تلعب دورًا في إدارة المهام والتعامل مع جوانب معينة من الحساب.

TDP القابل للتكوين:

يسمح TDP الأعلى بمرونة أكبر في إدارة الطاقة. في حين أنه يعني استهلاكًا أعلى للطاقة، فإنه يمكّن الشريحة أيضًا من العمل بسرعات أعلى والحفاظ على الأداء لفترات أطول، خاصة في أعباء عمل الذكاء الاصطناعي الصعبة. تعد القدرة على تكوين TDP حتى 120 واط ميزة كبيرة مقارنة بحد أقصى لطاقة التوربو الأكثر تقييدًا البالغ 37 واط لـ Core Ultra 7 258V. هذا عامل حاسم في تحقيق تقدم الأداء الملحوظ.

مشهد الحوسبة المتنقلة: ساحة معركة متغيرة

اشتدت المنافسة بين AMD و Intel في مجال الأجهزة المحمولة في السنوات الأخيرة، حيث دفعت الشركتان حدود الأداء والكفاءة. يمثل تقديم Lunar Lake تركيز Intel على كفاءة الطاقة، بينما يعطي Ryzen AI Max+ 395 من AMD الأولوية للأداء، خاصة في أعباء عمل الذكاء الاصطناعي.

ستكون المعركة القادمة مع وحدات معالجة الرسومات المحمولة RTX 50-series من NVIDIA اختبارًا مهمًا لـ AMD. في حين أن NVIDIA قد هيمنت تقليديًا على سوق الرسومات المحمولة المتطورة، فإن التطورات التي حققتها AMD في الرسومات المدمجة وقدرات معالجة الذكاء الاصطناعي تضعها كمنافس قوي. يمكن أن تمنح مشكلات سلسلة التوريد التي تواجه NVIDIA AMD ميزة من حيث التوفر واختراق السوق.

إن الادعاءات بأداء الذكاء الاصطناعي المتفوق ضد وحدة معالجة الرسومات المحمولة RTX 4090 جريئة، ولكن إذا تم إثباتها، فإنها ستمثل تحولًا كبيرًا في المشهد التنافسي. سيشير ذلك إلى أن حل AMD المتكامل يمكنه التنافس مع حلول الرسومات المنفصلة، وربما التفوق عليها، في تطبيقات معينة تركز على الذكاء الاصطناعي. سيكون هذا إنجازًا كبيرًا ويمكن أن يكون له آثار كبيرة على مستقبل الحوسبة المتنقلة. يعد التركيز على أداء الذكاء الاصطناعي مؤشرًا واضحًا على الاتجاه الذي تتجه إليه الصناعة. مع تزايد دمج الذكاء الاصطناعي في التطبيقات اليومية، سيستمر الطلب على المعالجات التي يمكنها التعامل مع أعباء العمل هذه بكفاءة وفعالية في النمو.