ראש בראש: Ryzen AI Max+ 395 מול Core Ultra 7 258V
כדי להדגים את היכולת של Ryzen AI Max+ 395, AMD ביצעה סדרה של בדיקות, והעמידה אותו מול Core Ultra 7 258V של אינטל (מצויד בגרפיקה של Arc 140V). המדדים התמקדו במודלי שפה גדולים (LLMs) שונים ובתצורות LLM, כולל מודלים בולטים כמו DeepSeek R1 ו-Llama.
הערה על תצורות זיכרון:
כדי להבטיח השוואה הוגנת, גודלי הדגמים הוגבלו ל-16GB. מגבלה זו יושמה כדי להתחשב במגבלות הזיכרון של מחשבים ניידים המופעלים על ידי Lunar Lake, הזמינים כעת עם זיכרון של 32GB לכל היותר. מערכות הבדיקה שבהן נעשה שימוש היו:
- Ryzen AI Max+ 395: Asus ROG Flow Z13 עם 64GB זיכרון.
- Core Ultra 7 258V: Asus Zenbook S14 עם 32GB זיכרון.
ביצועי DeepSeek R1: יתרון משמעותי
במדדי DeepSeek R1, שבב Ryzen הדגים יתרון משמעותי. התוצאות, שנמדדו באסימונים לשנייה, היו כדלקמן:
- Distill Qwen 1.5b: מהיר עד פי 2.1 מהמקבילה של אינטל.
- Distill Qwen 7b: מהיר עד פי 2.2.
- Distill Llama 8b: מהיר עד פי 2.1.
- Distill Qwen 14b: מהיר עד פי 2.2.
מדדי Phi 4 ו-Llama 3.2: שמירה על דומיננטיות
Ryzen AI Max+ 395 המשיך לעלות בביצועיו על Core Ultra 7 258V בבדיקות באמצעות דגמי Phi 4 ו-Llama 3.2:
- Phi 4 Mini Instruct 3.8b: מהיר עד פי 2.1.
- Phi 4 14b: מהיר עד פי 2.2.
- Llama 3.2 3b Instruct: מהיר עד פי 2.1.
זמן לאסימון ראשון: מדד מפתח
AMD התמקדה גם במדד “זמן לאסימון הראשון”, אינדיקטור מכריע להיענות ביישומי AI. במדדים אלה, Ryzen AI Max+ 395 הציג יתרונות משמעותיים עוד יותר:
- DeepSeek R1 Distill Qwen 14b: מהיר עד פי 12.2.
- אפילו בתרחישים שבהם יתרון הביצועים של שבב Zen 5 היה הכי פחות בולט (Phi 4 Mini Instruct 3.8b ו-Llama 3.2 3b Instruct), שבב AMD עדיין שמר על יתרון מהירות פי 4 על פני Core Ultra 7 258V.
מודלים של AI Vision: הרחבת היתרון
הדומיננטיות בביצועים של Ryzen AI Max+ 395 התרחבה למודלים של AI vision, שוב תוך שימוש בגישת המדד “זמן לאסימון הראשון”:
- IBM Granite Vision 3.2 2B: מהיר עד פי 7 מה-258V.
- Google Gemma 3.4b: מהיר עד פי 4.6.
- Google Gemma 3 12b: מהיר עד פי 6.
יתרונות ארכיטקטוניים: מקור הביצועים המעולים
נתוני הביצועים המרשימים שהודגמו על ידי Ryzen AI Max+ 395 של AMD מיוחסים במידה רבה למספר יתרונות ארכיטקטוניים מרכזיים:
- גרפיקה משולבת רבת עוצמה: שבב הגרפיקה המשולב בתוך מעבד Ryzen AI Max מתגאה ב-40 יחידות מחשוב (CUs) של RDNA 3.5, המספק ביצועים המתחרים בפתרונות גרפיקה נפרדים.
- ספירת ליבות גבוהה יותר: Ryzen AI Max+ 395 כולל שמונה ליבות מעבד נוספות מאשר Core Ultra 7 258V, מה שתורם ליכולות עיבוד משופרות.
- TDP הניתן להגדרה: לשבב Ryzen יש TDP (הספק תכנון תרמי) גבוה משמעותית הניתן להגדרה, המדורג עד 120W, מה שמאפשר מרווח ביצועים גדול יותר.
שיקולי צריכת חשמל:
חשוב להכיר בכך ש-Ryzen AI Max+ 395 צורך משמעותית יותר חשמל מאשר Core Ultra 7 258V, שיש לו הספק טורבו מרבי של 37W. עם זאת, למרות הבדל זה, שני השבבים מכוונים לאותו פלח שוק ומיועדים למחשבים ניידים דקים וקלים.
מבט קדימה: תחרות עם סדרת RTX 50 של NVIDIA
נוף המחשוב הנייד מתפתח כל הזמן, והאתגר הבא עבור ה-APUs הניידים החדשים של AMD יגיע ככל הנראה מסדרת ה-GPU הניידים RTX 50 של NVIDIA. בעוד שדיווחים מצביעים על בעיות פוטנציאליות בשרשרת האספקה ועיכובים בהשקת ה-GPUs הללו במחשבים ניידים למשחקים מסדרת RTX 50 הקרובה, הם ללא ספק ייצגו את התחרות העיקרית של AMD מבחינת ביצועים גולמיים, ללא קשר להבדלי גורם הצורה.
אינדיקציות מוקדמות נגד GPUs נפרדים:
מעניין לציין ש-AMD כבר טענה לגבי ביצועי ה-AI המעולים של Ryzen AI Max+ 395 בהשוואה ל-GPU הנייד RTX 4090 של NVIDIA, מה שמרמז על עמדה תחרותית חזקה אפילו מול פתרונות גרפיקה נפרדים. זוהי הצהרה מקדימה, וכזו שבוודאי תגרום לאלה שמחכים לביקורות עצמאיות להתרגש מאוד.
התעמקות בתוצאות המדדים
נתוני המדדים שסופקו מציירים תמונה ברורה של ההתמקדות של AMD בביצועי AI. בחירת הדגמים והתצורות מדגישה את החשיבות הגוברת של עיבוד AI יעיל ומגיב במשימות מחשוב מודרניות.
מודלי שפה גדולים (LLMs):
השימוש ב-DeepSeek R1 ו-Llama, שני LLMs בולטים, מדגים את היכולת של Ryzen AI Max+ 395 להתמודד עם משימות מורכבות של עיבוד שפה טבעית. המדד “אסימונים לשנייה” הוא מדד סטנדרטי לביצועים בתחום זה, המציין באיזו מהירות המעבד יכול ליצור טקסט או לעבד קלטים מבוססי שפה.
זיקוק (Distillation):
הכללת גרסאות “Distill” של הדגמים (למשל, Distill Qwen 1.5b) מצביעה על התמקדות ביעילות המודל. זיקוק היא טכניקה המשמשת ליצירת גרסאות קטנות ומהירות יותר של מודלים גדולים יותר תוך שמירה על חלק ניכר מהדיוק שלהם. זה רלוונטי במיוחד למכשירים ניידים שבהם צריכת חשמל ומגבלות זיכרון הן קריטיות.
Phi 4 ו-Llama 3.2:
התוספת של דגמי Phi 4 ו-Llama 3.2 מספקת פרספקטיבה רחבה יותר על ביצועי השבב על פני ארכיטקטורות AI וגדלי מודלים שונים.
זמן לאסימון ראשון (TTFT):
הדגש על “זמן לאסימון הראשון” ראוי לציון במיוחד. TTFT מודד את ההשהיה בין קלט המשתמש לתגובה הראשונית ממודל ה-AI. TTFT נמוך יותר מתורגם לחוויית משתמש מגיבה ואינטראקטיבית יותר, שהיא חיונית עבור יישומים כמו צ’אטבוטים, תרגום בזמן אמת והשלמת קוד.
מודלים של AI Vision:
הכללת מודלים של AI vision (IBM Granite Vision ו-Google Gemma) מדגימה את הרבגוניות של Ryzen AI Max+ 395. מודלים אלה משמשים למשימות כגון זיהוי תמונות, זיהוי אובייקטים וניתוח וידאו. הביצועים החזקים במדדים אלה מצביעים על התאמת השבב ליישומים מעבר לעיבוד שפה בלבד.
החשיבות של יתרונות ארכיטקטוניים
ההחלטות הארכיטקטוניות של AMD ממלאות תפקיד מכריע בהבדלי הביצועים שנצפו.
גרפיקה משולבת (RDNA 3.5):
יחידת הגרפיקה המשולבת רבת העוצמה היא גורם מבדל מרכזי. בניגוד לפתרונות גרפיקה משולבים מסורתיים, שלעתים קרובות מתקשים בעומסי עבודה תובעניים, ארכיטקטורת RDNA 3.5 מספקת דחיפה משמעותית בביצועים, ומאפשרת ל-Ryzen AI Max+ 395 להתמודד עם משימות AI בצורה יעילה יותר. 40 ה-CUs מייצגים קיבולת חישובית משמעותית.
ספירת ליבות:
ספירת הליבות הגבוהה יותר (שמונה ליבות נוספות מאשר Core Ultra 7 258V) מספקת יתרון כללי בעומסי עבודה מרובי הליכי משנה. בעוד שעיבוד AI מסתמך לעתים קרובות במידה רבה על ה-GPU, ה-CPU עדיין ממלא תפקיד בניהול משימות ובטיפול בהיבטים מסוימים של החישוב.
TDP הניתן להגדרה:
ה-TDP הגבוה יותר מאפשר גמישות רבה יותר בניהול צריכת החשמל. אמנם זה אומר צריכת חשמל גבוהה יותר, אבל זה גם מאפשר לשבב לפעול במהירויות שעון גבוהות יותר ולשמור על ביצועים לפרקי זמן ארוכים יותר, במיוחד בעומסי עבודה תובעניים של AI. היכולת להגדיר את ה-TDP עד 120W מספקת יתרון משמעותי על פני הספק הטורבו המרבי המוגבל יותר של 37W של Core Ultra 7 258V. זהו גורם מכריע בהשגת יתרונות הביצועים שנצפו.
נוף המחשוב הנייד: שדה קרב משתנה
התחרות בין AMD לאינטל בתחום הנייד התעצמה בשנים האחרונות, כאשר שתי החברות דוחפות את גבולות הביצועים והיעילות. הצגת Lunar Lake ייצגה את ההתמקדות של אינטל ביעילות הספק, בעוד ש-Ryzen AI Max+ 395 של AMD נותן עדיפות ברורה לביצועים, במיוחד בעומסי עבודה של AI.
הקרב הקרוב עם GPUs ניידים מסדרת RTX 50 של NVIDIA יהיה מבחן משמעותי עבור AMD. בעוד ש-NVIDIA שלטה באופן מסורתי בשוק הגרפיקה הניידת המתקדמת, ההתקדמות של AMD בגרפיקה משולבת וביכולות עיבוד AI ממצבת אותה כמתחרה חזקה. בעיות שרשרת האספקה המדווחות העומדות בפני NVIDIA עשויות לתת ל-AMD יתרון מבחינת זמינות וחדירה לשוק.
הטענות לביצועי AI מעולים מול GPU נייד RTX 4090 הן נועזות, אך אם יאוששו, הן ייצגו שינוי משמעותי בנוף התחרותי. זה יצביע על כך שהפתרון המשולב של AMD יכול להתחרות, ואולי אף לעלות בביצועיו, על פתרונות גרפיקה נפרדים ביישומים מסוימים המתמקדים ב-AI. זה יהיה הישג משמעותי ויכול להיות בעל השלכות משמעותיות על עתיד המחשוב הנייד. הדגש על ביצועי AI הוא אינדיקציה ברורה לכיוון שאליו הולכת התעשייה. ככל ש-AI הופך להיות משולב יותר ויותר ביישומים יומיומיים, הביקוש למעבדים שיכולים להתמודד עם עומסי העבודה הללו ביעילות וביעילות ימשיך לגדול.