הגדרה מחדש של ביצועים במחשבים ניידים דקים וקלים
ה-Ryzen AI MAX+ 395 מבוסס על טכנולוגיה חדשנית. בליבו נמצאות ליבות המעבד ‘Zen 5’ של AMD, המספקות עמוד שדרה עיבוד חזק ויעיל. עם זאת, החידוש האמיתי טמון בשילוב של יחידת עיבוד עצבית (NPU) מסוג XDNA 2, המתגאה ביותר מ-50 TOPS (טריליוני פעולות בשנייה) של ביצועי AI. מנוע AI ייעודי זה, בשילוב עם GPU משולב המבוסס על ארכיטקטורת RDNA 3.5 של AMD (הכולל 40 יחידות מחשוב), משנה את הפוטנציאל של מחשבים ניידים דקים וקלים מובחרים.
שילוב רב עוצמה זה מאפשר תצורות זיכרון חסרות תקדים, הנעות בין 32GB ועד 128GB מדהימים של זיכרון מאוחד. תכונה מרכזית, AMD Variable Graphics Memory (VGM), מאפשרת להקצות באופן דינמי עד 96GB מהזיכרון המאוחד הזה כ-VRAM. גמישות זו חיונית לטיפול בעומסי עבודה תובעניים של AI, שלעתים קרובות דורשים משאבי זיכרון משמעותיים.
הבאת AI לצרכן: הכוח של LLMs מקומיים
המיקוד של AMD משתרע מעבר לכוח עיבוד גולמי; מדובר בהעצמת משתמשים לרתום את הפוטנציאל של AI ביישומים מעשיים ויומיומיים. דוגמה מצוינת היא התמיכה ביישומים המופעלים על ידי llama.cpp כמו LM Studio. תוכנה זו פועלת כשער כניסה, ומאפשרת למשתמשים להפעיל מודלי שפה גדולים (LLMs) ישירות על המחשבים הניידים שלהם מבלי לדרוש מומחיות טכנית מיוחדת. דמוקרטיזציה זו של טכנולוגיית AI פותחת אפשרויות למשתמשים להתנסות ולפרוס מודלים חדשים של טקסט וחזון AI בקלות.
דומיננטיות במדדים: שיפורי ביצועים בעולם האמיתי
מדדי הביצועים הפנימיים של AMD מציירים תמונה משכנעת של היכולות של Ryzen AI MAX+ 395. הבדיקות נערכו באמצעות מחשב נייד ASUS ROG Flow Z13 המצויד ב-64GB של זיכרון מאוחד ו-GPU משולב Radeon 8060S. התוצאות הציגו יתרון ביצועים משמעותי על פני מחשבים ניידים הכוללים כרטיסי מסך Intel Arc 140V.
במונחים של תפוקת טוקנים – מדד למהירות שבה LLM יכול ליצור טקסט – ה-Ryzen AI MAX+ 395 הדגים שיפור של עד פי 2.2. בדיקות אלו תוכננו בקפידה כדי להבטיח תאימות למחשבים ניידים מתחרים, תוך התמקדות ב-LLMs שיכולים לפעול בתוך טביעת רגל זיכרון של 16GB (נפוץ עבור מחשבים ניידים עם 32GB של זיכרון על האריזה).
יתרון ביצועים זה לא היה מוגבל לסוגי מודלים ספציפיים. הוא נשאר עקבי במגוון LLMs, כולל:
- מודלים של שרשרת חשיבה (Chain-of-thought): כמו DeepSeek R1 Distills.
- מודלים סטנדרטיים: כגון Microsoft Phi 4.
- גדלי פרמטרים שונים: המדגימים רב-תכליתיות על פני מורכבויות מודל שונות.
היענות מוגדרת מחדש: זמן לאסימון ראשון
מעבר לתפוקה גולמית, ההיענות של מודל AI חיונית לחוויית משתמש חלקה ואינטראקטיבית. כאן נכנס לתמונה מדד “זמן לאסימון ראשון”, המציין באיזו מהירות המודל מתחיל ליצור פלט לאחר קבלת קלט.
ה-Ryzen AI MAX+ 395 הציג רווחים דרמטיים עוד יותר בתחום זה:
- מודלים קטנים יותר (למשל, Llama 3.2 3b Instruct): עד פי ארבעה מהר יותר מהמתחרים.
- מודלים גדולים יותר של 7 מיליארד ו-8 מיליארד פרמטרים (למשל, DeepSeek R1 Distill Qwen 7b, DeepSeek R1 Distill Llama 8b): עליות מהירות עד פי 9.1.
- מודלים של 14 מיליארד פרמטרים: ה-ASUS ROG Flow Z13, המופעל על ידי Ryzen AI MAX+ 395, היה על פי הדיווחים מהיר עד פי 12.2 ממחשב נייד עם מעבד Intel Core Ultra 258V.
נתונים אלה מדגישים קפיצת מדרגה משמעותית ביכולות האינטראקטיביות של מודלי AI במחשבים ניידים, המאפשרת תגובות כמעט מיידיות וחוויית משתמש זורמת יותר.
מעבר לטקסט: שחרור הכוח של AI רב-מודאלי
היכולות של Ryzen AI MAX+ 395 משתרעות מעבר ל-LLMs מבוססי טקסט. הוא מצטיין גם בטיפול במודלים רב-מודאליים, המשלבים יכולות ראייה לצד עיבוד טקסט. מודלים אלה יכולים לנתח תמונות ולספק תגובות המבוססות על התוכן החזותי שלהם, ולפתוח מגוון חדש של יישומים.
AMD הציגה נתונים המציגים את ביצועי המעבד עם מודלים כגון:
- IBM Granite Vision: עד פי שבעה מהר יותר ב-IBM Granite Vision 3.2 3b.
- Google Gemma 3: עד פי 4.6 מהר יותר ב-Google Gemma 3 4b ועד פי שישה מהר יותר ב-Google Gemma 3 12b.
יש לציין כי ה-ASUS ROG Flow Z13 עם 64GB זיכרון היה מסוגל אפילו להפעיל את מודל Google Gemma 3 27B Vision הגדול יותר, מה שמדגים את יכולת הפלטפורמה להתמודד אפילו עם עומסי העבודה הרב-מודאליים התובעניים ביותר.
יישומים בעולם האמיתי: מאבחון רפואי ועד ליצירת קוד
ההשלכות המעשיות של התקדמות זו הן מרחיקות לכת. הדגמה הציגה את הפוטנציאל של מודלים של ראייה באבחון רפואי, כאשר מודל ניתח תמונת CT סריקה סטנדרטית, זיהה איברים וסיפק אבחנה. זה מדגיש את הפוטנציאל של AI לסייע לאנשי מקצוע בתחום הבריאות לבצע הערכות מהירות ומדויקות יותר.
יישום משכנע נוסף טמון ביצירת קוד. AMD הדגימה את היכולת להפעיל מודלי שפה גדולים כמו DeepSeek R1 Distill Qwen 32b (בדיוק של 6 סיביות) כדי לקודד משחק פשוט כמו פונג במסגרת זמן קצרה להפליא. זה מדגים את הפוטנציאל של AI להאיץ את פיתוח התוכנה ולהעצים מפתחים עם כלי סיוע רבי עוצמה לקידוד.
אופטימיזציה של ביצועים: שחרור מלוא הפוטנציאל
כדי להשיג ביצועים מיטביים עם עומסי עבודה של LLM במחשבים ניידים המצוידים במעבדי Ryzen AI 300 series, AMD מספקת המלצות ספציפיות:
- עדכון מנהל התקן: ודא שהתקנת את מנהל ההתקן העדכני ביותר של AMD Software: Adrenalin Edition. מנהל התקן זה חיוני להפעלת התכונות והאופטימיזציות העדכניות ביותר.
- זיכרון גרפי משתנה (VGM): הפעל את VGM והגדר אותו ל-‘High’. זה מאפשר למערכת להקצות באופן דינמי זיכרון לגרפיקה המשולבת, להגביר את תפוקת האסימונים ולאפשר שימוש במודלים גדולים יותר של AI.
- הגדרות LM Studio: בתוך LM Studio, בחר ידנית פרמטרים והגדר את ‘GPU Offload’ ל-‘MAX’. זה מבטיח שה-GPU מנוצל במלואו לעיבוד AI.
- קוונטיזציה (Quantization):
- לשימוש כללי, AMD מציעה קוונטיזציה של Q4 K M.
- עבור משימות קידוד, מומלצת קוונטיזציה של Q6 או Q8.
על ידי ביצוע המלצות אלה, משתמשים יכולים למצות את מלוא הפוטנציאל של המחשבים הניידים שלהם המופעלים על ידי Ryzen AI ולחוות את הכוח הטרנספורמטיבי של מודלי AI מתקדמים.
פלטפורמה לעתיד ה-AI
בעיקרו של דבר, מעבד AMD Ryzen AI MAX+ 395 מייצג יותר מסתם שדרוג ביצועים. זוהי פלטפורמה המעצימה משתמשים לחוות את חוד החנית של טכנולוגיית AI בגורם צורה נייד ונגיש. בין אם זה למשחקים, פרודוקטיביות או חקר העולם המתפתח במהירות של AI, מעבד זה שואף להגדיר מחדש את מה שאפשר במחשבים ניידים דקים וקלים. הוא פותח דלתות לאפשרויות חדשות, ומעצים משתמשים ליצור אינטראקציה עם מודלי AI בדרכים שבעבר לא היו מתקבלות על הדעת במכשירים ניידים כאלה. ההתמקדות בידידותיות למשתמש, בשילוב עם כוח עיבוד גולמי, ממצבת את Ryzen AI MAX+ 395 כצעד משמעותי לקראת עתיד שבו AI משולב בצורה חלקה בחיי היומיום שלנו.