שירות Oracle Cloud Infrastructure (OCI) Generative AI מקבל בברכה תוספת מרגשת חדשה: סדרת מודלי Meta Llama 4, הכוללת את Scout ו-Maverick. מודלים אלו משלבים ארכיטקטורת מומחים מעורבת (MoE) ייחודית, המשפרת משמעותית את יכולת העיבוד והיעילות. הם מותאמים במיוחד כדי להצטיין בתחומים מרובים, כגון הבנה מולטימודלית, משימות מרובות שפות, יצירת קוד וקריאת כלים, ויכולים להניע מערכות סוכנים מתקדמות.
נכון לעכשיו, מודלים אלו זמינים בגרסת ההשקה הרשמית (GA) באזורים הבאים:
- לפי דרישה: ORD (שיקגו)
- אשכול AI ייעודי: ORD (שיקגו), GRU (גוארולוס), LHR (לונדון), KIK (קיקויאו)
נקודות עיקריות בסדרת Llama 4
יכולת מולטימודלית: לשבור את גבולות סוגי הנתונים
Llama 4 Scout ו-Maverick הם לא רק מודלי שפה, הם אשפי מולטימודלים אמיתיים. הם מסוגלים לעבד ולשלב באופן מקורי סוגים שונים של נתונים, כולל טקסט ותמונות, ובכך לאפשר יישומי AI עשירים ומקיפים יותר. אתם יכולים לדמיין שמערכת AI יכולה להבין בו-זמנית תיאור טקסטואלי ותמונה קשורה, ובכך לתפוס טוב יותר את ההקשר ולקבל החלטות מושכלות יותר. יכולת מולטימודלית זו פותחת אפשרויות חדשות לחלוטין למשימות כמו יצירת כתוביות לתמונות, מענה לשאלות חזותיות ועוד.
תמיכה בריבוי שפות: תקשורת ללא גבולות
גולת כותרת נוספת בסדרת Llama 4 היא יכולת התמיכה החזקה שלה בריבוי שפות. מודלים אלו אומנו על מערך נתונים המכיל 200 שפות ועברו כוונון עדין עבור 12 שפות עיקריות (ערבית, אנגלית, צרפתית, גרמנית, הינדי, אינדונזית, איטלקית, פורטוגזית, ספרדית, טאגאלוג, תאילנדית ווייטנאמית). המשמעות היא שהם מסוגלים להבין וליצור טקסט בשפות מרובות, ובכך לפתוח דלתות ליישומים גלובליים. ראוי לציין כי פונקציית הבנת התמונות תומכת כרגע רק באנגלית.
פיתוח יעיל: טביעת רגל GPU קטנה יותר
עבור מפתחים, המטרה בתכנון Llama 4 Scout הייתה להשיג נגישות גבוהה יותר. הוא יכול לפעול ביעילות על טביעת רגל GPU קטנה יותר, מה שהופך אותו לבחירה אידיאלית בסביבות עם משאבים מוגבלים. המשמעות היא שגם ללא ציוד חומרה חזק, מפתחים יכולים לנצל את היכולות העוצמתיות של Llama 4 Scout כדי להאיץ את הפיתוח והפריסה של יישומי AI.
מודל קוד פתוח: העצמת קהילה
Meta בחרה בגישה פתוחה ושחררה את שני המודלים ברישיון קהילת Llama 4. המשמעות היא שמפתחים יכולים לכוונן ולפרוס אותם בחופשיות, בכפוף לתנאי רישיון ספציפיים. מודל פתוח זה יכול לקדם חדשנות ושיתוף פעולה בתוך קהילת ה-AI, ולאפשר ליותר אנשים להשתתף בפיתוח ויישום של טכנולוגיות AI.
מועד אחרון לידע
יש לציין כי מועד האחרון לידע של מודלי Llama 4 הוא אוגוסט 2024. המשמעות היא שהם לא יוכלו לספק מידע עדכני על אירועים או מידע שהתרחשו לאחר תאריך זה.
הערה חשובה: מדיניות השימוש המקובל שלLlama מגבילה את השימוש בה באיחוד האירופי (EU).
Llama 4 Scout: אלוף קל משקל
ארכיטקטורה: עיצוב פרמטרים חכם
Llama 4 Scout משתמש בעיצוב ארכיטקטורה חכם, אשר מפעיל רק 17 מיליארד פרמטרים מתוך סך של כ-109 מיליארד פרמטרים. עיצוב זה נעזר בתערובת של 16 מומחים, ובכך משיג איזון טוב בין ביצועים ויעילות. על ידי הפעלת רק חלק מהפרמטרים, Scout יכול להפחית באופן משמעותי את דרישות החישוב, מה שמאפשר לו לפעול בסביבות עם משאבים מוגבלים.
חלון הקשר: היכולת לעבד טקסט ארוך
Llama 4 Scout תומך באורך הקשר של עד 10 מיליון אסימונים (דורש מספר GPUs). עם זאת, בהשקה הרשמית (GA), שירות OCI Generative AI יתמוך באורך הקשר של 192 אלף אסימונים. גם חלון הקשר של 192 אלף מספיק כדי לעבד טקסט ארוך למדי, כמו פרקי ספרים או דוחות מפורטים.
פריסה: קומפקטי אבל חזק
אחת ממטרות התכנון של Llama 4 Scout היא לפעול ביעילות על טביעת רגל GPU קטנה יותר. זה הופך אותו לבחירה אידיאלית עבור תרחישי פריסה שונים, כולל התקני קצה וסביבות ענן עם משאבים מוגבלים.
ביצועים: עולה על המתחרים
Llama 4 Scout הצטיין במספר מדדי ביצועים, ועלה על מודלים כמו Gemma 3 של Google ו-Mistral 3.1. זה מוכיח את היכולת המעולה של Scout מבחינת ביצועים, מה שהופך אותו לכלי רב עוצמה עבור משימות AI שונות.
Llama 4 Maverick: שחקן כבד משקל
ארכיטקטורה: סולם גדול יותר, כוח חזק יותר
בהשוואה ל-Scout, Llama 4 Maverick משתמש בארכיטקטורה גדולה יותר. הוא גם מפעיל 17 מיליארד פרמטרים, אך הוא מיושם בתוך מסגרת גדולה יותר של כ-400 מיליארד פרמטרים ונעזר ב-128 מומחים. סולם גדול יותר זה מעניק ל-Maverick יכולות חזקות יותר, ומאפשר לו להצטיין במשימות AI מורכבות יותר.
חלון הקשר: זיכרון ארוך במיוחד
Llama 4 Maverick תומך באורך הקשר של עד מיליון אסימונים. בהשקה הרשמית (GA), פריסות OCI יתמכו באורך הקשר של 512 אלף אסימונים. חלון הקשר ארוך כל כך מאפשר ל-Maverick לעבד טקסט מורכב במיוחד, כמו ספרים שלמים או אוסף של מספר מסמכים.
פריסה: צריך מקום גדול יותר
בשל גודלו הגדול יותר, Llama 4 Maverick צריך מקום פריסה גדול יותר מזה של Scout. בזמן ה-GA, פריסת Maverick ב-OCI תדרוש פי שניים מהשטח של Scout.
ביצועים: דומה למודלים המובילים
במשימות של יצירת קוד והסקת מסקנות, הביצועים של Llama 4 Maverick דומים למודלים המובילים כמו GPT-4o של OpenAI ו-DeepSeek-V3. זה מוכיח את מעמדו המוביל של Maverick בתחום ה-AI.
לסיכום, סדרת Llama 4 מייצגת התקדמות משמעותית בפיתוח מודלים של AI. חל שיפור ניכר בביצועים, ברב-גוניות ובנגישות שלהם, מה שמספק תמיכה חזקה עבור מגוון רחב של תרחישי יישום.
לקוחות OCI יכולים כעת לנצל בקלות את המודלים העוצמתיים הללו מבלי לדאוג לגבי המורכבות של ניהול תשתית. הם יכול לגשת למודלים אלה באמצעות ממשק צ’אט, API או נקודות קצה ייעודיות, ובכך לפשט את תהליך הפיתוח והפריסה של יישומי AI.
השקת מודלי Llama 4 מסמנת עידן חדש בשירות OCI Generative AI. על ידי אספקת המודלים המתקדמים הללו, OCI עוזרת ללקוחות לממש את מלוא הפוטנציאל של AI ולעודד חדשנות בתעשיות שונות.