אכזבות בכנס LlamaCon ושינוי בציפיות
המסלול שעבר מודל השפה הגדול (LLM) Llama של Meta היה נתון לבחינה מדוקדקת ודיונים סוערים בקהילת הבינה המלאכותית. חלפה בערך שנה בין שחרור Llama 3 ל-Llama 4, נצח בנוף המתפתח במהירות של הבינה המלאכותית. בעוד שבתחילה הוא זכה לשבחים כחלופה פורצת דרך בקוד פתוח למודלים קנייניים כמו אלה של OpenAI, התפתחויות אחרונות מצביעות על שינוי בתפיסה, כאשר חלקם מטילים ספק בחשיבות המתמשכת של Llama בשורה הראשונה של חדשנות הבינה המלאכותית.
ב-LlamaCon, הכנס הראשון של Meta שהוקדש למודלי ה-LLM שלה בקוד פתוח, אווירה של ציפיות שלא התממשו חלחלה באוויר. מספר מפתחים שהשתתפו שיתפו בסוד שהם ציפו לחשיפת מודל הסקה מתוחכם, או לפחות מודל מסורתי המסוגל לעלות על מתחרים כמו V3 של DeepSeek ו-Qwen, האחרון הוא חבילת מודלים שפותחה על ידי חטיבת מחשוב הענן של Alibaba.
היעדר הצהרות כאלה הזין חששות ש-Llama מאבד גובה במירוץ לעליונות בתחום הבינה המלאכותית. רק חודש לפני הכנס, Meta השיקה את הדור הרביעי של משפחת ה-Llama שלה, כולל מודלי המשקל הפתוח Llama 4 Scout ו-Llama 4 Maverick. Scout תוכנן לביצועים יעילים על GPU בודד, בעוד Maverick תוכנן כמודל גדול יותר כדי להתחרות במודלי בסיס אחרים.
בנוסף ל-Scout ו-Maverick, Meta סיפקה הצצה ל-Llama 4 Behemoth, “מודל מורה” גדול משמעותית שעדיין נמצא בהכשרה. מטרתו של Behemoth היא להקל על זיקוק, טכניקה ליצירת מודלים קטנים יותר ומיוחדים יותר ממודל גדול יותר וכללי יותר.
עם זאת, צצו דיווחים המצביעים על עיכובים בשחרור Behemoth ואתגרים בהשגת ביצועים תחרותיים עם חבילת Llama 4. למרות טענותיה של Meta על יכולות חדישות, התפיסה בקרב חלק מהמפתחים הייתה ש-Llama כבר לא מוביל את החבורה.
עליית המתחרים: Qwen ו-DeepSeek
האכזבה סביב LlamaCon ומודלי Llama 4 משקפת תחושה רחבה יותר שמודלי ה-LLM של Meta בקוד פתוח מאבדים תאוצה הן מבחינת ביצועים טכניים והן מבחינת התלהבות מפתחים. בעוד Meta מדגישה את מחויבותה לעקרונות קוד פתוח, בניית מערכות אקולוגיות וחדשנות, מתחרים כמו DeepSeek, Qwen ו-OpenAI מתקדמים במהירות בתחומים קריטיים כמו הסקה, שימוש בכלי עבודה ופריסה בעולם האמיתי.
אחד המפתחים, Vineeth Sai Varikuntla, הביע את אכזבתו, וציין שהוא קיווה ש-Llama תעלה על Qwen ו-DeepSeek במקרי שימוש כלליים והסקים, אך מצא ש-Qwen מקדימה משמעותית.
תחושה זו מדגישה את האתגרים העומדים בפני Meta בשמירה על מעמדה של Llama כמודל LLM מוביל בקוד פתוח. בעוד שהגרסאות הראשוניות של Llama זכו לתשומת לב ושבחים משמעותיים, הופעתן של חלופות בעלות יכולת גוברת הגבירה את הנוף התחרותי.
התחלה מבטיחה: ההשפעה של Llama 2
כדי להעריך באופן מלא את הנרטיב הנוכחי סביב Llama, חשוב לזכור את מקורותיו ואת ההתלהבות הראשונית שהוא יצר. בשנת 2023, מנכ”ל Nvidia, ג’נסן הואנג, שיבח את השקת Llama 2 כ”כנראה האירוע הגדול ביותר בתחום הבינה המלאכותית” של אותה שנה. עד יולי 2024, שחרור Llama 3 נחשב לפריצת דרך, המייצג את ה-LLM הפתוח הראשון המסוגל לאתגר את הדומיננטיות של OpenAI.
הגעתו של Llama 3 עוררה גל מיידי בביקוש לכוח מחשוב, מה שהוביל לעלייה במחירי השכרת GPU, על פי דילן פאטל, אנליסט ראשי ב-SemiAnalysis. חיפושים בגוגל אחר “Meta” ו-“Llama” הגיעו גם הם לשיא בתקופה זו, דבר המצביע על עניין נרחב במודל החדש.
Llama 3 נחגג כ-LLM מתוצרת אמריקאית, פתוח ומהשורה הראשונה. בעוד שהוא לא עמד בעקביות בראש מדדי התעשייה, הוא הפעיל השפעה ורלוונטיות ניכרת בתוך קהילת הבינה המלאכותית. עם זאת, דינמיקה זו השתנתה בהדרגה.
שינויים ארכיטקטוניים וביקורות
מודלי Llama 4 הציגו ארכיטקטורת “תערובת של מומחים”, עיצוב שנעשה בו פופולרי על ידי DeepSeek. ארכיטקטורה זו מאפשרת למודל להפעיל רק את המומחיות הרלוונטית ביותר למשימה ספציפית, ובכך לשפר את היעילות.
עם זאת, שחרור Llama 4 ספג ביקורת כאשר מפתחים גילו שהגרסה ששימשה לביצועי benchmarking פומביים שונה מהגרסה הזמינה להורדה ולפריסה. אי התאמה זו הובילה להאשמות ב”משחק בלוח המובילים”, בהן Meta הכחישה, וציינה שהגרסה המדוברת הייתה ניסיונית ושהערכת גרסאות מרובות של מודל היא נוהג סטנדרטי.
למרות הסבריה של Meta, המחלוקת תרמה לתפיסה ש-Llama מתקשה לשמור על היתרון התחרותי שלה. ככל שמודלים מתחרים המשיכו להתקדם, נראה של-Meta חסר כיוון ברור.
מדידת אימוץ מפתחים: משימה מורכבת
קביעה איזו משפחת LLM היא הפופולרית ביותר בקרב מפתחים היא משימה מאתגרת. עם זאת, נתונים זמינים מצביעים על כך שהמודלים האחרונים של Llama אינם בין המובילים.
Qwen, במיוחד, מדורגת בעקביות גבוה בלוחות מובילים שונים ברחבי האינטרנט. על פי Artificial Analysis, אתר שמדרג מודלים על סמך ביצועים, Llama 4 Maverick ו-Scout ממוקמים ממש מעל מודל GPT-4 של OpenAI (שוחרר בסוף השנה הקודמת) ומתחת ל-Grok של xAI ו-Claude של Anthropic מבחינת מודיעין.
OpenRouter, פלטפורמה המספקת למפתחים גישה למודלים שונים ומפרסמת לוחות מובילים המבוססים על שימוש ב-API, מציגה את Llama 3.3 בין 20 המודלים המובילים נכון לתחילת מאי, אך לא את Llama 4.
נקודות נתונים אלה, למרות שאינן חד משמעיות, מצביעות על כך שהחזרות האחרונות של Llama לא מהדהדות חזק כמו קודמותיהן בקרב מפתחים.
מעבר למדדים: שימוש בכלי עבודה והסקה
בעוד שהערכות סטנדרטיות של Llama 4 אולי לא הרשימו, מומחים טוענים שההתלהבות המופחתת נובעת מגורמים מעבר למדדי ביצועים גולמיים.
AJ Kourabi, אנליסט ב-SemiAnalysis, מדגיש את החשיבות של “קריאה לכלי עבודה” ויכולתו של המודל להתרחב מעבר לפונקציונליות פשוטה של צ’אטבוט. קריאה לכלי עבודה מתייחסת ליכולתו של מודל לגשת ולהדריך יישומים אחרים באינטרנט או במכשיר של משתמש, תכונה חיונית עבור AI סוכני, המבטיח לבצע אוטומציה של משימות כגון הזמנת נסיעות וניהול הוצאות.
Meta הצהירה שמודלי Llama תומכים בקריאה לכלי עבודה באמצעות ה-API שלה. עם זאת, Theo Browne, מפתח ויוטיובר, טוען שקריאה לכלי עבודה הפכה להכרחית לרלוונטיות חדישה ככל שכלי עבודה סוכניים צוברים תאוצה.
Anthropic התגלה כמוביל מוקדם בשימוש בכלי עבודה, ומודלים קנייניים כמו OpenAI מדביקים את הפער במהירות. היכולת לקרוא באופן מהימן לכלי הנכון כדי ליצור את התגובה הנכונה היא בעלת ערך רב, ו-OpenAI העבירה את המיקוד שלה כדי לתעדף את היכולת הזו.
Kourabi טוען שהיעדר מודל הסקה חזק הוא אינדיקטור משמעותי לכך ש-Meta פיגרה מאחור. הסקה נחשבת ליסוד בסיסי במשוואה של AI סוכני, המאפשרת למודלים לנתח משימות ולקבוע את אופן הפעולה המתאים.
הנישה של Llama: יישומים מעשיים ואימוץ ארגוני
למרות החששות לגבי מעמדה בחזית מחקר הבינה המלאכותית, Llama נשאר כלי רב ערך עבור מפתחים וארגונים רבים.
Nate Jones, ראש מוצר ב-RockerBox, מייעץ למפתחים לכלול את Llama בקורות החיים שלהם, מכיוון שסביר להניח שיידרשו היכרות עם המודל בעתיד.
Paul Baier, מנכ”ל ואנליסט ראשי ב-GAI Insights, מאמין ש-Llama תמשיך להיות מרכיב מפתח באסטרטגיות AI עבור חברות רבות, במיוחד אלה מחוץ לתעשיית הטכנולוגיה.
ארגונים מכירים בחשיבותם של מודלים בקוד פתוח, כאשר Llama היא דוגמה בולטת, לטיפול במשימות פחות מורכבות ובשליטה בעלויות. ארגונים רבים מעדיפים שילוב של מודלים סגורים ופתוחים כדי לענות על הצרכים המגוונים שלהם.
Baris Gultekin, ראש מחלקת AI ב-Snowflake, מציין שלעתים קרובות לקוחות מעריכים מודלים על סמך מקרי השימוש הספציפיים שלהם ולא מסתמכים רק על מדדי ביצועים. בהתחשב בעלות הנמוכה שלו, Llama לרוב מוכיחה את עצמה כמתאימה ליישומים רבים.
ב-Snowflake, Llama משמשת למשימות כגון סיכום תמלולי שיחות מכירה וחילוץ מידע מובנה מביקורות לקוחות. ב-Dremio, Llama מייצרת קוד SQL וכותבת מיילים שיווקיים.
Tomer Shiran, מייסד שותף ומנהל מוצר ראשי ב-Dremio, מציע שהמודל הספציפי עשוי שלא להיות קריטי עבור 80% מהיישומים, מכיוון שרוב המודלים “טובים מספיק” כעת כדי לענות על צרכים בסיסיים.
נוף מגוון: תפקידה המתגבש של Llama
בעוד ש-Llama עשויה להתרחק מתחרות ישירה עם מודלים קנייניים בתחומים מסוימים, נוף הבינה המלאכותית הכללי הופך למגוון יותר, ותפקידה של Llama מתגבש בתוך נישות ספציפיות.
Shiran מדגיש שמדדי ביצועים אינם המניע העיקרי לבחירת מודל, מכיוון שמשתמשים נותנים עדיפות לבדיקת מודלים במקרי השימוש שלהם. הביצועים של מודל על נתוני לקוח הם בעלי חשיבות עליונה, וביצועים אלה יכולים להשתנות עם הזמן.
Gultekin מוסיף שבחירת מודל היא לרוב החלטה ספציפית למקרה שימוש ולא אירוע חד פעמי.
Llama עשויה לאבד מפתחים שמחפשים כל הזמן את ההתקדמות האחרונה, אך היא שומרת על תמיכתם של מפתחים רבים המתמקדים בבניית כלים מעשיים המופעלים על ידי AI.
דינמיקה זו תואמת לאסטרטגיית הקוד הפתוח הרחבה יותר של Meta, המודגמת על ידי השקת React בשנת 2013 ויצירת PyTorch בשנת 2016. על ידי טיפוח מערכות אקולוגיות מצליחות, Meta נהנית מתרומותיה של קהילת הקוד הפתוח.
כפי שמציין Nate Jones, צוקרברג זוכה לרוחות גביות משמעותיות מיוזמות הקוד הפתוח של Meta.