זינוק גוגל בזירת מודלי שפה

העלייה של גוגל בזירת ה-LLM: שינוי בכוח

נוף מודלי השפה הגדולים (LLMs) עדים לשינוי משמעותי, כאשר גוגל מתגלה כשחקנית בולטת בעוד שמטא ו-OpenAI מתמודדות עם אתגרים ניכרים. בתחילה, OpenAI שלטה בתחום עם מודלי ה-GPT פורצי הדרך שלה, ויצרה אמות מידה חדשות לביצועי LLM. מטא גם הבטיחה לעצמה עמדה משמעותית על ידי הצעת מודלים במשקל פתוח שהתגאו ביכולות מרשימות ואפשרו שימוש, שינוי ופריסה בלתי מוגבלים של הקוד הנגיש לציבור שלהם.

עם זאת, הדומיננטיות המוקדמת הזו השאירה ענקיות טכנולוגיה אחרות, כולל גוגל, במצב של השלמת פערים. למרות מחקר המפתח של גוגל משנת 2017 על ארכיטקטורת הטרנספורמר העומדת בבסיס ה-LLMs, המאמצים הראשוניים של החברה הוצללו על ידי ההשקה שספגה ביקורת רחבה של Bard בשנת 2023.

לאחרונה, הגאות השתנתה עם הצגת LLMs חדשים ועוצמתיים מגוגל, יחד עם מפלות שחוו מטא ו-OpenAI. שינוי זה שינה באופן משמעותי את הדינמיקה של נוף ה-LLM.

Llama 4 של מטא: מעידה?

ההשקה הלא צפויה של Llama 4 על ידי מטא ביום שבת, ה-5 באפריל, הרימה גבות בתעשייה.

ההחלטה להשיק מודל מרכזי בסוף שבוע נתפסה כלא שגרתית, מה שהוביל לקבלת פנים מושתקת ולהסתרת ההכרזה בתוך זרימת החדשות של השבוע שלאחר מכן.

בעוד של-Llama 4 יש חוזקות מסוימות, כולל היכולות הרב-מודליות שלו (טיפול בתמונות, אודיו ומודיאליות אחרות) והזמינות שלו בשלוש גרסאות (Llama 4 Behemoth, Maverick ו-Scout) בגדלים ועוצמות משתנות, הפריסה שלו זכתה לביקורת. גרסת ה-Llama 4 Scout, בפרט, הציגה חלון הקשר משמעותי של עד 10 מיליון אסימונים, מה שמאפשר למודל לעבד ולהפיק כמויות עצומות של טקסט בהפעלה בודדת.

עם זאת, קבלת הפנים של המודל התקלקלה כאשר צצו אי התאמות בנוגע לגישת הדירוג של מטא ב-LMArena, פלטפורמה המדרגת LLMs על סמך הצבעות משתמשים. התגלה כי מודל ה-Llama 4 הספציפי ששימש לדירוגים שונה מזה שהועמד לרשות הציבור הרחב. LMArena הצהירה שמטא סיפקה ‘מודל מותאם אישית כדי לייעל את העדפת בני האדם’.

יתרה מכך, הטענות של מטא לגבי חלון ההקשר של 10 מיליון אסימונים של Llama 4 Scout התקבלו בספקנות. למרות הדיוק הטכני של נתון זה, אמות מידה גילו ש-Llama 4 מפגרת אחרי מודלים מתחרים בביצועים בהקשר ארוך.

בנוסף לדאגות, מטא נמנעה מלשחרר מודל ‘חשיבה’ או ‘היגיון’ של Llama 4 ועיכבה גרסאות קטנות יותר, אם כי החברה ציינה שמודל היגיון עתיד לבוא.

בן לוריקה, מייסד חברת ייעוץ הבינה המלאכותית Gradient Flow, ציין שמטא חרגה מהנוהג הסטנדרטי של שחרור שיטתי יותר, שבו כל הרכיבים מוכנים במלואם. זה מצביע על כך שמטא אולי להוטה להציג מודל חדש, גם אם חסרים בו אלמנטים חיוניים כמו מודל היגיון וגרסאות קטנות יותר.

GPT-4.5 של OpenAI: נסיגה מוקדמת

גם OpenAI התמודדה עם אתגרים בחודשים האחרונים.

GPT-4.5, שנחשף כתצוגה מקדימה של מחקר ב-27 בפברואר, הוצג כ’מודל הגדול והטוב ביותר של החברה לצ’אט עד כה’. אמות המידה של OpenAI הצביעו על כך ש-GPT-4.5 עולה בדרך כלל על קודמו, GPT-4o.

עם זאת, מבנה התמחור של המודל ספג ביקורת. OpenAI קבעה את מחיר הגישה ל-API ב-150 דולר ארה’ב למיליון אסימוני פלט, עלייה מדהימה פי 15 בהשוואה למחיר של GPT-4o של 10 דולר למיליון אסימונים. ה-API מאפשר למפתחים לשלב מודלים של OpenAI ביישומים ובשירותים שלהם.

אלן ד. תומפסון, יועץ ומנתח AI ב-Life Architect, העריך ש-GPT-4.5 היה כנראה ה-LLM המסורתי הגדול ביותר ששוחרר במהלך הרבעון הראשון של 2025, עם כ-5.4 טריליון פרמטרים. הוא טען שקשה להצדיק קנה מידה עצום כזה לאור מגבלות החומרה הנוכחיות ומציב אתגרים משמעותיים במתן שירות לבסיס משתמשים גדול.

ב-14 באפריל, OpenAI הודיעה על החלטתה להפסיק את גישת GPT-4.5 דרך ה-API לאחר פחות משלושה חודשים. בעוד ש-GPT-4.5 תישאר נגישה, היא תוגבל למשתמשי ChatGPT דרך ממשק ChatGPT.

הודעה זו עלתה בקנה אחד עם הצגת GPT-4.1, מודל חסכוני יותר במחיר של 8 דולר למיליון אסימונים. אמות המידה של OpenAI מצביעות על כך ש-GPT-4.1 אינו מסוגל כמו GPT-4.5 בסך הכל, אם כי הוא מציג ביצועים מעולים באמות מידה מסוימות של קידוד.

OpenAI גם שחררה לאחרונה מודלים חדשים של היגיון, o3 ו-o4-mini, כאשר מודל o3 מדגים ביצועי אמת מידה חזקים במיוחד. עם זאת, העלות נותרה דאגה, שכן גישת API ל-o3 מתומחרת ב-40 דולר למיליון אסימוני פלט.

העלייה של גוגל: ניצול ההזדמנות

הקבלה המעורבת של Llama 4 ו-ChatGPT-4.5 יצרה פתח למתחרים לנצל, והם ניצלו את ההזדמנות.

ההשקה הבעייתית של מטא של Llama 4 לא צפויה להניא מפתחים מאימוץ חלופות כגון DeepSeek-V3, Gemma של גוגל ו-Qwen2.5 של עליבאבא. LLMs אלה, שהוצגו בסוף 2024, הפכו למודלים במשקל פתוח המועדפים על לוחות המובילים של LMArena ו-HuggingFace. הם מתחרים או עולים על Llama 4 באמות מידה פופולריות, מציעים גישה זולה ל-API, ובמקרים מסוימים, זמינים להורדה ולשימוש בחומרה בדרגת צרכן.

עם זאת, זהו ה-LLM החדיש של גוגל, Gemini 2.5 Pro, שתפס באמת את תשומת הלב.

גוגל Gemini 2.5 Pro, שהושק ב-25 במרץ, הוא ‘מודל חשיבה’ הדומה ל-GPT-o1 ו-DeepSeek-R1, המשתמש בבקשות עצמיות כדי להסיק משימות. Gemini 2.5 Pro הוא רב-מודאלי, כולל חלון הקשר של מיליון אסימונים ותומך במחקר מעמיק.

Gemini 2.5 השיגה במהירות ניצחונות באמות מידה, כולל המקום הראשון ב-SimpleBench (אם כי היא ויתרה על המיקום הזה ל-o3 של OpenAI ב-16 באפריל) ובמדד הבינה המלאכותית המשולב של Artificial Analysis. Gemini 2.5 Pro מחזיקה כעת במקום הראשון ב-LMArena. נכון ל-14 באפריל, מודלים של גוגל תפסו 5 מתוך 10 המקומות הראשונים ב-LMArena, כולל Gemini 2.5 Pro, שלושה וריאציות של Gemini 2.0 ו-Gemma 3-27B.

מעבר לביצועים המרשימים שלה, גוגל היא גם מובילת מחירים. גוגל Gemini 2.5 זמין כעת לשימוש בחינם דרך אפליקציית Gemini של גוגל ואתר AI Studio של גוגל. תמחור ה-API של גוגל הוא גם תחרותי, כאשר Gemini 2.5 Pro מתומחר ב-10 דולר למיליון אסימוני פלט ו-Gemini 2.0 Flash מתומחר ב-40 סנט בלבד למיליון אסימונים.

לוריקה מציין שעבור משימות חשיבה בכמות גדולה, הוא בוחר לעתים קרובות ב-DeepSeek-R1 או בגוגל Gemini, בעוד ששימוש במודלים של OpenAI דורש שיקול דעת זהיר יותר של תמחור.

בעוד שמטא ו-OpenAI אינן בהכרח על סף קריסה, OpenAI נהנית מהפופולריות של ChatGPT, שלפי הדיווחים מתגאה במיליארד משתמשים. עם זאת, הדירוגים החזקים וביצועי אמות המידה של Gemini מצביעים על שינוי בנוף ה-LLM, המועדף כרגע על גוגל.