עולם הבינה המלאכותית אף פעם לא נח לרגע. כמעט ולא עובר שבוע ללא הכרזות משמעותיות המבטיחות יכולות משופרות, יישומים חדשניים או שינויים אסטרטגיים בתעשייה. לאחרונה, מספר שחקנים מרכזיים, מענקיות טכנולוגיה מבוססות ועד סטארט-אפים שאפתניים, חשפו פיתוחים המדגישים את האבולוציה המהירה וההתמחות הגוברת בתחום ה-AI. התקדמויות אלו כוללות יכולות הסקה משופרות במודלי שפה גדולים, עלייתם של AI רב-מודאלי וקומפקטי, פיתוח ממוקד של מערכות סוכנים (agentic systems), ושותפויות חומרה חדשניות שמטרתן להרחיב את אפשרויות הפריסה. הבנת המהלכים האינדיבידואליים הללו מספקת תמונה ברורה יותר של הזרמים התחרותיים והטכנולוגיים הרחבים המעצבים את עתידנו.
Google מכוונת גבוה יותר עם Gemini 2.5: עידן ‘מודלי החשיבה’?
Google, שחקנית כבדה ותיקה בזירת ה-AI, הציבה לאחרונה רף חדש עם ההכרזה על Gemini 2.5. המודל, שהוצג באומץ כ’מודל ה-AI האינטליגנטי ביותר’ של החברה עד כה, מסמן את המשך הדחיפה של Google לעבר הסקת מסקנות מתוחכמת יותר ב-AI. ההשקה הראשונית כוללת את Gemini 2.5 Pro Experimental, המוצג כחוד החנית להתמודדות עם אתגרים מורכבים. מה שמייחד גרסה זו, לדברי Google, הוא טבעה כ’מודל חשיבה’. ייעוד מסקרן זה מרמז על מעבר ממודלים שבעיקר מאחזרים ומסנתזים מידע למערכות המסוגלות לתהליכים אנליטיים עמוקים יותר.
הרעיון המרכזי מאחורי ‘מודלי חשיבה’ אלה, המתבסס על מושגים שהוצגו בגרסאות קודמות כמו Gemini 2.0 Flash Thinking, כולל ביצוע סוג של דיון פנימי או רצף הסקה על ידי ה-AI לפני יצירת תגובה. הדבר מרמז על גישה מובנית יותר לפתרון בעיות, שעשויה לשקף באופן הדוק יותר שלבים קוגניטיביים אנושיים. Google מייחסת יכולת משופרת זו לשילוב של ארכיטקטורת מודל בסיס משופרת וטכניקות עידון מתקדמות לאחר האימון. בין טכניקות אלו נמנות reinforcement learning (למידת חיזוק), שבה המודל לומד ממשוב, ו-chain-of-thought prompting (הנחיית שרשרת מחשבה), שיטה המעודדת את ה-AI לפרק בעיות מורכבות לשלבי ביניים, ובכך לשפר את השקיפות והדיוק של תהליך ההסקה שלו.
מדדי הביצועים הראשוניים נראים מבטיחים. Google הדגישה כי Gemini 2.5 Pro Experimental כבר טיפס לראש דירוג ה-Chatbot Arena, פלטפורמה מבוססת מיקור המונים שבה מודלי AI שונים מתחרים זה בזה באופן אנונימי ומדורגים על ידי משתמשים אנושיים. הדבר מצביע על ביצועים מעשיים חזקים באינטראקציות עם משתמשים. יתר על כן, החברה הדגישה את יכולותיו במשימות הסקה וקידוד, תחומים קריטיים הן ליישומים אנליטיים והן לאוטומציה של פיתוח תוכנה. הזמינות של מודל מתקדם זה למנויי Gemini Advanced מסמלת את האסטרטגיה של Google לדרג את היצע ה-AI שלה, תוך מתן יכולות מתקדמות למשתמשים משלמים, וככל הנראה שילוב גרסאות מעודנות במערכת האקולוגית הרחבה יותר של מוצריה לאורך זמן. השקה זו ללא ספק מעצימה את התחרות המתמשכת עם יריבות כמו סדרת GPT של OpenAI ומודלי Claude של Anthropic, ודוחפת את גבולות היכולת של מודלי שפה גדולים במונחים של פתרון משימות מורכבות והבנה ניואנסית. הדגש על ‘חשיבה’ ו’הסקה’ עשוי לבשר על שלב חדש שבו מודלי AI יוערכו לא רק על סמך שליפת ידע, אלא גם על סמך חריפותם בפתרון בעיות.
Alibaba Cloud מגיבה עם Qwen2.5: עוצמה רב-מודאלית באריזה קומפקטית
כדי לא להישאר מאחור, Alibaba Cloud, עמוד השדרה הטכנולוגי והמודיעיני הדיגיטלי של Alibaba Group, הציגה התקדמות משמעותית משלה עם השקת מודל ה-AI Qwen2.5-Omni-7B. השקה זו מדגישה את החשיבות הגוברת של AI רב-מודאלי, מערכות המסוגלות להבין ולעבד מידע בפורמטים שונים – לא רק טקסט, אלא גם תמונות, אודיו ואפילו וידאו. מודל Qwen2.5 נועד לקלוט קלטים מגוונים אלה ולהגיב באמצעות טקסט שנוצר או דיבור הנשמע טבעי להפליא.
גורם מבדל מרכזי שהודגש על ידי Alibaba הוא האופי הקומפקטי של המודל. בעוד שמודלים מתקדמים רבים מתהדרים במספר פרמטרים עצום, שלעיתים קרובות מתואם עם עלויות חישוב גבוהות ומורכבות פריסה, Qwen2.5-Omni-7B שואף ליעילות. Alibaba מציעה שטביעת רגל קטנה יותר זו הופכת אותו לבסיס אידיאלי לבניית סוכני AI זריזים וחסכוניים. סוכני AI, שנועדו לבצע משימות באופן אוטונומי, נהנים באופן משמעותי ממודלים שהם חזקים אך יעילים במשאבים, ומאפשרים פריסה רחבה יותר על חומרה מגוונת, פוטנציאלית כולל התקני קצה (edge devices). התמקדות זו ביעילות מטפלת בצוואר בקבוק קריטי באימוץ AI – העלות והדרישות התשתיתיות, שלעיתים קרובות הן אוסרניות, הקשורות להרצת המודלים הגדולים ביותר.
כדי להרחיב עוד יותר את טווח ההגעה וההשפעה שלה, Alibaba הפכה את מודל Qwen2.5 לקוד פתוח, והפכה אותו לזמין בקלות למפתחים וחוקרים ברחבי העולם באמצעות פלטפורמות פופולריות כמו Hugging Face ו-GitHub. אסטרטגיה זו מנוגדת לגישה הקניינית יותר שננקטת על ידי חלק מהמתחרים ומשרתת מספר מטרות. היא מטפחת מעורבות קהילתית, מאפשרת בחינה ושיפור עצמאיים של המודל, ועשויה להאיץ חדשנות על ידי מתן אפשרות למגוון רחב יותר של מפתחים לבנות על הטכנולוגיה של Alibaba. עבור Alibaba Cloud, זה יכול גם להניע אימוץ של שירותי הענן הרחבים יותר שלה, כאשר מפתחים מתנסים ופורסים יישומים המבוססים על מודל הקוד הפתוח. השקת מודל חזק, קומפקטי, רב-מודאלי ופתוח כמו Qwen2.5 ממצבת את Alibaba כשחקנית גלובלית משמעותית בנוף ה-AI, הפונה במיוחד למפתחים המחפשים פתרונות גמישים ויעילים ליצירת יישומי AI מתוחכמים ואינטראקטיביים.
DeepSeek משפרת את מודל V3: חידוד ההסקה והכישורים המעשיים
החדשנות אינה מוגבלת רק לענקיות הטכנולוגיה. DeepSeek, סטארט-אפ AI סיני בולט, יצר גם הוא גלים על ידי שחרור גרסה משודרגת של מודל השפה הגדול V3 שלו. עדכון זה, במיוחד DeepSeek-V3-0324, מתמקד בשיפור יכולות מעשיות החיוניות ליישומים בעולם האמיתי. לדברי הסטארט-אפ, הגרסה החדשה מספקת שיפורים משמעותיים במספר תחומים מרכזיים.
ראשית, ישנה “קפיצה משמעותית בביצועי ההסקה”. בדומה ל-Gemini 2.5 של Google, הדבר מצביע על מגמה ברורה בתעשייה לעבר הערכת יכולות אנליטיות עמוקות יותר על פני זיהוי תבניות פשוט או אחזור מידע. הסקה משופרת מאפשרת למודלים להתמודד עם בעיות לוגיות מורכבות יותר, להבין הקשרים ניואנסיים ולספק תובנות אמינות יותר.
שנית, DeepSeek מדגישה “כישורי פיתוח front-end חזקים יותר”. זוהי התמחות מרתקת, המרמזת על כך שהמודל עובר כוונון עדין כדי לסייע או אפילו לבצע אוטומציה של היבטים ביצירת ממשקי אינטרנט ויישומים. LLM המיומן ביצירת קוד לממשקי משתמש יכול להאיץ משמעותית את מחזורי פיתוח התוכנה.
שלישית, השדרוג מתגאה ב**”יכולות שימוש בכלים חכמות יותר”**. הכוונה היא ליכולת של המודל להשתמש ביעילות בכלים חיצוניים או בממשקי API כדי לגשת למידע בזמן אמת, לבצע חישובים או ליצור אינטראקציה עם מערכות תוכנה אחרות. שיפור השימוש בכלים הופך את ה-LLMs להרבה יותר חזקים ורב-תכליתיים, ומאפשר להם להשתחרר ממגבלות נתוני האימון שלהם וליצור אינטראקציה דינמית עם העולם הדיגיטלי.
בדומה לאסטרטגיה של Alibaba, DeepSeek הפכה את המודל המשודרג הזה לנגיש לקהילה הגלובלית באמצעות Hugging Face. גישה פתוחה זו מאפשרת לחוקרים ומפתחים למנף את ההתקדמות של DeepSeek, ותורמת לצמיחת המערכת האקולוגית הרחבה יותר. ההתמקדות במיומנויות מעשיות ספציפיות כמו פיתוח front-end ושימוש בכלים מדגימה התבגרות של התחום, מעבר ממודלים לשימוש כללי לעבר עוזרי AI מיוחדים יותר המותאמים לתחומים מקצועיים מסוימים. ההתקדמות של DeepSeek מדגישה גם את התרומות המשמעותיות המגיעות מסצנת המחקר והפיתוח התוססת של AI בסין.
Landbase משיקה מעבדת AI יישומית: התמקדות ב-Agentic AI לעסקים
במעבר מפיתוח מודלים ליישום מיוחד, Landbase, המזהה את עצמה כ”חברת Agentic AI”, הודיעה על הקמת מעבדת AI יישומית חדשה הממוקמת אסטרטגית בעמק הסיליקון (Silicon Valley). מהלך זה מסמן מאמץ ממוקד לדחוףאת גבולות ה-agentic AI, תחום המתמקד ביצירת מערכות AI אוטונומיות (סוכנים) שיכולות לתכנן, לקבל החלטות ולבצע משימות מורכבות עם התערבות אנושית מינימלית.
הרכבת צוות המעבדה מעידה רבות על שאיפותיה. Landbase הדגישה גיוס כישרונות ממוסדות וחברות יוקרתיים, כולל אוניברסיטת סטנפורד (Stanford University), Meta (לשעבר Facebook) ו-NASA. ריכוז מומחיות זה מצביע על מחויבות להתמודדות עם אתגרי מחקר בסיסיים לצד פיתוח יישומים מעשיים בתחום ה-agentic AI. המשימה המוצהרת של המעבדה היא להאיץ חדשנות בשלושה תחומי ליבה:
- אוטומציה של זרימות עבודה (Workflow Automation): פיתוח סוכני AI המסוגלים להשתלט על תהליכים עסקיים מורכבים מרובי שלבים, פוטנציאלית לייעל תפעול ולפנות עובדים אנושיים למשימות ברמה גבוהה יותר.
- מודיעין נתונים (Data Intelligence): יצירת סוכנים שיכולים לנתח נתונים באופן יזום, לזהות דפוסים, לייצר תובנות ואולי אף להמליץ המלצות מבוססות נתונים באופן אוטונומי.
- למידת חיזוק (Reinforcement Learning): שימוש בטכניקות למידת חיזוק לא רק לאימון מודלים, אלא פוטנציאלית כדי לאפשר לסוכנים ללמוד ולהתאים את האסטרטגיות שלהם בהתבסס על תוצאות בעולם האמיתי ומשוב בהקשרים עסקיים ספציפיים.
Landbase מקשרת יוזמה זו למודל GTM-1 Omni הקיים שלה, שלטענתה הוא מודל ה-agentic AI הראשון והיחיד שנבנה במיוחד למטרות go-to-market (GTM). הדבר מרמז על התמקדות ביישום agentic AI במכירות, שיווק וניהול קשרי לקוחות – תחומים הבשלים לאוטומציה ואופטימיזציה מבוססת נתונים. Daniel Saks, מנכ”ל Landbase, הדגיש את חשיבות צוות המומחים בהנעת חדשנות עבור מודל מיוחד זה.
מעבדת ה-AI היישומית תרכז את מאמציה בפיתוח סוגים נפרדים של מודלים החיוניים למערכות סוכנים יעילות:
- מודלי תכנון וקבלת החלטות: האינטליגנציה המרכזית המאפשרת לסוכנים להגדיר יעדים, לתכנן אסטרטגיות ולבחור פעולות מתאימות.
- מודלי יצירת הודעות: AI המסוגל ליצור תקשורת רלוונטית להקשר ויעילה למשימות כמו פנייה למכירות או תמיכת לקוחות.
- מודלי חיזוי ותגמול: מערכות המסייעות לסוכנים לצפות תוצאות, להעריך את הצלחתן הפוטנציאלית של פעולות שונות וללמוד מניסיונם.
הקמת מעבדה ייעודית זו מדגישה מגמה גוברת לעבר חברות AI מתמחות המתמקדות ביישומים עסקיים בעלי ערך גבוה, במיוחד תוך מינוף הפוטנציאל של סוכנים אוטונומיים לשנות פונקציות תפעוליות ליבה.
גישור על פערי חומרה: webAI ו-MacStadium משתפות פעולה לפריסה על Apple Silicon
לבסוף, בהתייחסות לשכבת התשתית הקריטית שעליה תלוי כל פיתוח AI, חברת פתרונות ה-AI webAI וספקית הענן הארגונית MacStadium הודיעו על שותפות אסטרטגית. שיתוף הפעולה שלהן נועד להתמודד עם אתגר משמעותי: פריסת מודלי AI גדולים וחזקים ביעילות, במיוחד עבור עסקים המתמודדים עם מגבלות חומרה או מחפשים חלופות לתשתית ענן מסורתית מבוססת GPU.
השותפות מציגה פלטפורמה חדשנית שנועדה לפרוס מודלי AI גדולים תוך מינוף טכנולוגיית Apple silicon. MacStadium מתמחה באספקת תשתית ענן המבוססת על חומרת Mac של Apple, כולל מכונות המצוידות בשבבי M-series החזקים (Apple silicon). שבבים אלה, הידועים בארכיטקטורה המשולבת שלהם המשלבת CPU, GPU ו-Neural Engine, מציעים ביצועים מרשימים לוואט, ועשויים לספק פלטפורמה יעילה יותר מבחינה חישובית עבור עומסי עבודה מסוימים של AI בהשוואה לחומרת שרתים מסורתית.
שיתוף הפעולה נועד לפתוח פוטנציאל זה לפריסת AI. על ידי שילוב המומחיות של MacStadium בסביבות ענן macOS עם “גישת המודלים המחוברים” (interconnected model approach) של webAI (שפרטיה מצדיקים פירוט נוסף אך ככל הנראה מתייחסים לטכניקות לאופטימיזציה או חלוקת עומסי עבודה של מודלים), השותפות מתכוונות ליצור פלטפורמה המשנה את האופן שבו ארגונים מפתחים ופורסים מערכות AI מתקדמות, במיוחד על חומרת Apple. הדבר יכול להיות אטרקטיבי במיוחד לארגונים שכבר מושקעים רבות במערכת האקולוגית של Apple או לאלה המחפשים חלופות חסכוניות ויעילות בצריכת חשמל להשכרת קיבולת GPU יקרה מספקיות ענן גדולות.
Ken Tacelli, מנכ”ל MacStadium, הגדיר את השותפות כ”אבן דרך משמעותית” בהבאת יכולות AI לארגונים באמצעות תשתית החומרה של Apple. היוזמה מבטיחה יעילות וביצועים חישוביים גדולים יותר, ועשויה לדמוקרטיזציה של הגישה לפריסת מודלי AI גדולים עבור עסקים שהיו מוגבלים בעבר על ידי עלויות חומרה או זמינות. שותפות זו מדגישה את החיפוש המתמשך אחר פתרונות חומרה מגוונים ויעילים להפעלת הצרכים החישוביים התובעניים ההולכים וגדלים של הבינה המלאכותית המודרנית, תוך בחינת ארכיטקטורות מעבר לפרדיגמת ה-GPU הדומיננטית. היא מסמלת שעתיד תשתית ה-AI עשוי להיות הטרוגני יותר ממה שהונח בעבר, וישלב סיליקון מיוחד כמו זה של Apple לצד חומרת מרכזי נתונים מסורתית.