גוגל מגבירה את שאיפותיה בתחום הבינה המלאכותית, בדומה לאסטרטגיה של אפל, במיוחד בתחום מודלי ה-Generative AI (GenAI) גדולים. ועידת Google Cloud Next האחרונה הדגימה את החזון השאפתני של גוגל. זה כולל חידושים החל משבב TPU v7 Ironwood, שנועד להתחרות ב-GB200 של Nvidia, ועד לפרוטוקול Agent2Agent (A2A) שמטרתו לעלות על MCP של Anthropic, וסביבת הריצה Pathways לפריסת GenAI.
גוגל גם מפתחת באופן פעיל כלים כמו ADK ו-Agentspace כדי להעצים מפתחים ביצירת סוכני AI. מרכזי למאמץ זה הוא Vertex AI, פלטפורמת הפיתוח והפריסה המקורית לענן של גוגל. Vertex AI מציעה כעת מגוון שירותים ליצירת תוכן, הכוללים את Veo 2 לווידאו, Imagen 3 לתמונות, Chirp 3 לאודיו ו-Lyria למוזיקה. ברור ש-Google Cloud ממצבת את עצמה לספק למפתחים ולמשתמשים חבילה מקיפה של יישומי פיתוח מודלים גדולים של GenAI.
בעוד שהשימושיות בפועל של שירותים וחוויות אלה טרם נראתה, גוגל הקימה מערכת אקולוגית שלמה, מרובת מודלים, של חומרת ותוכנת AI שפותחה עצמאית, סגורה וזמינה.
גישה מקיפה זו מציירת תמונה של גוגל כאפל של עידן הבינה המלאכותית.
ה-Ironwood TPU: מתמודד עוצמתי
החשיפה של שבב ה-TPU מהדור השביעי, Ironwood, בולטת במיוחד.
- כל TPU מצויד ב-192GB של זיכרון HBM, עם רוחב פס שנע בין 7.2 ל-7.4TB/s, ככל הנראה תוך שימוש בטכנולוגיית HBM3E. זה משתווה לטובת שבב ה-B200 של Nvidia, המציע רוחב פס של 8TB/s.
- כל TPU v7 מקורר נוזל יכול להשיג 4.6 פטהפלופס של כוח מחשוב FP8 צפוף. זה מעט פחות מ-20 הפטהפלופס של ה-B200.
- עם זאת, רשת מרכזי הנתונים Jupiter של גוגל מאפשרת שינוי גודל לתמיכה בעד 400,000 שבבים או 43 אשכולות TPU v7x. מומחיות טכנולוגיית השרתים של גוגל מאפשרת לה להפחית מחשיבות מדדי ביצועים של שבב בודד.
- באופן מכריע, גוגל הציגה את Pathways, סביבת ריצה ייעודית של AI המשפרת את הגמישות של פריסת מודל GenAI, ומחזקת עוד יותר את היתרונות שלה בתחום אשכול השירותים.
- Ironwood זמין בשתי תצורות אשכול: 256 שבבים או 9216 שבבים, המותאמים לעומסי עבודה ספציפיים. אשכול בודד יכול להשיג כוח מחשוב של 42.5 אקספלופס. גוגל טוענת שהביצועים האלה עולים על המחשב העל הגדול בעולם, אל קפיטן, בפקטור של 24. עם זאת, נתון זה נמדד בדיוק FP8, ואל קפיטן של AMD עדיין לא סיפק נתוני דיוק FP8. גוגל הכירה בכך, מה שהופך השוואה ישירה לקשה.
אימוץ מערכת אקולוגית של GenAI סגורה
גוגל ממשיכה במערכת אקולוגית מקיפה סגורה בתחום GenAI. בעוד של-Gemma בקוד פתוח יש יתרונות, גוגל מכוונת משאבים לפתרונות הסגורים שלה.
עם העלייה בעניין של סוכני AI, גוגל הכריזה על פרוטוקול A2A בוועידה, תוך גיוס 50 ספקים מיינסטרים כדי להתחרות ב-MCP של Anthropic.
בעוד ש-OpenAI פתחה את ה-Agents SDK שלה, ושילבה את יכולות המודל הגדולות שלה, גוגל מרחיבה את Vertex AI עם ADK, Agentspace, AutoML, AIPlatform ו-Kubeflow, ומזרימה יכולות מודלים שונות.
עם זאת, כאשר משווים את יצירת התמונות של GPT-4o לתכונות המקבילות של Gemini 2.0 Flash, ההצעות של גוגל, אם כי שאפתניות, עשויות להיות חסרות ליטוש. השילוב של מודלים, שירותים וכלים רבים, אם כי מועיל לתחרות, עשוי להיראות מוקדם מדי. השוק זקוק למודלים גדולים מרובי מודלים בוגרים ומשולבים היטב ושירותים בתוך המודל.
שכפול Gmail, Chrome והמודל של גוגל ב-AI
ההצלחה של גוגל עם Gmail, Chrome וגישת “שלושת השלבים” שלה אפשרה לה לשלוט בשוק הטכנולוגיה העולמי. אסטרטגיה זו מיושמת במהירות בתחום GenAI. עם זאת, בניגוד לתמיכתה בעבר בקוד פתוח, גוגל מאמצת יותר ויותר פיתוח סגור.
גוגל הופכת למעשה קוד פתוח לצורה של קוד סגור על ידי איחוד משאביה כדי ליצור מערכת אקולוגית דומיננטית בתחום ספציפי, ואז הטלת אגרות. גישה זו סופגת ביקורת גוברת מצד מפתחים.
מסגרות הלמידה המכונה בקוד פתוח של גוגל, TensorFlow ו-Jax, השיגו הצלחה עולמית. עם זאת, סביבת הריצה החדשה של Pathways סגורה, ואף מבודדת את כלי הפיתוח CUDA של Nvidia.
גוגל נגד Nvidia: הקרב על השליטה ב-AI
כאשר Nvidia תומכת ב-Physical AI ומציגה את המודל הכללי הרובוטי ההומנואידי בקוד פתוח Isaac GR00T N1, גוגל DeepMind נכנסת לשוק עם Gemini Robotics ו-Gemini Robotics-ER, המבוססים על Gemini 2.0.
נכון לעכשיו, הנוכחות של גוגל חסרה רק בשוק מחשבי ה-AI השולחניים. כיצד DGX Spark (לשעבר Project DIGITS) ו-DGX Station של Nvidia, יחד עם Mac Studio של אפל, יתחרו בשירותי הענן של גוגל? שאלה זו הפכה למוקד מרכזי בתעשייה לאחר הוועידה.
הסתמכותה של אפל על Google Cloud ושבב ה-M3 Ultra
אפל מדווחת על שימוש באשכולות TPU של Google Cloud כדי לאמן את המודלים הגדולים שלה, ואף ויתרה על פתרונות אימון שבבים של Nvidia עקב שיקולי עלות! למרות שהיא מתמודדת עם חולשות תוכנה, אפל מתמקדת בשבבי סדרת ה-M שלה. Mac Studio העדכני ביותר, המצויד בשבב M3 Ultra, מתהדר כעת בעד 512GB של זיכרון מאוחד. האימוץ המוקדם הפוטנציאלי של אפל בטכנולוגיית Pathways של Google עשוי ליישר אותה עם גוגל.
גורם ההגבלים העסקיים
הנושא הבסיסי סובב סביב חששות הגבלים עסקיים. נכון לעכשיו, המודל העסקי של אפל ממוקם באופן ייחודי כדי לנווט בתביעות הגבלים עסקיים גלובליות, שלא כמו מיקרוסופט וגוגל, העומדות בפני פירוקים פוטנציאליים. גודלה של גוגל חושף אותה לסיכון של מכירת חובה של מערכת ההפעלה Android העיקרית שלה ועסקי דפדפן Chrome.
גוגל הפסיקה לאחרונה את התחזוקה של Android Open Source Project (AOSP), מה שהופך את המעבר למודל Apple לבלתי נמנע בעידן הבינה המלאכותית. ככל שפורצות דרך של AI צצות, השינוי האסטרטגי של גוגל הופך לברור יותר ויותר.
הרחבה על Google’s TPU v7 Ironwood
התעמקות במפרטים של ה-TPU v7 Ironwood חושפת חתיכת חומרה מהונדסת בקפידה. 192GB של High Bandwidth Memory (HBM) הוא רכיב קריטי, המאפשר גישה מהירה לנתונים החיונית לאימון והפעלה של מודלי AI מורכבים. השימוש החזוי בטכנולוגיית HBM3E מדגיש את המחויבות של גוגל למנף התקדמות חדשנית בטכנולוגיית הזיכרון. רוחב הפס של 7.2-7.4TB/s הוא לא רק מספר מרשים; הוא מתורגם ישירות לזמני עיבוד מהירים יותר ויכולת להתמודד עם מערכי נתונים גדולים ומסובכים יותר.
ההשוואה עם B200 של Nvidia היא בלתי נמנעת, לאור הדומיננטיות של Nvidia בשוק ה-GPU. בעוד שה-B200 מציע רוחב פס גבוה במקצת של 8TB/s, ארכיטקטורת המערכת הכוללת והשילוב בתוך המערכת האקולוגית של גוגל הם המקום שבו איירונווד שואפת לבדל את עצמה.
4.6 פטהפלופס של כוח מחשוב FP8 צפוף הוא מדד ליכולת של השבב לבצע פעולות נקודה צפה, שהן בסיסיות לחישובי AI. ההבדל בהשוואה ל-20 הפטהפלופס של ה-B200 מדגיש את פילוסופיות העיצוב השונות. גוגל מדגישה את המדרגיות והשילוב של ה-TPU שלה בתוך תשתית מרכזי הנתונים שלה, בעוד Nvidia מתמקדת בכוח חישובי גולמי ברמת השבב.
המשמעות של רשת מרכזי הנתונים Jupiter של גוגל
רשת מרכזי הנתונים Jupiter של גוגל היא נכס משמעותי, המאפשר חיבור חלק של מספר עצום של שבבי TPU. היכולת לתמוך בעד 400,000 שבבים או 43 אשכולות TPU v7x מדגישה את קנה המידה שבו גוגל פועלת. מדרגיות זו היא גורם מבדל מרכזי, מכיוון שהיא מאפשרת לגוגל להפיץ עומסי עבודה על פני תשתית עצומה, ולייעל את הביצועים והיעילות.
המומחיות של גוגל בטכנולוגיית שרתים היא גורם מכריע באסטרטגיית ה-AI שלה. על ידי תעדוף ביצועים ברמת המערכת על פני מפרטי שבבים בודדים, גוגל יכולה למנף את התשתית שלה כדי להשיג תוצאות מעולות. גישה זו רלוונטית במיוחד בהקשר של אימון מודלים גדולים של AI, שבו היכולת להפיץ חישובים על פני רשת של מעבדים מחוברים חיונית.
חשיפת סביבת הריצה Pathways AI
הצגת Pathways היא מהלך אסטרטגי המשפר את הגמישות והיעילות של פריסת מודל GenAI. סביבת ריצה ייעודית זו של AI מאפשרת למפתחים לייעל את המודלים שלהם לתשתית של גוגל, תוך ניצול מלא של משאבי החומרה והתוכנה הזמינים.
Pathways מייצגת השקעה משמעותית בערימת תוכנת ה-AI, ומספקת פלטפורמה מאוחדת לפריסה וניהול של מודלי AI. על ידי ייעול תהליך הפריסה, גוגל שואפת להוריד את מחסום הכניסה למפתחים ולעודד את אימוץ שירותי ה-AI שלה. זה, בתורו, יניע חדשנות וייצור מערכת אקולוגית תוססת סביב פלטפורמת ה-AI של גוגל.
תובנה עמוקה יותר לגבי האסטרטגיה הסגורה של גוגל
האימוץ של גוגל באסטרטגיה סגורה בתחום GenAI הוא בחירה מכוונת המשקפת את החזון ארוך הטווח שלה לגבי AI. בעוד שה-Gemma בקוד פתוח הייתה תרומה חשובה לקהילת ה-AI, גוגל מעדיפה בבירור את הפתרונות הסגורים שלה, מתוך הכרה שהם מציעים שליטה והתאמה אישית גדולות יותר.
על ידי התמקדות בפיתוח סגור, גוגל יכולה לייעל את מודלי ה-AI והתשתית שלה למשימות ספציפיות, תוך הבטחת ביצועים ויעילות מרביים. גישה זו גם מאפשרת לגוגל להגן על הקניין הרוחני שלה ולשמור על יתרון תחרותי בנוף ה-AI המתפתח במהירות.
הגישה הסגורה אינה חפה ממבקרים, הטוענים שהיא חונקת חדשנות ומגבילה שיתוף פעולה. עם זאת, גוגל טוענת שזה הכרחי כדי להבטיח את האיכות, האבטחה והאמינות של שירותי ה-AI שלה.
פרוטוקול A2A והקרב על השליטה בסוכני AI
הופעתם של סוכני AI יצרה זירת קרב חדשה בתעשיית ה-AI, וגוגל נחושה להיות מובילה בתחום זה. ההכרזה על פרוטוקול A2A בוועידת Google Cloud Next היא אינדיקציה ברורה לשאיפות של גוגל.
על ידי גיוס 50 ספקים מיינסטרים לתמיכה בפרוטוקול A2A, גוגל מנסה ליצור תקן מאוחד לתקשורת סוכני AI. זה יאפשר לסוכני AI מפלטפורמות שונות ליצור אינטראקציה בצורה חלקה, וליצור מערכת אקולוגית של AI מחוברת ושיתופית יותר.
התחרות עם MCP של Anthropic היא היבט מרכזי באסטרטגיית סוכני AI של גוגל. Anthropic היא חברת מחקר AI מכובדת, ופרוטוקול MCP שלה צבר אחיזה בתעשייה. פרוטוקול A2A של גוגל מייצג אתגר ישיר ל-MCP, ולתוצאה של תחרות זו תהיה השפעה משמעותית על עתיד סוכני AI.
Vertex AI: פלטפורמת פיתוח AI מקיפה
Vertex AI של גוגל היא פלטפורמת פיתוח AI מקיפה המספקת למפתחים מגוון רחב של כלים ושירותים. על ידי שילוב של ADK, Agentspace, AutoML, AIPlatform ו-Kubeflow, גוגל יוצרת חנות אחת לפיתוח AI.
Vertex AI שואפת לפשט את תהליך פיתוח ה-AI, ולהקל על מפתחים לבנות, לאמן ולפרוס מודלי AI. הפלטפורמה גם מספקת גישה לספרייה עצומה של מודלים שאומנו מראש, ומאפשרת למפתחים לשלב במהירות יכולות AI ביישומים שלהם.
השילוב של יכולות מודלים שונות הוא יתרון מרכזי של Vertex AI. על ידי הצעת מגוון מודלים, גוגל נותנת מענה למגוון רחב של מקרי שימוש, החל מזיהוי תמונות ועד עיבוד שפה טבעית. גישה מקיפה זו הופכת את Vertex AI לבחירה משכנעת עבור מפתחים המחפשים פלטפורמת פיתוח AI רב-תכליתית ועוצמתית.
שילוב המודלים של גוגל: שאפתנות מול ביצוע
בעוד שהשאפתנות של גוגל לשלב מודלים, שירותים וכלים רבים ראויה לשבח, הביצוע עשוי לדרוש ליטוש נוסף. השוק דורש מודלים גדולים מרובי מודלים בוגרים ומשולבים היטב ושירותים בתוך המודל. ההצעות הנוכחיות של גוגל, אם כי מבטיחות, עשויות להזדקק לליטוש נוסף כדי לעמוד בציפיות אלה.
שילוב של יכולות AI שונות הוא מיזם מורכב, וגוגל ניצבת בפני האתגר של הבטחת שהמודלים והשירותים השונים שלה יעבדו יחד בצורה חלקה. זה דורש תשומת לב קפדנית לפרטים ומחויבות לשיפור מתמיד.
בסופו של דבר, הצלחת המאמצים של גוגל לשילוב מודלים תהיה תלויה ביכולתה לספק חוויית משתמש שהיא גם חזקה וגם אינטואיטיבית. זה ידרוש הבנה מעמיקה של צרכי המשתמשים והתמקדות בלתי פוסקת באיכות.