Ironwood TPU של גוגל: קפיצת מדרגה בבינה מלאכותית

הנוף של בינה מלאכותית (AI) מתפתח ללא הרף, כאשר להתקדמות בחומרה יש תפקיד מרכזי בפתיחת אפשרויות חדשות. גוגל, חלוצה בחדשנות בתחום הבינה המלאכותית, חשפה לאחרונה את יחידת עיבוד הטנסור (TPU) מהדור השביעי שלה, ששמה הקוד הוא Ironwood, המסמנת צעד משמעותי ביכולות המחשוב של הבינה המלאכותית. מאיץ AI חדשני זה מתהדר ביכולת חישובית העולה אפילו על המחשבי העל המהירים בעולם בפקטור מדהים של 24 בפריסות בקנה מידה גדול.

Ironwood, שהוכרז בכנס Google Cloud Next ‘25, מייצג ציר אסטרטגי במסע בן עשור של גוגל בפיתוח שבבי AI. שלא כמו קודמיו, שתוכננו בעיקר עבור עומסי עבודה של אימון והסקת מסקנות של AI, Ironwood תוכנן במיוחד כדי להצטיין במשימות הסקה, המבשרות עידן חדש של יישומים מונעי בינה מלאכותית.

לדברי אמין והדאת, סגן נשיא ומנהל כללי של למידת מכונה, מערכות ו-Cloud AI בגוגל, “Ironwood נועד לתמוך בשלב הבא של AI גנרטיבי ובדרישות המחשוב והתקשורת העצומות שלו. זה מה שאנו מכנים ‘עידן ההסקה’, שבו סוכני AI יאחזרו ויפיקו נתונים באופן יזום כדי לספק תובנות ותשובות בשיתוף פעולה, ולא רק נתונים”.

חשיפת היכולות חסרות התקדים של Ironwood

המפרט הטכני של Ironwood הוא לא פחות ממדהים. כאשר הוא מוגדל לתא של 9,216 שבבים, הוא יכול לספק 42.5 אקסה-פלופס מדהימים של כוח מחשוב AI. נתון זה מצמצם את 1.7 האקסה-פלופס שמציע El Capitan, המחזיק הנוכחי בתואר עבור מחשב העל המהיר בעולם. כל שבב Ironwood בודד מתהדר ביכולת מחשוב שיא של 4,614 TFLOPs.

מעבר לעוצמת עיבוד גרידא, Ironwood כולל גם שיפורים משמעותיים בזיכרון וברוחב פס. כל שבב מצויד ב-192GB של זיכרון בעל רוחב פס גבוה (HBM), גידול של פי שישה לעומת ה-TPU מהדור הקודם, Trillium, ששוחרר בשנה שעברה. יתר על כן, רוחב פס הזיכרון לכל שבב מגיע ל-7.2 טרה-ביט/שנייה, המייצג שיפור של פי 4.5 לעומת Trillium.

בעידן שבו מרכזי נתונים מתרחבים וצריכת החשמל הופכת לדאגה קריטית, Ironwood בולט גם ביעילות האנרגטית שלו. הביצועים שלו לכל וואט כפולים מאלה של Trillium וכמעט פי 30 גבוהים יותר מה-TPU הראשון שהוצג בשנת 2018.

הדגש על אופטימיזציה של הסקה מסמל שינוי מרכזי בנוף הבינה המלאכותית. בשנים האחרונות, מעבדות AI מובילות התמקדו בעיקר בבניית מודלים בסיסיים גדולים יותר ויותר עם ספירות פרמטרים הולכות וגדלות. ההתמקדות של גוגל באופטימיזציה של הסקה מצביעה על מעבר לשלב חדש המתמקד ביעילות פריסה וביכולות הסקה.

בעוד שאימון מודלים נשאר חיוני, מספר איטרציות האימון הוא סופי. לעומת זאת, ככל שטכנולוגיות AI משולבות יותר ויותר ביישומים שונים, צפויים פעולות הסקה להתרחש מיליארדי פעמים ביום. ככל שהמודלים גדלים במורכבות, הכדאיות הכלכלית של יישומים אלה הופכת קשורה באופן בלתי נפרד לעלויות הסקה.

במהלך שמונה השנים האחרונות, הביקוש של גוגל למחשוב AI גדל פי עשרה, והגיע ל-100 מיליון מדהימים. ללא ארכיטקטורות מיוחדות כמו Ironwood, אפילו ההתקדמות הבלתי פוסקת של חוק מור תתקשה לעמוד בקצב הצמיחה האקספוננציאלית הזו.

יש לציין שההודעה של גוגל מדגישה את התמקדותה ב”מודלים מנטליים” המסוגלים לבצע משימות חשיבה מורכבות ולא רק זיהוי תבניות פשוט. זה מצביע על כך שגוגל צופה עתיד שבו AI חורג ממודלים גדולים יותר ומקיף מודלים שיכולים לפרק בעיות, לבצע חשיבה מרובת שלבים ולחקות תהליכי חשיבה דמויי אדם.

הפעלת הדור הבא של מודלים גדולים

גוגל ממקמת את Ironwood כתשתית הבסיס למודלים ה-AI המתקדמים ביותר שלה, כולל Gemini 2.5, המתהדר ביכולות חשיבה מובנות באופן טבעי.

גוגל הציגה לאחרונה גם את Gemini 2.5 Flash, גרסה קטנה יותר של מודל הדגל שלה שנועדה עבור יישומים יומיומיים רגישים לזמן אחזור. Gemini 2.5 Flash יכול להתאים באופן דינמי את עומק החשיבה שלו בהתבסס על המורכבות של הבקשה.

גוגל הציגה גם את חבילת המודלים הגנרטיביים הרב-מודאליים המקיפה שלה, כולל טקסט לתמונה, טקסט לווידאו ותכונת הטקסט למוזיקה שנחשפה לאחרונה, Lyria. הדגמה הדגימה כיצד ניתן לשלב כלים אלה כדי להפיק סרטון קידום מכירות שלם לקונצרט.

Ironwood הוא רק מרכיב אחד באסטרטגיית תשתית ה-AI הרחבה יותר של גוגל. גוגל הכריזה גם על Cloud WAN, שירות רשת אזורית רחבה מנוהלת המאפשרת לארגונים לגשת לתשתית הרשת הפרטית בקנה מידה גלובלי של גוגל.

יתר על כן, גוגל מרחיבה את היצע התוכנה שלה עבור עומסי עבודה של AI,כולל Pathways, זמן ריצה של למידת מכונה שפותח על ידי Google DeepMind. Pathways מאפשרת כעת ללקוחות לשנות את גודל שירות המודלים על פני מאות TPUs.

טיפוח שיתוף פעולה בין סוכני AI עם A2A

מעבר להתקדמות חומרה, גוגל הציגה גם את החזון שלה למערכת אקולוגית של AI הממוקדת במערכות מרובות סוכנים. כדי להקל על פיתוח סוכנים חכמים, גוגל הציגה את פרוטוקול Agent-to-Agent (A2A), שנועד לאפשר תקשורת מאובטחת ומתוקננת בין סוכני AI שונים.

גוגל מאמינה ש-2025 תסמן שנה טרנספורמטיבית עבור AI, כאשר יישומי AI גנרטיביים יתפתחו ממענה לשאלות בודדות לפתרון בעיות מורכבות באמצעות מערכות סוכנים.

פרוטוקול A2A מאפשר יכולת פעולה הדדית בין סוכנים על פני פלטפורמות ומסגרות שונות, ומספק להם “שפה” משותפת וערוצי תקשורת מאובטחים. ניתן לראות בפרוטוקול זה כשכבת רשת עבור סוכנים חכמים, שמטרתה לפשט את שיתוף הפעולה בין סוכנים בתהליכי עבודה מורכבים. על ידי הפעלת סוכני AI מיוחדים לעבודה משותפת על משימות בעלות מורכבות ומשך זמן משתנים, A2A מבקשת לשפר את היכולות הכוללות באמצעות שיתוף פעולה.

A2A פועל על ידי ביסוס דרך סטנדרטית לסוכנים להחליף מידע ולתאם פעולות, מבלי לדרוש מהם לשתף קוד או מבני נתונים בסיסיים. זה מאפשר יצירת מערכות AI מודולריות וגמישות יותר, שבהן ניתן להוסיף, להסיר או להגדיר מחדש סוכנים בקלות לפי הצורך.

גוגל ערכה השוואה בין פרוטוקולי MCP ו-A2A בפוסט בבלוג.

  • MCP (Model Context Protocol) מיועד לניהול כלים ומשאבים.
    • הוא מחבר סוכנים לכלים, ממשקי API ומשאבים באמצעות קלט/פלט מובנה.
    • Google ADK תומך בכלי MCP, ומאפשר לשרתי MCP שונים לעבוד עם סוכנים.
  • A2A (Agent2Agent Protocol) מיועד לשיתוף פעולה בין סוכנים.
    • הוא מאפשר תקשורת דינמית ורב-מודאלית בין סוכנים מבלי לשתף זיכרון, משאבים או כלים.
    • זהו תקן פתוח המונע על ידי הקהילה.
    • ניתן לראות דוגמאות באמצעות Google ADK, LangGraph, Crew.AI וכלי אחרים.

למעשה, A2A ו-MCP משלימים: MCP מספק לסוכנים תמיכה בכלי נשק, בעוד ש-A2A מאפשר לסוכנים מצוידים אלה לתקשר ולשתף פעולה זה עם זה.

אם לשפוט לפי השותפים הראשוניים, נראה ש-A2A עומדת לזכות לתשומת לב דומה ל-MCP. למעלה מ-50 חברות הצטרפו לשיתוף הפעולה הראשוני, כולל חברות טכנולוגיה מובילות וספקי שירותי ייעוץ ושילוב מערכות גלובליים מובילים.

גוגל מדגישה את הפתיחות של הפרוטוקול, וממקמת אותו כדרך סטנדרטית לסוכנים לשתף פעולה, ללא קשר למסגרת הטכנולוגית הבסיסית או לספק השירותים. גוגל הציגה חמישה עקרונות מפתח שהנחו את עיצוב הפרוטוקול בשיתוף פעולה עם שותפיה:

  1. אמצו יכולות סוכן: A2A מתמקדת באפשרות לסוכנים לשתף פעולה בדרך הטבעית והלא מובנית שלהם, גם אם הם לא חולקים זיכרון, כלים והקשר. הפרוטוקול נועד לאפשר תרחישים אמיתיים מרובי סוכנים, במקום להגביל סוכנים להיות רק “כלים”.
  2. בנו על סטנדרטים קיימים: הפרוטוקול בנוי על סטנדרטים פופולריים קיימים, כולל HTTP, SSE ו-JSON-RPC, מה שמקל על השילוב עם ערימות IT קיימות הנמצאות בשימוש נפוץ על ידי ארגונים.
  3. מאובטח כברירת מחדל: A2A נועד לתמוך באימות והרשאה ברמה ארגונית, הדומה לסכמות האימות של OpenAPI בעת ההשקה.
  4. תמיכה במשימות ארוכות טווח: A2A נועד להיות גמיש, לתמוך במגוון רחב של תרחישים, ממשימות מהירות ועד מחקר מעמיק שעשוי להימשך שעות ואפילו ימים (כאשר בני אדם מעורבים). לאורך כל התהליך, A2A יכול לספק למשתמשים משוב בזמן אמת, התראות ועדכוני סטטוס.
  5. אגנוסטי למודאליות: עולם הסוכנים אינו מוגבל לטקסט, וזו הסיבה ש-A2A נועד לתמוך במודאליות שונות, כולל זרמי אודיו ווידאו.

גוגל מספקת דוגמה כיצד A2A יכולה לייעל משמעותית את תהליך הגיוס.

בממשק מאוחד כמו Agentspace, מנהל גיוס יכול להקצות סוכן למצוא מועמדים מתאימים בהתבסס על דרישות העבודה. סוכן זה יכול ליצור אינטראקציה עם סוכנים מיוחדים כדי למצוא מועמדים, לתזמן ראיונות ואפילו לערב סוכנים מיוחדים אחרים כדי לסייע בבדיקות רקע, ולאפשר אוטומציה חכמה של תהליך הגיוס כולו על פני מערכות שונות.

אימוץ פרוטוקול הקשר של מודל (MCP)

בנוסף למאמציה בפיתוח A2A, גוגל מאמצת גם את פרוטוקול הקשר של מודל (MCP). שבועות ספורים לאחר שאופנאי הכריזה על אימוץ ה-MCP שלה, גוגל הלכה בעקבותיה.

דמיס חסאביס, מנכ’ל Google DeepMind, הודיע לאחרונה ב-X שגוגל תוסיף תמיכה ב-MCP למודלי Gemini ול-SDKs שלה. עם זאת, הוא לא סיפק ציר זמן ספציפי.

חסאביס הצהיר ש”MCP הוא פרוטוקול מצוין שהופך במהירות לתקן הפתוח לעידן סוכני ה-AI. אני מצפה לעבוד עם צוות ה-MCP ושותפים אחרים בתעשייה כדי לקדם את הטכנולוגיה הזו”.

מאז שחרורו בנובמבר 2024, MCP צבר במהירות אחיזה, והפך לדרך פשוטה ומתוקננת לחבר מודלי שפה עם כלים ונתונים.

MCP מאפשר למודלי AI לגשת לנתונים ממקורות כמו כלי ארגון ותוכנה כדי להשלים משימות, כמו גם לגשת לספריות תוכן וסביבות פיתוח יישומים. הפרוטוקול מאפשר למפתחים ליצור חיבורים דו-כיווניים בין מקורות נתונים ויישומים המופעלים על ידי AI, כגון צ’אטבוטים.

מפתחים יכולים לחשוף ממשקי נתונים באמצעות שרתי MCP ולבנות לקוחות MCP (כגון יישומים ותהליכי עבודה) כדי להתחבר לשרתים אלה. מאז שאנתרופיק פתחה קוד פתוח של MCP, מספר חברות שילבו תמיכה ב-MCP בפלטפורמות שלהן.