TPU Ironwood של גוגל: זינוק קוונטי בעוצמת המחשוב של בינה מלאכותית
הנוף של הבינה המלאכותית הוגדר מחדש עם חשיפת יחידת עיבוד טנסור (TPU) מהדור השביעי של גוגל, שנקראה Ironwood. מאיץ בינה מלאכותית חדשני זה מתגאה ביכולות חישוביות שמנמיכות אפילו את מחשבי העל האדירים ביותר בעולם. בפריסה רחבת היקף, היכולות של Ironwood עולות על אלה של מחשב העל המהיר ביותר בפער עצום של פי 24.
חשיפת Ironwood באירוע Google Cloud Next ‘25 מסמנת רגע מכריע במרדף בן העשור של גוגל אחר חדשנות בשבבי בינה מלאכותית. בעוד שאיטרציות TPU קודמות שימשו בעיקר לעומסי עבודה של אימון והסקה של מודלים של בינה מלאכותית, Ironwood בולט כשבב הראשון שנוצר בקפידה ומותאם למשימות הסקה.
לדברי אמין ואחדת, סגן נשיא ומנכ’ל למידת מכונה, מערכות ו-Cloud AI בגוגל, “Ironwood תוכנן להניע את השלב הבא של בינה מלאכותית גנרטיבית, תוך התייחסות לדרישות החישוביות והתקשורתיות העצומות שלה. אנו נכנסים למה שאנו מכנים ‘עידן ההסקה’, שבו סוכני בינה מלאכותית יאחזרו ויצרו נתונים באופן יזום כדי לספק תובנות ותשובות בשיתוף פעולה, ויעלו על היכולות של עיבוד נתונים גרידא.”
שחרור עוצמה חישובית חסרת תקדים: צלילה ליכולות של Ironwood
המפרטים הטכניים של Ironwood נקראים כמו רשימת משאלות עבור חוקרי ומפתחי בינה מלאכותית. Ironwood, שמגיע לגודל של 9,216 שבבים, מספק 42.5 אקסה-פלופס מדהימים של חישוב בינה מלאכותית. כדי להכניס זאת לפרופורציה, הוא עולה בהרבה על היכולות של מחשב העל השולט כיום, El Capitan, שמגיע לשיא של 1.7 אקסה-פלופס. באופן אינדיבידואלי, כל שבב Ironwood מתגאה ביכולת חישובית שיא של 4614 TFLOPs.
מעבר לעוצמת עיבוד גולמית, Ironwood מציג שיפורים משמעותיים בזיכרון וברוחב פס. כל שבב מצויד ב-192GB של זיכרון ברוחב פס גבוה (HBM), גידול פי שישה בהשוואה לדור TPU הקודם, Trillium. רוחב הפס של הזיכרון שופר גם הוא באופן דרמטי, והגיע ל-7.2 טרה-ביטים/שנייה לכל שבב, פי 4.5 מ-Trillium.
בעידן שבו מרכזי נתונים מתרחבים וצריכת החשמל הופכת לגורם קריטי יותר ויותר, Ironwood מדגים יעילות אנרגטית יוצאת דופן. הביצועים שלו לוואט כפול מזה של Trillium וכמעט פי 30 טובים יותר מה-TPU הראשוני שהוצג בשנת 2018.
מעבר זה לקראת אופטימיזציה של הסקה מייצג אבן דרך משמעותית באבולוציה של הבינה המלאכותית. בשנים האחרונות, מעבדות בינה מלאכותית מובילות התמקדו בבניית מודלים בסיסיים עם ספירת פרמטרים מתרחבת תמיד. הדגש של גוגל על אופטימיזציה של הסקה מסמן מעבר לקראת תעדוף יעילות פריסה ויכולות הסקה בעולם האמיתי.
בעוד שאימון מודלים של בינה מלאכותית הוא פעילות יחסית נדירה, פעולות הסקה מתרחשות מיליארדי פעמים ביום ככל שטכנולוגיות בינה מלאכותית הופכות נפוצות יותר. הכדאיות הכלכלית של עסקים המופעלים על ידי בינה מלאכותית קשורה באופן מהותי לעלויות ההסקה, במיוחד כאשר מודלים הופכים מורכבים יותר ויותר.
במהלך שמונה השנים האחרונות, הביקוש של גוגל לחישוב בינה מלאכותית גדל באופן אקספוננציאלי, גדל פי עשרה והגיע ל-100 מיליון מדהימים. ללא ארכיטקטורות מיוחדות כמו Ironwood, חוק מור לבדו אינו יכול לקיים את מסלול הצמיחה הזה.
הדגש של גוגל על “מודלים של חשיבה” המסוגלים למשימות הסקה מורכבות, ולא רק זיהוי דפוסים פשוט, ראוי במיוחד לציון. זה מצביע על כך שגוגל חוזה עתיד שבו בינה מלאכותית מצטיינת לא רק באמצעות מודלים גדולים יותר אלא גם באמצעות מודלים המסוגלים לפרק בעיות, לבצע חשיבה רב-שלבית ולחקות תהליכי חשיבה דמויי אדם.
הפעלת הדור הבא של מודלים שפה גדולים
גוגל ממקמת את Ironwood כתשתית הבסיסית עבור מודלי הבינה המלאכותית המתקדמים ביותר שלה, כולל Gemini 2.5, המתגאה ב”יכולות חשיבה טבעיות”.
לצד Ironwood, גוגל חשפה את Gemini 2.5 Flash, גרסה יעילה של מודל הדגל שלה המיועדת ליישומים יומיומיים רגישים לחביון. Gemini 2.5 Flash יכול להתאים באופן דינמי את עומק החשיבה שלו בהתבסס על המורכבות של הבקשה.
גוגל הציגה גם את חבילת המודלים הגנרטיביים הרב-מודאליים שלה, הכוללת טקסט לתמונה, טקסט לווידאו, ופונקציונליות הטקסט למוזיקה החדשה, Lyria. הדגמה משכנעת הדגישה כיצד ניתן לשלב את הכלים הללו כדי להפיק סרטון קידום מכירות שלם לקונצרט.
Ironwood הוא רק מרכיב אחד באסטרטגיית תשתית הבינה המלאכותית המקיפה של גוגל. החברה הציגה גם את Cloud WAN, שירות רשת אזורית רחבה מנוהל המאפשר לעסקים לנצל את תשתית הרשת הפרטית בקנה מידה גלובלי של גוגל.
גוגל מרחיבה גם את היצע התוכנה שלה עבור עומסי עבודה של בינה מלאכותית, כולל Pathways, זמן ריצה של למידת מכונה שפותח על ידי Google DeepMind, המאפשר ללקוחות להגדיל את שירות המודלים על פני מאות TPUs.
חזון של בינה שיתופית: הצגת תמיכה ב-A2A וב-MCP
מעבר להתקדמות בחומרה, גוגל ביטאה את החזון שלה לבינה מלאכותית המתמקדת במערכות מרובות סוכנים והציגה את פרוטוקול סוכן לסוכן (A2A), שנועד לטפח תקשורת מאובטחת ומתוקננת בין סוכני בינה מלאכותית מגוונים.
גוגל צופה ששנת 2025 תהיה שנה טרנספורמטיבית עבור בינה מלאכותית, כאשר יישומי בינה מלאכותית גנרטיבית יתפתחו ממענה לשאלות בודדות לפתרון בעיות מורכבות באמצעות מערכות סוכנים מחוברות.
פרוטוקול A2A מאפשר יכולת פעולה הדדית בין פלטפורמות ומסגרות, ומספק לסוכני בינה מלאכותית “שפה” משותפת וערוצי תקשורת מאובטחים. תחשבו על זה כשכבת רשת עבור סוכני בינה מלאכותית, המפשטת שיתוף פעולה בתהליכי עבודה מורכבים ומאפשרת לסוכני בינה מלאכותית מיוחדים להתמודד יחד עם משימות בעלות מורכבות ומשך משתנים, ובכך לשפר את היכולות הכוללות באמצעות שיתוף פעולה.
איך A2A עובד
גוגל סיפקה סקירה השוואתית של פרוטוקולי MCP ו-A2A:
- MCP (Model Context Protocol): מתמקד בניהול כלים ומשאבים.
- מחבר סוכנים לכלים, ממשקי API ומשאבים באמצעות קלט/פלט מובנה.
- Google ADK תומך בכלי MCP, ומאפשר אינטראקציה חלקה בין שרתי MCP לסוכנים.
- A2A (Agent2Agent Protocol): מקל על שיתוף פעולה בין סוכנים.
- מאפשר תקשורת דינמית ורב-מודאלית בין סוכנים מבלי לדרוש זיכרון משותף, משאבים או כלים.
- זהו תקן פתוח המונע על ידי הקהילה.
- ניתן לחקור דוגמאות באמצעות כלים כמו Google ADK, LangGraph ו-Crew.AI.
A2A ו-MCP משלימים זה את זה. MCP מצייד סוכנים בכלים, בעוד ש-A2A מעצים את הסוכנים המצוידים הללו לשוחח ולשתף פעולה.
הרשימה הראשונית של גוגל של שותפים מצביעה על כך ש-A2A עומד לקבל תשומת לב דומה ל-MCP. היוזמה כבר משכה למעלה מ-50 ארגונים, כולל חברות טכנולוגיה מובילות וספקי אינטגרציה של ייעוץ ומערכות גלובליות.
גוגל מדגישה את הפתיחות של הפרוטוקול, וממקמת אותו כתקן לשיתוף פעולה בין סוכנים שחורג ממסגרות טכנולוגיות בסיסיות או מספקי שירותים. גוגל הדגישה חמישה עקרונות מנחים שעיצבו את עיצוב הפרוטוקול:
- אמצו את יכולות הסוכן: A2A נותן עדיפות לאפשר לסוכנים לשתף פעולה באופן טבעי, גם מבלי לשתף זיכרון, כלים או הקשר. המטרה היא לאפשר תרחישים אמיתיים מרובי סוכנים, לא רק להגביל סוכנים לפעול כ”כלים”.
- בנו על תקנים קיימים: הפרוטוקול ממנף תקנים קיימים ומאומצים באופן נרחב, כולל HTTP, SSE ו-JSON-RPC, מה שמפשט את האינטגרציה עם ערמות IT קיימות.
- מאובטח כברירת מחדל: A2A נועד לתמוך באימות והרשאה ברמה ארגונית, הניתנים להשוואה לסכימות האימות של OpenAPI.
- תמיכה במשימות הפועלות לאורך זמן: הגמישות של A2A מאפשרת לו לתמוך במגוון רחב של תרחישים, ממשימות מהירות ועד למחקר מעמיק שעשוי להימשך שעות או אפילו ימים (במיוחד כאשר נדרשת מעורבות אנושית). לאורך כל התהליך, A2A יכול לספק למשתמשים משוב בזמן אמת, התראות ועדכוני סטטוס.
- אגנוסטיות לאופן פעולה: מתוך הכרה בכך שעולם הסוכנים חורג מטקסט, A2A תומך באופני פעולה שונים, כולל זרמי שמע ווידאו.
גוגל סיפקה דוגמה לאופן שבו A2A מייעל את תהליך הגיוס.
בממשק מאוחד כמו Agentspace, מנהל גיוס יכול להקצות סוכן לזהות מועמדים מתאימים בהתבסס על דרישות התפקיד. סוכן זה יכול לקיים אינטראקציה עם סוכנים מיוחדים כדי למצוא מועמדים. משתמשים יכולים גם להנחות סוכנים לתזמן ראיונות ולערב סוכנים מיוחדים אחרים כדי לסייע בבדיקות רקע, מה שמאפשר גיוס אוטומטי לחלוטין ואינטליגנטי בין מערכות.
אימוץ פרוטוקול הקשר של המודל (MCP)
גוגל מאמצת גם את MCP. זמן קצר לאחר שאופן איי.איי הכריזה על אימוץ פרוטוקול הקשר של אנתרופיק (MCP), גוגל הלכה בעקבותיה.
דמיס חסיביס, מנכ’ל Google DeepMind, הכריז ב-X (לשעבר טוויטר) שגוגל תוסיף תמיכה ב-MCP במודלים וב-SDK של Gemini, אם כי הוא לא סיפק ציר זמן ספציפי.
חסיביס הצהיר כי “MCP הוא פרוטוקול מצוין שהופך במהירות לתקן פתוח לעידן סוכני הבינה המלאכותית. אנו מצפים לעבוד עם צוות MCP ושותפים אחרים בתעשייה כדי לקדם את הטכנולוגיה הזו.”
מאז שחרורו בנובמבר 2024, MCP צבר תאוצה משמעותית כדרך פשוטה ומתוקננת לחבר מודלי שפה עם כלים ונתונים.
MCP מאפשר למודלים של בינה מלאכותית לגשת לנתונים מכלי תוכנה ארגוניים כדי להשלים משימות ולגשת לספריות תוכן וסביבות פיתוח יישומים. הפרוטוקול מאפשר למפתחים ליצור חיבורים דו-כיווניים בין מקורות נתונים ליישומים המופעלים על ידי בינה מלאכותית, כגון צ’אטבוטים.
מפתחים יכולים לחשוף ממשקי נתונים באמצעות שרתי MCP ולבנות לקוחות MCP (כגון יישומים ותהליכי עבודה) כדי להתחבר לשרתים אלה. מכיוון שאנתרופיק הפיצה קוד פתוח של MCP, מספר חברות שילבו תמיכה ב-MCP בפלטפורמות שלהן.
Ironwood: שחר של עידן חדש בבינה מלאכותית
TPU Ironwood של גוגל מייצג קפיצת מדרגה משמעותית קדימה במחשוב בינה מלאכותית. הביצועים חסרי התקדים, הארכיטקטורה המותאמת והתמיכה בפרוטוקולים מתפתחים כמו A2A ו-MCP ממקמים אותו כמאפשר מפתח של הגל הבא של חדשנות בינה מלאכותית. ככל שמודלים של בינה מלאכותית הופכים מורכבים ותובעניים יותר, Ironwood מספק את הכוח הגולמי והגמישות הדרושים כדי לפתוח אפשרויות חדשות ולשנות תעשיות ברחבי העולם. זה לא רק שבב חדש; זהו בסיס לעתיד המופעל על ידי מכונות אינטליגנטיות הפועלות בשיתוף פעולה כדי לפתור בעיות מורכבות ולשפר את חיינו.