עידן הסוכנים: MCP ו-A2A מנווטים עתיד

עלייתם של סוכנים (Agent)

בשנים האחרונות, תחום הסוכנים (Agent) זוכה לתשומת לב חסרת תקדים, בעקבות השקת שרת ה-GitHub MCP על ידי מיקרוסופט, פרסום פרוטוקול תקשורת בין סוכנים חכמים A2A על ידי גוגל, והשקת שרת ה-MCP על ידי Alipay. למרות שאין עדיין הסכמה מלאה לגבי הגדרת המונח “סוכן”, שלושת המרכיבים המרכזיים שהוצגו על ידי ליליאן ונג, חוקרת לשעבר ב-OpenAI – “תכנון”, “זיכרון” ו”שימוש בכלים” – זוכים להכרה רחבה ומהווים מרכיבי מפתח להבנת סוכנים.

בתחום הבינה המלאכותית, הרעיון של סוכן אינו חדש, אך עם ההתפתחות המהירה של מודלי שפה גדולים (LLM), היישומים הפוטנציאליים של סוכנים חווים פריצות דרך חדשות. ניתן לראות בסוכן מערכת חכמה המסוגלת לחוש את הסביבה, לתכנן באופן אוטונומי ולבצע משימות. המהות שלו טמונה ביכולת לדמות תהליכי קבלת החלטות אנושיים ולנצל כלים ומשאבים שונים להשגת יעדים מוגדרים.

מצב התפתחות הסוכנים: פוטנציאל עצום, חדירה נמוכה

כגרסה מתקדמת יותר של צ’אטבוטים, רוב יישומי הסוכנים הנוכחיים משולבים בשירותים בתשלום של מודלים גדולים, ורק מעטים, כמו Manus ו-Devin, מספקים שירותים עצמאיים בתשלום. עם זאת, לסוכנים כמו Deep Research ו-Manus, אשר ניחנים ביכולות תכנון אוטונומיות, יש עדיין מגבלות רבות בשימוש, ומספר המשתמשים שיכולים לחוות אותם באמת עשוי להיות קטן יחסית. עדיין יש מקום רב לשיפור עד להופעת יישומי “להיט”.

עם זאת, עם השיפור המתמיד ביכולות ההסקה של מודלים גדולים, סוכנים הופכים בהדרגה למוקד של חדשנות יישומית. יותר ויותר מפתחים וחוקרים מתחילים לחקור את היישומים של סוכנים בתחומים שונים, כגון עוזרים חכמים, תהליכים אוטומטיים, ניתוח נתונים ועוד. הפוטנציאל של הסוכנים מתגלה בהדרגה, ומרחב הפיתוח העתידי שלהם עצום.

יישום בקנה מידה גדול של סוכנים ממשמש ובא: מונע על ידי תנאים נוחים מרובים

פריצות דרך בצד אימון המודלים

  • גידול מהיר בחלון ההקשר: חלון ההקשר (Context Window) של מודל גדול מתייחס לאורך הטקסט המרבי שהמודל יכול לקחת בחשבון בעת עיבוד טקסט. עם התקדמות הטכנולוגיה, חלון ההקשר של המודלים גדל במהירות, מה שאומר שהמודל יכול להבין טוב יותר את ההקשר של טקסטים ארוכים, ובכך לקבל החלטות מדויקות יותר.
  • יישום מעמיק של למידת חיזוק: למידת חיזוק היא שיטה לאימון סוכנים באמצעות תגמולים ועונשים. בשנים האחרונות, למידת חיזוק נמצאת בשימוש נרחב באימון סוכנים, מה שמאפשר לסוכנים להסתגל טוב יותר לסביבות מורכבות וללמוד אסטרטגיות אופטימליות.
  • מודלים הסקה הופכים לבשלים יותר: מודל הסקה הוא המרכיב המרכזי של סוכן, האחראי על הסקה ושיפוט על סמך המידע המוזן. עם התעמקות המחקר, מודלים הסקה הופכים לבשלים יותר ויותר, ומסוגלים לתמוך טוב יותר ביישומים השונים של סוכנים.

פריחה של מערכת אקולוגית

  • התפתחות מהירה של פרוטוקולי MCP ו-A2A: MCP (Model Communication Protocol) ו-A2A (Agent-to-Agent) הם שני פרוטוקולי תקשורת חשובים לסוכנים. ההתפתחות המהירה של פרוטוקולים אלה מאפשרת לסוכנים לקרוא בצורה נוחה יותר לכלים ושירותים שונים, ובכך לממש פונקציות מורכבות יותר.
  • קריאה לכלי סוכנים הופכת לנוחה יותר: עם התקדמות הטכנולוגיה, הדרך בה סוכנים קוראים לכלים ושירותים חיצוניים הופכת לנוחה יותר ויותר. לדוגמה, באמצעות API (ממשק תכנות יישומים), סוכנים יכולים לגשת בקלות למקורות נתונים ושירותים מקוונים שונים, ובכך להרחיב את היכולות שלהם.

בנובמבר 2024, Anthropic פרסמה ופתחה את פרוטוקול ה-MCP, שמטרתו לתקנן כיצד נתונים וכלי חוץ מספקים הקשר למודלים. צעד זה יקדם מאוד את הפיתוח של מערכת אקולוגית של סוכנים, ויאפשר לסוכנים לנצל טוב יותר משאבים חיצוניים.

MCP ו-A2A: המפתח לחיבור בין סוכנים

פרוטוקול MCP: חיבור בין סוכנים לעולם החיצוני

המטרה העיקרית של פרוטוקול MCP היא לממש “חיבור בלחיצה אחת” בין סוכנים לנתונים וכלי חוץ. באמצעות פרוטוקול MCP, סוכנים יכולים לגשת בנוחות למשאבים חיצוניים שונים, כגון מסדי נתונים, API, שירותי אינטרנט וכו’. זה מאפשר לסוכנים להבין טוב יותר את הסביבה ולקבל החלטות מושכלות יותר.

פרוטוקול A2A: בניית גשר תקשורת בין סוכנים

מטרת פרוטוקול A2A היא לממש תקשורת בין סוכנים. באמצעות פרוטוקול A2A, סוכנים יכולים לשתף פעולה זה עם זה כדי להשלים משימות מורכבות. זה חשוב לבניית מערכות חכמות מבוזרות.

למרות שמטרת פרוטוקול A2A היא תקשורת בין סוכנים, ו-MCP מיועד לסוכנים עם כלים ונתונים חיצוניים, במצב המורכב שבו “ניתן לארוז כלים כסוכנים”, ייתכן שיש חפיפה בתפקוד בין השניים, אך תחרות זו מסייעת להפחית את העלויות של מודלים גדולים הקוראים לכלים חיצוניים ומתקשרים. תחרות זו תקדם את התקדמות הטכנולוגיה ובסופו של דבר תועיל לכל מערכת אקולוגית הסוכנים.

תחזית להתפתחות סוכנים

סוכן מקצה לקצה: ללא התערבות אנושית

כיום, קיימים בשוק מספר רב של “סוכנים”, אך חלק ניכר מהם מפותחים על בסיס פלטפורמות כמו Coze ו-Dify, ודורשים מבני אדם לכתוב מראש זרימות עבודה. סוכנים אלה דומים יותר לתוספת של הנדסת הנחיות והם סוכנים ראשוניים יחסית.

סוכן מתקדם יותר הוא “מקצה לקצה”, מה שאומר “להזין משימה לסוכן, והסוכן משלים אוטומטית את תוצאות המשימה הנדרשות לבני אדם”. לדוגמה, משתמש צריך רק להזין מטרה לסוכן, והסוכן יכול לתכנן ולבצע את המשימה באופן אוטונומי, ובסופו של דבר להשלים את המטרה. סוכנים מתקדמים כמו L3/L4/L5 תואמים יותר לצרכים האנושיים ויהפכו לכיוון חשוב בהתפתחות הסוכנים בעתיד.

סוכנים מסייעים לרובוטים ולנהיגה אוטונומית

כאשר מחילים את ההגדרה של סוכן על בינה מגולמת, מגלים שגם רובוטים וכלי רכב הנשלטים על ידי מודלים גדולים הם סוכנים. במיוחד רובוטים, צוואר הבקבוק הנוכחי בפיתוח הרובוטים אינו טמון ב”איך לבצע פעולות פיזיות”, אלא ב”איזה פעולות פיזיות לבצע”.

בתחום הרובוטיקה, סוכנים יכולים לעזור לרובוטים להבין טוב יותר את הסביבה ולקבל החלטות הגיוניות יותר. לדוגמה, סוכן יכול לתכנן באופן אוטונומי את נתיב התנועה של הרובוט ולבצע משימות שונות בהתאם לחפצים ואנשים בסביבה.

בתחום הנהיגה האוטונומית, סוכנים יכולים לעזור לכלי רכב לחוש טוב יותר את הסביבה שמסביב ולקבל החלטות נהיגה בטוחות יותר. לדוגמה, סוכן יכול להתאים באופן אוטונומי את מהירות וכיוון הרכב בהתאם לרמזורים, כלי רכב אחרים והולכי רגל, ובכך להימנע מתאונות דרכים.

חיבור בין סוכנים ורשת מקורית של AI

בעתיד, ייתכן שכל הסוכנים יוכלו לתקשר זה עם זה, לארגן את עצמם, לנהל משא ומתן באופן אוטונומי, ולבנות רשת שיתוף פעולה בעלות נמוכה יותר וביעילות גבוהה יותר מהאינטרנט הקיים. קהילת המפתחים הסינית בונה גם פרוטוקולים כגון ANP, שמטרתם להפוך לפרוטוקול HTTP של עידן האינטרנט של הסוכנים. באשר לאימות זהות בין סוכנים, ניתן להשתמש בטכנולוגיות כגון DID.

  • חיבור בין סוכנים: החיבור בין סוכנים יכול לממש שיתוף משאבים ושיתוף פעולה, ובכך לשפר את היעילות של המערכת כולה. לדוגמה, סוכנים שונים יכולים לשתף נתונים, כלים ושירותים, ובכך להשלים יחד משימות מורכבות.
  • רשת מקורית של AI: רשת מקורית של AI היא רשת שתוכננה במיוחד עבור יישומי בינה מלאכותית. רשת זו יכולה לספק רוחב פס גבוה יותר, השהיה נמוכה יותר ואבטחה חזקה יותר, ובכך לתמוך טוב יותר ביישומים השונים של סוכנים.
  • טכנולוגיית DID: DID (מזהה מבוזר) היא טכנולוגיית אימות זהות מבוזרת. באמצעות טכנולוגיית DID, סוכנים יכולים לקבל זהות משלהם, ובכך לממש תקשורת בטוחה ואמינה יותר.

התפתחות טכנולוגיית הסוכנים תביא לשינוי עצום, והאינטרנט העתידי לא יהיה עוד רשת פשוטה להעברת מידע, אלא רשת שיתוף פעולה מלאה באינטליגנציה.