פענוח פרוטוקולי A2A ו-MCP בעולם הסוכנים

פענוח פרוטוקולי A2A ו-MCP בעולם הסוכנים

לאחרונה, גוגל חשפה פרוטוקול פתוח חדש לסוכנים בשם Agent2Agent, או בקיצור A2A. במקביל, Bailian של Alibaba Cloud הכריזה גם היא על כניסתה ל-MCP. בואו נעמיק במהותם של A2A ו-MCP.

כדי להבין את הפרוטוקולים הללו, חשבו על האנלוגיה של דיפלומטיה בין מדינות. דמיינו כל סוכן AI כמדינה קטנה עם שפה ומנהגים משלה. “מדינות” אלה מחזיקות שגרירויות בתוך אותו בניין, בניסיון לתקשר, לסחור ולהחליף מידע.

בתרחיש אידיאלי, מדינות אלה יקיימו יחסים ידידותיים ויצייתו למערכת ברורה של כללים דיפלומטיים, שיאפשרו להן לקיים אינטראקציה חלקה, לחתום על הסכמים ולשתף פעולה בפרויקטים בינלאומיים סביב שולחן ועידות.

עם זאת, המציאות היא שכל שגרירות פועלת באופן עצמאי עם פרוטוקולים שונים. כתוצאה מכך, יוזמה של הסכם סחר פשוט עם “מדינה א’” מחייבת מילוי שפע של דרישות, כולל הוראות, אישורים, תרגומים ומפתחות מיוחדים. התקשרות עם “מדינה ב’” ו”מדינה ג’” מחייבת חזרה על הליכים דומים פעמים רבות. גישה אד-הוקית, מפוצלת ורב-גונית זו מנפחת את עלויות התקשורת, כאשר כל אינטראקציה גוררת “מכס מידע” נוסף.

בעבר, סוכני AI נתקלו במצבים דומים כאשר ניסו לשתף פעולה.

לדוגמה, ייתכן שיש לך סוכן שמגיב אוטומטית לאימיילים ואחר המשולב ביישום לוח שנה כדי לסייע בתזמון. עם זאת, ישויות AI אלה מתקשות לתקשר ישירות, מה שמחייב העתקה והדבקה ידנית של מידע או הסתמכות על ממשקים מותאמים אישית.

כתוצאה מכך, סוכני AI פועלים בבידוד, ומציגים יכולת פעולה הדדית לקויה. פיצול זה מתסכל משתמשים שחייבים לנווט בין יישומי AI מרובים ומגביל את הפוטנציאל של AI. משימות מורכבות שיכולות להתבצע באמצעות שיתוף פעולה מרובה סוכנים מוגבלות באופן מלאכותי בתוך סילואים בודדים.

מצב זה משקף את הנוף שלאחר מלחמת העולם השנייה, כאשר כל סוכן AI פועל באופן אוטונומי, ללא כללים מאוחדים ומתמודד עם מחסומי תקשורת. מערכת ה-AI הנוכחית דומה לשממה שלאחר המלחמה, המחייבת הקפדה על ממשקים ופרוטוקולים ספציפיים לצורך גישה לנתונים ופונקציונליות. היעדר תקנים מטיל “מכסים” נוספים עם כל מערכת יחסים שיתופית חדשה, מה שמוביל למערכת אקולוגית של AI מנותקת ולא יעילה המאופיינת בבידוד ואנוכיות.

תעשיית ה-AI בוחנת את האפשרות ליצור פרוטוקול מקובל אוניברסלית כדי להקל על אינטראקציה חלקה בין סוכנים וכלים חיצוניים. גוגל ואנתרופיק צצו כמובילות, כאשר כל אחת מהן מציעה פתרון: פרוטוקול A2A ופרוטוקול MCP.

פרוטוקול A2A

פרוטוקול A2A, קיצור של Agent2Agent, מאפשר לסוכני AI לתקשר ולשתף פעולה ישירות.

המטרה העיקרית של פרוטוקול A2A היא לאפשר לסוכנים ממקורות ויצרנים מגוונים להבין ולשתף פעולה זה עם זה, בדומה למאמצי ארגון הסחר העולמי להפחית את חסמי הסחר.

על ידי אימוץ A2A, סוכנים מספקים ומסגרות שונות יכולים להצטרף לאזור סחר חופשי, לתקשר באמצעות שפה משותפת ולשתף פעולה בצורה חלקה כדי להשיג משימות מורכבות מעבר ליכולות של סוכנים בודדים.

כדי להמחיש כיצד A2A פועל, שקול את האנלוגיות הבאות:

1. סוכן = דיפלומט לאומי

כל סוכן מתפקד כדיפלומט המייצג את שגרירות המדינה. פרוטוקול A2A נועד ליצור כללי נימוס דיפלומטיים אחידים ונהלי תקשורת. בעבר, דיפלומטים מ”מדינה א’” תקשרו אך ורק בצרפתית, ואילו אלה מ”מדינה ב’” השתמשו בכתב קירילי, ו”מדינה ג’” דרשה התכתבות באמצעות מכתבי עלה זהב עתיקים. פרוטוקול A2A מבטיח שכל המשתתפים יוכלו לתקשר בשפה מוסכמת מראש, להגיש מסמכים באותו פורמט ולבצע תוצאות מוסכמות.

2. כרטיס סוכן = תעודות דיפלומטיות / כרטיס ביקור של שגריר

בתוך מסגרת ה-A2A, כל סוכן נדרש לפרסם “כרטיס סוכן”, הדומה לכרטיס הביקור של דיפלומט, המכיל פרטים כגון שם הסוכן, גרסה, יכולות ושפות או פורמטים נתמכים.

בדומה לאופן שבו כרטיס הביקור של דיפלומט מזהה את תפקידו והשתייכותו, כרטיס הסוכן מפרט את כישורי הסוכן, שיטות אימות ופורמטי קלט/פלט. זה מאפשר לדיפלומטים אחרים לזהות ולהבין במהירות יכולות, תוך מזעור חסמי תקשורת.

3. משימה = פרויקט דיפלומטי דו-צדדי או רב-צדדי

מושג המשימה הוא מרכזי ב-A2A. כאשר סוכן מתכוון להעביר משימה לסוכן אחר, הוא מנפיק “מכתב כוונות לפרויקט שיתוף פעולה”. עם קבלה, שני הצדדים רושמים מזהה משימה כדי לעקוב אחר התקדמות ולהחליף מידע עד להשלמתה.

במונחים דיפלומטיים, מדינה עשויה להציע למדינה אחרת, “ברצוננו לשתף פעולה בבניית קו רכבת מהיר חוצה גבולות; אנא שלחו את צוות ההנדסה שלכם.” זה משקף משימת A2A, כאשר הצד היוזם מתאר דרישות, הסוכן המרוחק מקבל ושני הצדדים מעדכנים באופן קבוע את ההתקדמות לאורך הפרויקט.

הודעות מייצגות תקשורת שהוחלפה במהלך השלבים הראשוניים או הבינוניים של הפרויקט, בדומה לכבלים דיפלומטיים, תזכירים והחלפות שליחים.

4. הודעות Push = עלוני שגרירות דיפלומטיות

ב-A2A, אם משימה היא פרויקט ארוך טווח הדורש זמן השלמה ממושך, הסוכן המרוחק יכול לעדכן את הצד היוזם באמצעות הודעות push, בדומה למדינה המספקת עדכונים תקופתיים על פרויקט תשתית ארוך טווח. זה משפר את יכולות שיתוף הפעולה האסינכרוני.

5. אימות ואבטחה = הרשאות ופרוטוקולים דיפלומטיים

A2A מעסיקה אסטרטגיות אימות ברמה ארגונית, המחייבות את שני הצדדים המתקשרים לאמת אישורים כדי למנוע התחזות או האזנת סתר זדונית. מנגנון זה מקביל להרשאות ופרוטוקולים דיפלומטיים.

במהותו, A2A משקף את הדינמיקה של דיפלומטיה בינלאומית או שיתוף פעולה עסקי, תוך הדגשת תקשורת ואבטחה סטנדרטיות.

פרוטוקול MCP

פרוטוקול MCP, או Model Context Protocol, הוא תקן שהוצג ופותח בקוד פתוח על ידי Anthropic בנובמבר 2024.

בעוד ש-A2A מטפל בתהליך התקשורת בין דיפלומטי AI, אתגר מתמשך נותר: היעדר מקורות מידע אמינים. גם הדיפלומט או מנהל העסקים הרהוט ביותר אינם מצוידים היטב לפעול ביעילות ללא מידע מדויק על הנוף הבינלאומי והקצאת המשאבים.

דיפלומטים מודרניים מסתמכים על כלים חיצוניים, כגון מערכות ויזה, מערכות סליקה בינלאומיות ומאגרי מודיעין, כדי לבצע את תפקידם. באופן דומה, סוכן הנוטל על עצמו אחריות מורכבת חייב להתחבר למאגרי מידע שונים, מערכות תיעוד, יישומים ארגוניים ואפילו התקני חומרה.

ניתן לדמות זאת להקמת סוכנות מודיעין מקיפה עבור דיפלומטים והענקת להם גישה לכלים כדי להקל על עבודתם.

בעבר, סוכנים נאלצו לפתח תוספים מותאמים אישית ולהשתלב לעומק עם כלים שונים, מה שהיה גם עמלני וגם גוזל זמן. עם זאת, MCP זמין כעת לייעל את התהליך.

MCP מתקנן אינטראקציות בין מודלים גדולים של שפה ומקורות נתונים וכלים חיצוניים. Anthropic משווה את MCP ליציאת USB-C עבור יישומי AI.

USB-C משמש כממשק אוניברסלי עבור מכשירים, המטפל בטעינה והעברת נתונים דרך יציאה אחת. MCP נועד ליצור ממשק אוניברסלי בתחום ה-AI, המאפשר למודלים שונים ומערכות חיצוניות להתחבר באמצעות אותו פרוטוקול, במקום לפתח פתרונות אינטגרציה מותאמים אישית בכל פעם.

מודלי AI המתחברים למסדי נתונים, מנועי חיפוש או יישומי צד שלישי יכולים לתקשר בצורה חלקה אם כולם תומכים ב-MCP.

MCP משתמש בארכיטקטורת לקוח-שרת:

1. שרת MCP = סוכנות מודיעין מאוחדת

ארגונים או יחידים יכולים לאגד מסדי נתונים, מערכות קבצים, לוחות שנה ושירותי צד שלישי לשרתי MCP. שרתים אלה מצייתים לפרוטוקול MCP, וחושפים נקודות קצה גישה בפורמט אחיד, ומאפשרים לכל סוכן התואם לתקני לקוח MCP לשלוח בקשות, לאחזר מידע או לבצע פעולות.

2. לקוח MCP = ציוד קצה המשמש דיפלומטים

דיפלומט סוכן נושא ציוד קצה ייעודי, המאפשר להם להזין פקודות, כגון “אחזר נתוני מלאי מהמערכת הפיננסית”, “שלח בקשה לממשק API” או “אחזר מסמך PDF”.

ללא MCP, שילוב עם מערכות שונות מחייב כתיבת קודי גישה שונים, וזה מסורבל. עם זאת, עם MCP, לקוחות התומכים בפרוטוקול יכולים לעבור בקלות בין שרתי MCP שונים, לאחזר מידע ולבצע תהליכים עסקיים.

במהותו, MCP מאפשר אינטגרציה חלקה בין סוכני AI ומשאבים חיצוניים.

ההבחנה בין A2A ל-MCP

כדי להבהיר את ההבחנה בין A2A ל-MCP, שקול פסגה בינלאומית היפותטית שבה ראשי מדינות (המייצגים את סוכני ה-AI של החברות) מתכנסים כדי לשתף פעולה במשימה לאומית, כגון הפקת דוח ניתוח כלכלי גלובלי.

ללא פרוטוקול אוניברסלי, פגישה כזו תהיה כמעט בלתי אפשרית, מכיוון שכל נציג מדבר שפה אחרת. עם זאת, עם פרוטוקול A2A, כל הנציגים חותמים על “אמנת וינה הדיפלומטית A2A” לפני הכניסה לפגישה, ומסכימים לתקשר בפורמט אחיד, לזהות את עצמם, לציין את כוונותיהם ולצטט מזהי נאומים קודמים בעת תגובה.

זה מאפשר ל”סוכן G” לשלוח הודעה ל”סוכן O” בפורמט A2A, ו”סוכן O” מגיב בהתאם. זה מסמן את המקרה הראשון של תקשורת ללא הפרעה בין סוכני AI מחברות שונות.

במהלך הדיונים, נציגי ה-AI צריכים להתייעץ עם נתונים או להשתמש בכלים לצורך ניתוח. “סוכן A” מאנתרופיק מציע להשתמש במערכת MCP לתמיכה בנתונים או בכלי חיצוני.

“חדר תרגום סימולטני של MCP” מוקם לצד אולם הוועידות, מאויש על ידי מומחים שיכולים להגיב בשפה אחידה באמצעות MCP עם קבלת בקשות.

לדוגמה, “סוכן Q” צריך לגשת למסד הנתונים בענן שלו לצורך חישובים. במקום לשלוח מישהו בחזרה למדינה, הם שולחים בקשת MCP לנתונים ממסד נתונים X. מנהל מסד הנתונים של MCP מתרגם את הבקשה, מאחזר את התוצאות ומגיב ל”סוכן Q” בשפת MCP. התהליך כולו שקוף לסוכנים האחרים, שמבינים את הנתונים שצוטטו על ידי “סוכן Q” מכיוון שתירגום ה-MCP הוא בפורמט מוכר.

ככל שכתיבת הדוח מתקדמת, “סוכן G” ו”סוכן A” מבינים שהם צריכים לשלב את תרומותיהם בהתאמה. “סוכן G” מתמחה בניתוח מספרי, ואילו “סוכן A” מצטיין בסיכום שפה.

“סוכן G” מעביר את נתוני שיעור צמיחת התמ”ג באמצעות A2A, ו”סוכן A” מתחבר לתוסף גליון אלקטרוני של Excel באמצעות MCP, מאמת את מגמות הנתונים ומגיב עם פסקה מסכמת.

בתרחיש זה, A2A מאפשר תקשורת בין סוכנים, ואילו MCP מאפשר לסוכנים לגשת לכלים ומידע חיצוניים. יחד, הפרוטוקולים יוצרים הסכם תקשורת מותאם אישית לגרסת AI של האומות המאוחדות. עם פרוטוקולים אלה במקום, סוכני AI יכולים לשתף פעולה ביעילות, וליצור מערכת אקולוגית מקושרת של AI.

A2A דומה לקו חם ייעודי לתקשורת דיפלומטית, המטפל בתקשורת ישירה בין סוכנים. MCP דומה למערכת תרגום סימולטני ושיתוף משאבים, המטפלת בסוגיה של ישויות אינטליגנטיות המתחברות למידע חיצוני.

עלייתם של A2A ו-MCP מבשרת על התפתחות תעשיית ה-AI לכיוון שיתוף פעולה ולא תחרות. סוכני AI רבים ייפרסו כמו אתרי אינטרנט, ויגלו ויתקשרו באמצעות A2A ויגשו למשאבים וישתפו ידע באמצעות MCP.