解碼代理世界中的 A2A 與 MCP 協議

最近,Google 公布了一項名為 Agent2Agent 的全新代理開放協議,簡稱 A2A。 與此同時,阿里巴巴雲的百煉也宣布進軍 MCP。 讓我們深入探討 A2A 和 MCP 的全部內容。

要理解這些協議,可以將其比作國家之間的外交。 想像一下,每個 AI 代理都是一個小國家,擁有自己的語言和習俗。 這些’國家’在同一棟大樓內設有大使館,試圖溝通、貿易和交換資訊。

在理想的情況下,這些國家將保持友好的關係,並遵守一套明確的外交規則,使他們能夠在會議桌旁無縫互動、簽署協議並協作國際項目。

然而,現實情況是,每個大使館都以不同的協議獨立運作。 因此,與’A 國’簽署一項簡單的貿易協定需要滿足大量的要求,包括條款、認證、翻譯和專用金鑰。 與’B 國’和’C 國’打交道需要多次重複類似的程序。 這種特別、零散和多面向的方法會增加溝通成本,每次互動都會產生額外的’資訊關稅’。

過去,AI 代理在嘗試協作時也遇到了類似的困境。

例如,您可能有一個自動回覆電子郵件的代理,另一個整合到日曆應用程式中以協助排程。 然而,這些 AI 實體很難直接溝通,因此需要手動複製和貼上資訊,或依賴自訂建置的介面。

因此,AI 代理在隔離狀態下運作,互通性差。 這種碎片化讓必須在多個 AI 應用程式之間導航的用戶感到沮喪,並限制了 AI 的潛力。 本來可以透過多代理協作完成的複雜任務被人為地限制在單獨的孤島中。

這種情況反映了二戰後的格局,每個 AI 代理都自主行動,缺乏統一的規則並面臨溝通障礙。 當前的 AI 生態系統類似於戰後荒地,需要遵守特定的介面和協議才能存取數據和功能。 缺乏標準會導致每次新的協作關係都增加額外的’關稅’,從而導致 AI 生態系統的脫節和效率低下,其特徵是孤立和自私自利。

AI 行業正在探索建立普遍接受的協議的可能性,以促進代理和外部工具之間的無縫互動。 Google 和 Anthropic 已成為領先者,各自提出了一種解決方案:A2A 協議和 MCP 協議。

A2A 協議

A2A 協議是 Agent2Agent 的縮寫,使 AI 代理能夠直接溝通和協作。

A2A 協議的主要目標是使來自不同來源和供應商的代理能夠相互理解和合作,類似於世界貿易組織為減少貿易壁壘所做的努力。

透過採用 A2A,來自不同供應商和框架的代理可以加入自由貿易區,使用通用語言進行溝通,並無縫協作以完成超出單個代理能力的複雜任務。

為了說明 A2A 的運作方式,請考慮以下類比:

1. 代理 = 國家外交官

每個代理都充當代表一個國家大使館的外交官。 A2A 協議旨在建立統一的外交禮儀和溝通程序。 以前,來自’A 國’的外交官只用法語溝通,而來自’B 國’的外交官使用西里爾字母,而’C 國’要求透過古代金箔信件進行通信。 A2A 協議確保所有參與者都可以使用預先商定的語言進行溝通,以相同的格式提交文件,並執行商定的結果。

2. 代理卡 = 外交證件/大使名片

在 A2A 框架內,每個代理都需要發布’代理卡’,類似於外交官的名片,其中包含代理的名稱、版本、功能和支援的語言或格式等詳細資訊。

就像外交官的名片標識其角色和隸屬關係一樣,代理卡列出了代理的技能、驗證方法和輸入/輸出格式。 這使其他外交官能夠快速識別和理解功能,從而最大限度地減少溝通障礙。

3. 任務 = 雙邊或多邊外交項目

任務概念是 A2A 的核心。 當代理打算將任務委託給另一個代理時,它會發布’合作項目意向書’。 接受後,雙方都會記錄一個任務 ID,以追蹤進度並交換資訊,直到完成。

用外交術語來說,一個國家可能會向另一個國家提議,’我們希望合作建設一條跨境高速鐵路;請派遣您的工程團隊。’ 這反映了一個 A2A 任務,發起方概述了要求,遠端代理接受了這些要求,並且雙方都會定期更新整個專案的進度。

訊息代表專案初始或中間階段交換的溝通,類似於外交電報、照會和特使交換。

4. 推播通知 = 外交使館公報

在 A2A 中,如果任務是需要延長完成時間的長期專案,則遠端代理可以透過推播通知更新發起方,類似於一個國家提供關於長期基礎設施專案的定期更新。 這增強了非同步協作能力。

5. 身份驗證和安全性 = 外交特權和協定

A2A 採用企業級身份驗證策略,要求雙方進行溝通以驗證憑證,以防止冒充或惡意竊聽。 這種機制類似於外交特權和協議。

本質上,A2A 反映了國際外交或商業協作的動態,強調標準化的溝通和安全性。

MCP 協議

MCP 協議,或模型上下文協議,是由 Anthropic 於 2024 年 11 月引入並開源的標準。

雖然 A2A 解決了 AI 外交官之間的溝通流程,但仍然存在一個持續的挑戰:缺乏可靠的資訊來源。 即使是最雄辯的外交官或業務主管,如果沒有關於國際形勢和資源分配的準確資訊,也無法有效地運作。

現代外交官依賴外部工具,例如簽證系統、國際結算系統和情報資料庫來履行其職責。 同樣,承擔複雜責任的代理必須連接到各種資料庫、文檔系統、企業應用程式,甚至硬體設備。

這可以比作為外交官建立一個全面的情報機構,並授予他們存取工具以促進其工作。

以前,代理必須開發自訂外掛程式並與不同的工具進行深度整合,這既費力又耗時。 但是,現在可以使用 MCP 來簡化該過程。

MCP 標準化了大型語言模型與外部數據源和工具之間的互動。 Anthropic 將 MCP 比作 AI 應用程式的 USB-C 端口。

USB-C 作為設備的通用介面,透過單個端口處理充電和數據傳輸。 MCP 旨在在 AI 領域創建一個通用介面,使各種模型和外部系統能夠使用相同的協議進行連接,而不是每次都開發自訂整合解決方案。

如果所有 AI 模型都支援 MCP,則連接到資料庫、搜尋引擎或第三方應用程式的 AI 模型可以無縫溝通。

MCP 採用客戶端-伺服器架構:

1. MCP 伺服器 = 整合情報機構

組織或個人可以將資料庫、檔案系統、日曆和第三方服務封裝到 MCP 伺服器中。 這些伺服器遵循 MCP 協議,公開統一格式的存取端點,使任何符合 MCP 客戶端標準的代理都可以發送請求、檢索資訊或執行操作。

2. MCP 客戶端 = 外交官使用的終端設備

代理外交官攜帶專用的終端設備,使他們能夠輸入命令,例如’從財務系統檢索庫存數據’、’將請求提交到 API’或’檢索 PDF 文檔’。

如果沒有 MCP,與各種系統整合需要編寫不同的存取代碼,這很麻煩。 但是,透過 MCP,支援該協議的客戶端可以輕鬆地在不同的 MCP 伺服器之間切換,檢索資訊和執行業務流程。

本質上,MCP 促進了 AI 代理與外部資源之間的無縫整合。

A2A 和 MCP 之間的區別

為了闡明 A2A 和 MCP 之間的區別,請考慮一個假設的國際峰會,國家元首(代表公司的 AI 代理)齊聚一堂,協作完成一項跨國任務,例如製作一份全球經濟分析報告。

如果沒有通用協議,這樣的會議幾乎是不可能的,因為每個代表說不同的語言。 但是,透過 A2A 協議,所有代表在進入會議之前都簽署了’A2A 維也納外交公約’,同意使用統一的格式進行溝通、表明自己的身份、說明自己的意圖,並在回覆時引用先前的發言 ID。

這使’代理 G’可以以 A2A 格式向’代理 O’發送訊息,而’代理 O’也會相應地回覆。 這標誌著來自不同公司的 AI 代理之間第一次實現暢通無阻的溝通。

在討論期間,AI 代表需要查閱數據或使用工具進行分析。 來自 Anthropic 的’代理 A’建議使用 MCP 系統來獲得外部數據或工具支援。

在會議廳旁邊設立了一個’MCP 同時口譯室’,由專家組成,他們可以在收到請求後透過 MCP 以統一的語言做出回應。

例如,’代理 Q’需要存取其雲端資料庫進行計算。 他們沒有派人回國,而是發送了一個 MCP 請求,要求從資料庫 X 中獲取數據。MCP 資料庫管理員翻譯了該請求,檢索了結果,並以 MCP 語言回覆了’代理 Q’。 整個過程對其他代理來說都是透明的,他們理解’代理 Q’引用的數據,因為 MCP 翻譯採用公認的格式。

隨著報告寫作的進行,’代理 G’和’代理 A’意識到他們需要整合各自的貢獻。 ‘代理 G’擅長數值分析,而’代理 A’擅長語言總結。

‘代理 G’透過 A2A 傳達 GDP 增長率數據,而’代理 A’透過 MCP 連接到 Excel 試算表外掛程式,驗證數據趨勢,並回覆摘要段落。

在這種情況下,A2A 促進了代理之間的溝通,而 MCP 使代理能夠存取外部工具和資訊。 這些協議共同為 AI 版本的聯合國創建了量身客製的溝通協議。 有了這些協議,AI 代理可以有效地協作,形成一個相互連接的 AI 生態系統。

A2A 類似於用於外交溝通的專用熱線,用於解決直接代理溝通問題。 MCP 類似於同步口譯和資源共享系統,用於解決智慧實體與外部資訊連接的問題。

A2A 和 MCP 的興起預示著 AI 行業正在朝著協作而不是競爭的方向發展。 無數的 AI 代理將像網站一樣被部署,透過 A2A 發現和溝通,並透過 MCP 存取資源和共享知識。