Google Agent2Agent 協定：AI 代理互通性深入探討 | zh-TW

人工智慧領域正快速發展，AI 代理正崛起成為關鍵組成部分。AI 代理本質上結合了大型語言模型 (LLM) 的認知能力與工具組，使其能夠自主執行指令、檢索資訊並完成任務。這些代理會回應使用者的請求或與其他代理互動。AI 代理的潛力在於它們能夠擴展營運規模、自動化複雜流程，並提高各項業務功能的效率，從而顯著提高個人生產力。

普遍認為，通用的「一刀切」代理無法有效地處理人們對 AI 代理期望的各種複雜任務。解決方案在於代理工作流程 (Agentic Workflows)。這些工作流程由自主 AI 代理網路創建，它們可以做出決策、執行行動並協調任務，而只需最少的人工監督。

Google 對代理互通性的願景：Agent2Agent 協定 (A2A)

Google 於 2025 年 4 月 9 日推出了 Agent2Agent (A2A) 協定。它旨在促進 AI 代理之間的無縫通訊，使它們能夠安全地交換資料並自動化複雜的業務工作流程。這是透過與企業系統和第三方平台互動來實現的。

A2A 協定是 Google 與 50 多家產業合作夥伴合作的成果，所有合作夥伴都對 AI 代理協作的未來抱持共同願景。至關重要的是，這種協作超越了特定技術，並且建立在開放和安全的標準之上。

A2A 的核心設計原則

在開發 A2A 協定期間，Google 及其合作夥伴遵循了以下幾個基本原則：

開放且與供應商無關： A2A 協定必須是開放的，這意味著其規格可公開存取。這確保了任何開發人員或組織都可以實作該協定，而沒有專有限制。與供應商無關意味著該協定不與任何特定供應商的技術相關聯。這為所有參與者創造了公平的競爭環境。
自然的協作模式： A2A 允許代理使用其固有的、非結構化的通訊方法進行協作。這將代理與工具區分開來，並將 A2A 與模型上下文協定 (MCP) 區分開來。
建立在現有標準之上： 為了簡化與現有 IT 基礎架構的整合，該協定建立在已建立的標準之上，例如 HTTP、伺服器發送事件 (SSE) 和 JSON-RPC。
預設安全： 安全性是最重要的考量。A2A 納入了企業級身份驗證和授權機制，以保護敏感資料並確保安全的互動。
資料模式無關： A2A 不僅限於基於文字的通訊。它可以處理各種資料類型，包括圖像、音訊和視訊串流。

A2A 的功能：強化代理協作

A2A 提供了一系列內建功能，以簡化代理互動：

能力探索： 這允許代理宣傳其能力。客戶可以輕鬆識別哪個代理最適合特定任務。可以將其視為一個數位市場，代理在其中展示其技能和專業知識。
任務和狀態管理： 客戶端和代理之間的通訊圍繞著任務的執行。這些任務由協定定義，並具有明確定義的生命週期。任務的結果稱為 工件 (Artifact)。任務及其狀態的管理確保了可靠且可追蹤的工作流程。
安全協作： 代理可以安全地交換訊息，以共享上下文、提供回應、交付工件或轉達使用者指示。這有助於建立協作環境，讓代理可以無縫地協同工作。
使用者體驗協商： 每個訊息都包含「部分 (parts)」，這些部分是獨立的內容片段，例如產生的圖像。每個部分都有指定內容類型，這使客戶端和遠端代理都能夠就所需的格式達成一致。此功能還包括使用者 UI 功能的協商，例如 iframe、視訊和 Web 表單。

能力探索和使用者體驗協商功能特別引人注目，因為它們為建立代理市場鋪平了道路。在這些市場中，供應商可以列出他們的代理，而客戶可以選擇最適合執行特定任務的代理。

雖然這個概念非常有前景並且對於 AI 代理市場的成長可能至關重要，但要實現這個願景，僅僅定義一個互動協定是不夠的。

解碼 Agent2Agent 協定概念

理解協定的核心概念對於有效的實作和利用至關重要。這些概念對於許多 AI 代理的開發人員來說已經很熟悉：

代理卡 (Agent Card)： 這是一個公開的元資料檔案，詳細說明了代理的功能、技能、端點 URL 和身份驗證要求。代理卡在探索階段扮演著關鍵角色，使使用者能夠選擇合適的代理並了解如何與其互動。
伺服器 (Server)： 一個實作 A2A 協定方法的代理，如 JSON 規範中所定義。本質上，伺服器是透過 A2A 協定提供其服務的代理。
客戶端 (Client)： 這可以是應用程式或另一個使用 A2A 服務的代理。客戶端啟動請求並利用伺服器提供的功能。
任務 (Task)： 代理的基本工作單元。由客戶端啟動並由伺服器執行，它會在整個生命週期中經歷各種狀態。
訊息 (Message)： 表示客戶端和代理之間的通訊交換。每個訊息都有一個定義的 角色 (role)，並且由 部分 (Parts) 組成。
部分 (Part)： 這是訊息或工件中的基本內容單元。部分可以是文字、檔案或結構化資料。這允許靈活地傳輸各種資料類型。
工件 (Artifact)： 表示代理在完成任務時產生的輸出。與訊息一樣，工件包含部分。
串流 (Streaming)： 該協定支援串流，允許伺服器即時更新客戶端長時間執行的任務的狀態。這透過提供持續的回饋來增強使用者體驗。

Agent2Agent 專案的現況

A2A 最近才向公眾推出，其規範現在可在 GitHub 上取得。截至目前，尚無官方的路線圖或生產就緒的協定實作。但是，Google 正在與合作夥伴積極合作，以在 2025 年稍晚推出生產就緒的版本。

A2A GitHub 儲存庫提供了幾個 TypeScript 和 Python 的程式碼範例，以及一個完整的示範應用程式。此應用程式展示了使用不同代理開發套件 (ADK) 開發的代理之間的互動。

雖然這為實驗提供了基礎，但 A2A 必須整合到現有的框架和工具生態系統中，這些框架和工具用於部署代理工作流程，然後才能將其應用於關鍵任務應用程式。

與 Google 合作制定協定定義的大量主要參與者的支持（值得注意的是，沒有提供基礎模型的公司）強烈表明必要的工具將很快可用，並且 A2A 將整合到領先的代理框架中。

A2A 與模型上下文協定 (MCP)：理解區別

由 Anthropic 開發的模型上下文協定 (MCP) 使應用程式能夠為大型語言模型提供上下文。Anthropic 將 MCP 描述為「AI 應用程式的 USB-C 連接埠」，提供了一種標準化的方式將 LLM 連接到資料來源和工具，就像 USB 將各種週邊設備連接到裝置一樣。

根據 Google 的說法，A2A 並不打算取代 MCP。這兩個協定之間的重疊極少；它們解決不同的問題，並在不同的抽象層級上運作。A2A 促進代理之間的互動，而 MCP 將大型語言模型連接到工具，而工具又將它們連接到服務和資料。因此，這兩個協定是互補的。

Agent2Agent 和模型上下文協定是同一個拼圖的兩個部分，它們都需要實現代理工作流程和無處不在的 AI 的未來願景。

更新於 2025-04-19

# Google # Gemini # Agent