人工智慧領域正快速發展,AI 代理正崛起成為關鍵組成部分。AI 代理本質上結合了大型語言模型 (LLM) 的認知能力與工具組,使其能夠自主執行指令、檢索資訊並完成任務。這些代理會回應使用者的請求或與其他代理互動。AI 代理的潛力在於它們能夠擴展營運規模、自動化複雜流程,並提高各項業務功能的效率,從而顯著提高個人生產力。
普遍認為,通用的「一刀切」代理無法有效地處理人們對 AI 代理期望的各種複雜任務。解決方案在於代理工作流程 (Agentic Workflows)。這些工作流程由自主 AI 代理網路創建,它們可以做出決策、執行行動並協調任務,而只需最少的人工監督。
Google 對代理互通性的願景:Agent2Agent 協定 (A2A)
Google 於 2025 年 4 月 9 日推出了 Agent2Agent (A2A) 協定。它旨在促進 AI 代理之間的無縫通訊,使它們能夠安全地交換資料並自動化複雜的業務工作流程。這是透過與企業系統和第三方平台互動來實現的。
A2A 協定是 Google 與 50 多家產業合作夥伴合作的成果,所有合作夥伴都對 AI 代理協作的未來抱持共同願景。至關重要的是,這種協作超越了特定技術,並且建立在開放和安全的標準之上。
A2A 的核心設計原則
在開發 A2A 協定期間,Google 及其合作夥伴遵循了以下幾個基本原則:
- 開放且與供應商無關: A2A 協定必須是開放的,這意味著其規格可公開存取。這確保了任何開發人員或組織都可以實作該協定,而沒有專有限制。與供應商無關意味著該協定不與任何特定供應商的技術相關聯。這為所有參與者創造了公平的競爭環境。
- 自然的協作模式: A2A 允許代理使用其固有的、非結構化的通訊方法進行協作。這將代理與工具區分開來,並將 A2A 與 模型上下文協定 (MCP) 區分開來。
- 建立在現有標準之上: 為了簡化與現有 IT 基礎架構的整合,該協定建立在已建立的標準之上,例如 HTTP、伺服器發送事件 (SSE) 和 JSON-RPC。
- 預設安全: 安全性是最重要的考量。A2A 納入了企業級身份驗證和授權機制,以保護敏感資料並確保安全的互動。
- 資料模式無關: A2A 不僅限於基於文字的通訊。它可以處理各種資料類型,包括圖像、音訊和視訊串流。
A2A 的功能:強化代理協作
A2A 提供了一系列內建功能,以簡化代理互動:
- 能力探索: 這允許代理宣傳其能力。客戶可以輕鬆識別哪個代理最適合特定任務。可以將其視為一個數位市場,代理在其中展示其技能和專業知識。
- 任務和狀態管理: 客戶端和代理之間的通訊圍繞著 任務 的執行。這些任務由協定定義,並具有明確定義的生命週期。任務的結果稱為 工件 (Artifact)。任務及其狀態的管理確保了可靠且可追蹤的工作流程。
- 安全協作: 代理可以安全地交換訊息,以共享上下文、提供回應、交付工件或轉達使用者指示。這有助於建立協作環境,讓代理可以無縫地協同工作。
- 使用者體驗協商: 每個訊息都包含「部分 (parts)」,這些部分是獨立的內容片段,例如產生的圖像。每個部分都有指定內容類型,這使客戶端和遠端代理都能夠就所需的格式達成一致。此功能還包括使用者 UI 功能的協商,例如 iframe、視訊和 Web 表單。
能力探索和使用者體驗協商功能特別引人注目,因為它們為建立代理市場鋪平了道路。在這些市場中,供應商可以列出他們的代理,而客戶可以選擇最適合執行特定任務的代理。
雖然這個概念非常有前景並且對於 AI 代理市場的成長可能至關重要,但要實現這個願景,僅僅定義一個互動協定是不夠的。
解碼 Agent2Agent 協定概念
理解協定的核心概念對於有效的實作和利用至關重要。這些概念對於許多 AI 代理的開發人員來說已經很熟悉:
- 代理卡 (Agent Card): 這是一個公開的元資料檔案,詳細說明了代理的功能、技能、端點 URL 和身份驗證要求。代理卡在探索階段扮演著關鍵角色,使使用者能夠選擇合適的代理並了解如何與其互動。
- 伺服器 (Server): 一個實作 A2A 協定方法的代理,如 JSON 規範 中所定義。本質上,伺服器是透過 A2A 協定提供其服務的代理。
- 客戶端 (Client): 這可以是應用程式或另一個使用 A2A 服務的代理。客戶端啟動請求並利用伺服器提供的功能。
- 任務 (Task): 代理的基本工作單元。由客戶端啟動並由伺服器執行,它會在整個生命週期中經歷各種 狀態。
- 訊息 (Message): 表示客戶端和代理之間的通訊交換。每個訊息都有一個定義的 角色 (role),並且由 部分 (Parts) 組成。
- 部分 (Part): 這是訊息或工件中的基本內容單元。部分可以是文字、檔案或結構化資料。這允許靈活地傳輸各種資料類型。
- 工件 (Artifact): 表示代理在完成任務時產生的輸出。與訊息一樣,工件包含部分。
- 串流 (Streaming): 該協定支援串流,允許伺服器即時更新客戶端長時間執行的任務的狀態。這透過提供持續的回饋來增強使用者體驗。
Agent2Agent 專案的現況
A2A 最近才向公眾推出,其規範現在可在 GitHub 上取得。截至目前,尚無官方的路線圖或生產就緒的協定實作。但是,Google 正在與合作夥伴積極合作,以在 2025 年稍晚推出生產就緒的版本。
A2A GitHub 儲存庫 提供了幾個 TypeScript 和 Python 的 程式碼範例,以及一個完整的 示範應用程式。此應用程式展示了使用不同 代理開發套件 (ADK) 開發的代理之間的互動。
雖然這為實驗提供了基礎,但 A2A 必須整合到現有的框架和工具生態系統中,這些框架和工具用於部署代理工作流程,然後才能將其應用於關鍵任務應用程式。
與 Google 合作制定協定定義的大量主要參與者的支持(值得注意的是,沒有提供基礎模型的公司)強烈表明必要的工具將很快可用,並且 A2A 將整合到領先的代理框架中。
A2A 與模型上下文協定 (MCP):理解區別
由 Anthropic 開發的 模型上下文協定 (MCP) 使應用程式能夠為大型語言模型提供上下文。Anthropic 將 MCP 描述為「AI 應用程式的 USB-C 連接埠」,提供了一種標準化的方式將 LLM 連接到資料來源和工具,就像 USB 將各種週邊設備連接到裝置一樣。
根據 Google 的說法,A2A 並不打算取代 MCP。這兩個協定之間的重疊極少;它們解決不同的問題,並在不同的抽象層級上運作。A2A 促進代理之間的互動,而 MCP 將大型語言模型連接到工具,而工具又將它們連接到服務和資料。因此,這兩個協定是互補的。
Agent2Agent 和模型上下文協定是同一個拼圖的兩個部分,它們都需要實現代理工作流程和無處不在的 AI 的未來願景。