谷歌 Agent2Agent 协议:AI 通信新纪元

Google Agent2Agent 协议:AI 通信的新纪元

Google 的 Agent2Agent 协议 (A2A) 代表着一项重大的技术飞跃,旨在为智能体之间的通信建立通用标准。该协议促进了多供应商生态系统内的互操作性,预示着人工智能系统可以无缝协作的未来,而无论它们的来源或框架如何。

A2A 的起源:克服 AI 的巴别塔

Google Agent2Agent 协议于 2025 年 4 月 9 日发布,旨在解决人工智能领域的一个关键挑战:虚拟助手之间缺乏互操作性。目前,人工智能智能体通常在孤立的孤岛中运行,每个智能体都遵守自己的一套规则和技术语言。这种碎片化阻碍了业务流程的自动化,阻止了由不同供应商开发的智能体进行有效沟通。

想象一下一个全球分布的供应链或一个复杂的招聘流程。人工智能智能体无法无缝交互可能会扰乱编排并造成效率低下。A2A 协议旨在通过提供通用标准来弥合这一差距,该标准使智能实体能够连接和协作,从而无需昂贵且耗时的临时集成。

愿景:AI 的通用语言

A2A 的核心目标是为智能体提供一种通用语言——一种共享的语法和句法,无论其内部架构如何,都可以理解。这一愿景为“AI 智能体互联网”奠定了基础,在该互联网中,AI 系统可以像人类在互联网上一样无缝地进行通信和协作。

如果没有这个中间层,公司将继续面临管理多个集成的负担,这些集成既昂贵、缓慢又难以维护。A2A 旨在简化这种复杂性,而又不影响技术自由。它设想了一个 AI 智能体可以有效沟通的世界,而无论其底层技术如何。

A2A 的五大支柱:数字智能体的宪法

Google Agent2Agent 协议建立在五个基本原则之上,这些原则可以作为数字智能体的现代宪法:

  • 开放性: 该协议可以自由访问,并且不依赖于单个供应商,从而促进了广泛的采用和创新。

  • 兼容性: A2A 旨在与 HTTP、JSON-RPC 和 SSE 等现有标准轻松集成,从而确保与现有系统的无缝交互。

  • 安全性: 强大的身份验证和授权机制已集成到协议中,以满足专业环境的严格安全要求。

  • 灵活性: 该协议可以管理短任务(持续数秒)和长任务(持续数小时或数天),从而适应各种各样的应用程序。

  • 多模态: 智能体可以交换图像、声音和视频,从而实现丰富而有上下文的交互。

功能解剖:智能体卡片、任务和流式传输

A2A 系统围绕着几个关键组件展开,这些组件有助于 AI 智能体之间的通信和协作。

智能体卡片:AI 的数字名片

A2A 系统的核心是“智能体卡片”,这是一种 JSON 格式的数字名片,它精确地描述了每个智能体的功能和要求。这些卡片使 AI 智能体能够彼此发现、评估各自的技能,并确定它们是否可以协同工作。

这些卡片具有重要的用途:允许 AI 智能体识别和评估彼此的技能,从而确定它们是否适合协同工作。

任务:协作的构建块

“任务”代表 A2A 生态系统中的基本工作单元。每个任务都遵循一个明确定义的生命周期,最终生成其他智能体可以访问、评估或修改的工件。这种结构化的方法可确保高效有效地完成任务。

流式传输:实时更新和持续协作

A2A 协议最具创新性的功能之一是其对流式传输的支持。无需等待智能体交付其最终结论,而是实时提供更新。这使探索复杂主题的智能体可以共享其发现,就像探险家从遥远的地方发送报告一样。

以深入的文档研究为例。智能体首先发送第一个可用的信息——名称、参考、可靠来源。当它浏览数据库、专用 API 或学术档案时,它会不断传输有序的可操作信息片段。每次更新都会完善请求智能体的理解,而不会中断或不必要的延迟。

这种流畅性从根本上改变了 AI 智能体之间协作工作的性质。它消除了步骤之间的沉默,并使交互持续、透明,并且几乎像人类一样自发。

业务优势:利用 AI 协调复杂性

想象一下,AI 智能体无缝协作以协调您最复杂的业务流程。不再有孤岛,不再有费力的集成——而是一种新的流畅性,每个智能体都能在其专业领域中表现出色,同时与同伴完美地协调。这就是 Google Agent2Agent 协议的承诺。

A2A 的潜在影响遍及各个行业和应用。

用例:简化供应链管理

要了解 Google Agent2Agent 协议的强大功能,请考虑一家在汽车领域运营的国际工业集团的案例。其在德国的一家工厂发生故障,导致生产停止。需要一个快速的解决方案:更换一系列可用性有限的关键组件。

物流经理激活了他们的专用 AI 智能体。通过 Google Agent2Agent 协议,该智能体咨询外部合作伙伴智能体(制造商、供应商、运输商)的卡片,以识别那些能够响应此紧急情况的智能体。

然后,它会联系意大利一家供应商的专业智能体、荷兰一家物流提供商的智能体以及法国一家现场维护服务的智能体。

每个智能体都确认了请求,启动了自己的内部搜索,并开始交换结构化的工件:零件可用性、预计交货时间和现场技术人员的可用性。此信息以流式更新的形式逐步传输,从而使中央协调员可以实时监控响应计划的进度。

在几个小时内,无需系统之间进行任何手动人工干预,即可提出完整的解决方案:零件已预订,卡车已派遣,工程师已发送。所有这些都归功于自主智能体之间的无缝通信,每个智能体都使用自己的技术语言,但所有智能体都可以通过 A2A 理解。

A2A 与模型上下文协议 (MCP)

重要的是要区分 Google 的 A2A 协议与 AI 集成的其他方法,例如 Anthropic 的模型上下文协议 (MCP)。MCP 提供了一种机制,供大型语言模型访问外部工具和数据源。它允许模型调用 CRM、SQL 数据库或预测分析引擎,从而提供访问其本机结构之外的数据和功能的网关。

虽然 MCP 使单个智能体能够与外部资源交互,但 A2A 侧重于社交多个智能体,从而促进它们之间的直接通信和协作。想象一下,一个营销智能体直接与一个物流智能体讨论以计划全球部署。无需人工干预;决策是在机器之间做出的。

但是,Google 将其协议定位为与 MCP 完美互补。智能体可以使用 MCP 查询数据库,然后通过 A2A 将结果分析委托给数字专家。这一愿景表明了一个和谐的生态系统,不同的协议协同工作以增强 AI 功能。

潜在的标准之战?

尽管 Google 持协作立场,但一些观察家认为 A2A 的出现是一场标准之战的开始。OpenAI 最近采用 MCP 进一步加剧了这种看法。

在 Google Agent2Agent 协议的初始合作伙伴中,Anthropic 和 OpenAI 的缺席值得注意,特别是考虑到 Google 声称支持 MCP。这种情况突显了定义 AI 生态系统内通信标准的战略重要性。控制语言的实体最终控制思想——或者至少控制其表达。此原则适用于 AI 和人类。

战略合作伙伴关系:构建协作生态系统

Google Agent2Agent 协议吸引了各种各样的合作伙伴,包括 Salesforce 和 SAP 等企业巨头,以及 LangChain 和 MongoDB 等专业参与者。这种多样化的组合反映了该协议的跨领域抱负。A2A 不满足于仅仅吸引技术市场的特定细分市场。它渴望成为智能体之间在所有领域进行通信的通用标准。

德勤和埃森哲等著名咨询公司的参与也意义重大。这些公司在新技术在企业中的应用中发挥着至关重要的作用,将技术复杂性转化为切实的业务利益。他们对 A2A 的支持表明,该协议不仅仅是技术爱好者的玩具,而是一种注定要改变世界最大组织业务流程的解决方案。

逐步部署:从开源到稳定版本

Google Agent2Agent 协议的部署策略遵循循序渐进的方法。开源版本最初在 GitHub 上提供,供早期采用者和开发人员探索。计划于 2025 年底发布稳定版本,届时将纳入来自社区的反馈以完善规范。

这种社区驱动的方法让人想起 Google 的一些最伟大的成功,例如 Android。开放性促进采用,采用产生临界质量,而临界质量建立标准。Google 已经掌握了这种运转良好的机器,它很可能使 A2A 成为协作 AI 不可或缺的协议。

AI 协作的未来

Google Agent2Agent 协议代表着朝着 AI 系统可以无缝协作的未来迈出的重要一步,从而释放了自动化、创新和问题解决的新可能性。通过建立通用的通信标准,A2A 为一个更加互联和智能的世界铺平了道路。