谷歌A2A协议:AI Agent互操作性的未来
谷歌推出Agent2Agent (A2A) 协议,此举有望重塑人工智能领域。这项开源计划旨在促进在不同生态系统中运行的 AI agent 之间的无缝和安全协作,使它们摆脱特定框架或供应商的限制。A2A 协议促进了跨平台的通信、能力发现、任务协商和协作,使企业能够构建专门的 AI agent 团队,从而能够管理复杂的工作流程。
揭秘 Agent2Agent 协议:AI 协作的新范式
A2A 协议的推出标志着 AI 演变过程中的一个关键时刻,它解决了日益增长的互操作性和协作需求。在这个世界中,AI agent 越来越多地部署在各种平台和环境中。通过建立 agent 通信和交互的标准化框架,谷歌旨在释放多 agent 系统的全部潜力,并推动各行各业的创新。
A2A 协议使建立在不同平台上的 AI agent 能够有效地通信、发现彼此的能力、协商任务并无缝协作。这种互操作性使企业能够组建专门的 agent 团队,从而能够以更高的效率和敏捷性处理复杂的工作流程。
考虑一个招聘场景的例子。通过使用 Google Agentspace 统一界面,招聘经理可以将任务委派给他们的 AI agent,指示它识别符合指定职位描述、地点和技能要求的候选人。然后,该 agent 与其他专业 agent 交互以查找潜在的候选人。招聘经理会收到一份精心策划的推荐名单,并可以指示他们的 agent 安排面试。面试完成后,可以聘请另一位 agent 来协助进行背景调查。
这个例子突出了 A2A 协议在简化和自动化复杂流程方面的变革潜力,使人类员工能够专注于更具战略性和创造性的任务。
A2A 协议的关键设计原则
A2A 协议建立在五个核心设计原则之上:
利用 Agent 的能力: 该协议优先考虑以自然、非结构化的方式支持 agent 协作,即使它们缺乏共享的内存、工具或上下文信息。这种方法促进了真正的多 agent 场景,避免了将 agent 限制为仅仅是’工具’的状态。A2A 协议认识到,AI 的真正力量在于 agent 能够智能地协同工作,利用各自的优势来实现共同目标。
建立在现有标准之上: 该协议构建在现有的、广泛采用的标准(如 HTTP、SSE 和 JSON-RPC)之上。这种方法有助于与现有 IT 基础设施的无缝集成,使企业能够更轻松地采用和实施 A2A 协议,而不会对当前系统造成重大中断。
默认安全: 该协议包含企业级身份验证和授权机制,确保它从一开始就满足严格的安全标准。A2A 协议的安全功能符合 OpenAPI 级别的认证标准,使企业可以放心,他们的数据和交互受到保护。
支持长时间运行的任务: 该协议旨在适应各种任务,从快速的、离散的操作到可能跨越数小时甚至数天的深入研究项目。在这些长时间运行的任务中,A2A 协议为用户提供实时的反馈、通知和状态更新,让他们随时了解进度和任何相关的开发情况。
模态无关: 该协议支持各种模态,包括音频和视频,使 agent 能够以最适合手头任务的格式进行交互和交换信息。这种灵活性确保了 A2A 协议可以应用于各种用例,而不管具体的输入或输出要求如何。
行业范围内的采用和对 A2A 的支持
A2A 协议已获得领先技术合作伙伴和服务提供商的大力支持,包括 Atlassian、Box、Cohere、Intuit、Langchain、Accenture、BCG、Capgemini 和 Cognizant。超过 50 个组织的支持突显了行业对 A2A 协议在革新 AI 协作和推动各个领域创新的潜力的认可。
A2A 协议的广泛采用将培养一个充满活力的、可互操作的 AI agent 生态系统,使企业能够利用多个 agent 的集体智能来解决复杂的问题并实现其战略目标。
A2A 协议的工作原理:深入了解
A2A 协议有助于’客户端’ agent 和’远程’ agent 之间的通信。客户端 agent 启动和传递任务,而远程 agent 执行这些任务、提供信息或采取适当的措施。这种交互涉及几个关键功能:
能力发现: Agent 利用 JSON 格式的’Agent 卡’来展示他们的能力。这使客户端 agent 能够识别最适合特定任务的 agent,并通过 A2A 协议与之通信。Agent 卡提供了一种标准化的方式,让 agent 可以宣传他们的技能和专业知识,从而使其他 agent 更容易发现和利用他们的服务。
任务管理: 客户端 agent 和远程 agent 之间的通信是以任务为导向的,agent 协同工作以满足最终用户的请求。协议定义的’任务’对象具有生命周期。它可以立即完成,或者对于长时间运行的任务,agent 可以进行通信以保持最新状态的同步。任务的输出称为’工件’。A2A 协议的任务管理功能确保 agent 专注于实现特定目标,并且他们的交互是结构化的和高效的。
协作: Agent 可以相互发送消息,交换上下文、回复、工件或用户说明。这种协作能力使 agent 能够共享信息、协调他们的努力并协同工作以实现复杂的目标。
用户体验协商: 每条消息都包含’部件’,这些部件是完整的内容片段,例如生成的图像。每个部件都有指定的内容类型,允许客户端 agent 和远程 agent 协商正确的格式。这包括协商用户界面功能,如 iframe、视频、Web 表单等。A2A 协议的用户体验协商功能确保 agent 之间的交互是无缝的和用户友好的。
A2A 作为 MCP 的补充
谷歌强调,A2A 协议是对 MCP (Meta-Config Protocol) 的补充。虽然 MCP 为 agent 提供了实用的工具和上下文信息,但 A2A 协议解决了部署大规模多 agent 系统时遇到的挑战。
A2A 协议提供了一种标准化方法,用于管理跨各种平台和云环境的 agent。这种普遍的互操作性对于最大化协作 AI agent 的潜力至关重要。
A2A 和 MCP 的可视化比较
可视化表示有效地说明了 A2A 和 MCP 之间的关系。MCP 促进了各种工具和资源的连接,而 A2A 实现了 agent 之间的通信。
Google DeepMind 对 MCP 的认可
Google DeepMind 联合创始人兼首席执行官 Demis Hassabis 公开认可 MCP,称它正在迅速成为 AI agent 时代的开放标准。DeepMind 计划支持其 Gemini 模型和 SDK 的 MCP,这标志着对 AI agent 技术的互操作性和标准化的高度承诺。
阿里云采用 MCP
阿里云已将完整的生命周期 MCP 服务集成到其 Pailian 平台中。该平台结合了阿里云的函数计算能力以及 200 多个领先的大规模模型和 50 多个主流 MCP 服务。该平台提供了 agent 开发所需的所有计算资源、大型模型资源和应用程序工具链,使用户能够以最小的努力快速构建自己的 MCP agent。
Agent 时代的黎明
主要科技公司最近的开发突显了’Agent 时代’的出现。A2A 协议以及其他类似 MCP 的计划正在为 AI agent 无缝协作以解决复杂问题和增强人类能力铺平道路。可能性是巨大的,对各行各业的潜在影响是巨大的。