在类似’权力的游戏’中错综复杂的权力斗争场景中,AI行业目前正目睹着其自身的高风险戏剧。当世界的注意力集中在围绕模型参数和性能的竞争上时,一场关于AI和智能体标准、协议和生态系统的无声战斗正在酝酿之中。
2024年11月,Anthropic推出了模型上下文协议(MCP),这是一种智能代理的开放标准,旨在统一大型语言模型与外部数据源和工具之间的通信协议。此后不久,OpenAI宣布了对MCP的Agent SDK支持。谷歌DeepMind首席执行官Demis Hassabis也证实,谷歌的Gemini模型和软件开发工具包将整合这一开放标准,称MCP’正迅速成为AI代理时代的开放标准’。
与此同时,谷歌在Google Cloud Next 2025大会上宣布了开源的Agent2Agent协议(A2A)。该协议旨在打破现有框架和供应商之间的障碍,从而实现不同生态系统中代理之间的安全高效协作。
科技巨头的这些行动揭示了AI和智能代理在连接标准、接口协议和生态系统方面的竞争。’协议等于权力’的原则显而易见。随着全球AI格局的形成,谁控制了AI时代基本协议标准的定义,谁就有机会重塑全球AI产业链的权力结构和价值分配秩序。
未来AI生态系统的’USB-C端口’
随着AI技术的飞速发展,GPT和Claude等大型语言模型展示了令人印象深刻的功能。这些模型的真正价值在于它们与外部世界的数据和工具交互以解决实际问题的能力。
然而,这种交互能力长期以来面临着碎片化和缺乏标准化的问题,这要求开发人员为不同的AI模型和平台实现特定的集成逻辑。
为了解决这个问题,MCP应运而生。作为连接AI模型与外部世界的桥梁,MCP解决了AI交互过程中面临的几个关键问题。
在MCP出现之前,如果AI模型需要连接到本地数据库(例如SQLite)以获取数据或调用远程工具(例如用于团队通信的Slack,用于管理代码的GitHub API),则开发人员必须为每个数据源或工具编写特定的连接代码。这个过程不仅繁琐且容易出错,而且由于缺乏统一的标准,开发成本高昂,难以维护并且难以扩展。
在启动MCP时,Anthropic做了一个类比:MCP就像AI应用程序的USB-C端口。MCP旨在创建一个通用标准,允许各种模型和外部系统使用相同的协议进行访问,而不是每次都编写一套单独的集成解决方案。这使得AI应用程序的开发和集成更加简单和统一。
例如,在软件开发项目中,基于MCP的AI工具可以直接深入到项目代码存储库中,分析代码结构,了解历史提交记录,然后为开发人员提供更符合项目实际需求的代码建议,从而显着提高开发效率和代码质量。
过去,为了使大型模型和其他AI应用程序可以使用数据,通常需要复制和粘贴或上传和下载。即使是最强大的模型也受到数据隔离的限制,形成信息孤岛。为了创建更强大的模型,每个新的数据源都需要定制和实现,这使得很难扩展真正互连的系统,从而导致许多限制。
通过提供统一的接口,MCP直接桥接AI和数据(包括本地和互联网数据)。通过MCP服务器和MCP客户端,只要两者都遵循此协议,’一切都可以连接’。这使AI应用程序可以安全地访问和操作本地和远程数据,从而为AI应用程序提供了一个连接一切的接口。
从架构的角度来看,MCP主要包括两个核心部分:MCP服务器和MCP客户端。开发人员可以通过MCP服务器公开其数据,这些数据可以来自本地文件系统,数据库或远程服务,例如Slack和GitHub API。构建为连接到这些服务器的AI应用程序称为MCP客户端。简而言之,MCP服务器负责公开数据,而MCP客户端负责访问数据。
当AI模型访问外部数据和工具时,安全性是一个重要的考虑因素。通过提供标准化的数据访问接口,MCP显着减少了与敏感数据的直接接触次数,从而降低了数据泄露的风险。
MCP具有内置的安全机制,允许数据源在安全框架内以受控方式与AI共享数据。AI还可以安全地将处理结果反馈回数据源,从而确保只有经过验证的请求才能访问特定资源,相当于为数据安全添加了另一层防御,消除了企业对数据安全的担忧,并为AI在企业级场景中的深度应用奠定了坚实的基础。
例如,MCP服务器控制其自己的资源,并且不需要向大型模型技术提供商提供诸如API密钥之类的敏感信息。这样,即使大型模型受到攻击,攻击者也将无法获得此敏感信息,从而有效地隔离了风险。
可以说,MCP是AI技术发展的自然产物,也是一个重要的里程碑。它不仅简化了AI应用程序的开发过程,还为AI生态系统的繁荣创造了条件。
作为开放标准,MCP极大地激发了开发人员社区的活力。全球开发人员可以围绕MCP贡献代码和开发新的连接器,不断扩展其应用边界,形成良性生态循环,并促进AI和数据在各个行业的深度融合。这种开放性使AI应用程序更容易连接到各种服务和工具,形成丰富的生态系统,最终使用户和整个行业受益。
MCP的优势不仅体现在技术层面,更重要的是它为不同领域带来的实际价值。在AI时代,获取和处理信息的能力决定一切,而MCP允许多个代理进行协作,从而最大限度地发挥彼此的优势。
例如,在医学领域,智能代理可以通过MCP连接到患者电子病历和医学数据库,并结合医生的专业判断,可以更快地提供初步诊断建议。在金融行业,智能代理可以协作分析财务数据,跟踪市场变化,甚至自动进行股票交易。智能代理之间的这种分工与合作使数据处理更加高效,决策更加准确。
回顾MCP的发展历史,不难发现其增长速度惊人。在2023年初,MCP完成了核心通信协议的设计,实现了基本的智能代理注册和消息传输功能。这就像为智能代理创建了一种通用语言,使它们可以相互通信,而不是说自己的语言。
在2023年底,MCP进一步扩展了其功能,支持智能代理调用外部API和数据共享,这相当于允许智能代理不仅可以聊天,还可以交换信息和共同处理任务。
在2024年初,MCP生态系统达到了一个新的水平。发布了开发人员工具包和示例项目,并且社区贡献的智能代理插件数量超过100个,实现了’百花齐放’的局面。
最近,Microsoft将MCP集成到其Azure OpenAI服务中,而Google DeepMind也宣布将提供对MCP的支持并将其集成到Gemini模型和SDK中。不仅大型科技公司,而且AI初创公司和开发工具提供商也加入了MCP,例如Block,Apollo,Zed,Replit,Codeium和Sourcegraph。
MCP的兴起引起了腾讯和阿里巴巴等中国科技公司的迅速跟进和竞争,他们将其视为AI生态系统战略的重要一步。例如,最近,阿里云的百炼平台推出了一项完整的生命周期MCP服务,消除了用户管理资源,开发和部署以及工程运维的需要,从而将智能代理的开发周期缩短到几分钟。腾讯云发布了’AI开发工具包’,该工具包支持MCP插件托管服务,以帮助开发人员快速构建面向业务的智能代理。
多代理协作的’隐形桥梁’
随着MCP协议将智能代理从聊天工具转变为行动助手,科技巨头们开始在这个新的战场上建立标准和生态系统的’小院子和高墙’。
与专注于将AI模型与外部工具和数据连接的MCP相比,A2A更进一步,专注于智能代理之间的有效协作。
A2A协议的最初目的是简单的:使来自不同来源和制造商的智能代理能够相互理解和协作,从而为多个智能代理的协作带来更大的自主性。
这就像WTO旨在减少各国之间的关税壁垒。来自不同供应商和框架的智能代理就像独立的国家。一旦采用A2A,就相当于加入了自由贸易区,在这里他们可以用通用语言进行交流,无缝协作,并共同完成单个智能代理无法独立完成的复杂工作流程。
A2A协议的具体互操作性形式是通过促进客户端代理和远程代理之间的通信来实现的。客户端代理负责制定和传递任务,而远程代理根据这些任务采取行动以提供正确的信息或执行相应的操作。
在此过程中,A2A协议具有以下关键功能:
首先,智能代理可以通过’智能代理卡’来宣传其功能。这些’智能代理卡’以JSON格式存在,允许客户端代理识别哪个远程代理最适合执行特定任务。
一旦确定了合适的远程代理,客户端代理就可以使用A2A协议与之通信并将任务分配给它。
任务管理是A2A协议的重要组成部分。客户端和远程代理之间的通信围绕完成任务展开。该协议定义了一个’任务’对象。对于简单的任务,它可以立即完成;对于复杂而长期的任务,智能代理可以相互通信以保持任务完成状态的同步。
此外,A2A还支持智能代理之间的协作。多个智能代理可以相互发送消息,其中可以包含上下文信息,回复或用户指令。这样,多个智能代理可以更好地协同工作以共同完成复杂的任务。
在设计该协议时,Google遵循了五个关键原则。首先,A2A专注于使智能代理能够以其自然的,非结构化模式进行协作,即使它们不共享内存,工具和上下文。
其次,该协议建立在现有的,流行的标准之上,包括HTTP,服务器发送事件(SSE)和JSON-RPC,这意味着它更容易与公司每天已经使用的现有IT堆栈集成。
例如,一家电子商务公司每天使用HTTP协议来处理Web数据传输,并使用JSON-RPC来在前端和后端之间传输数据指令。在引入A2A协议之后,该公司的订单管理系统可以通过HTTP和A2A协议对接快速获得相关智能代理提供的物流数据更新,而无需重建复杂的数据传输通道,从而使其易于集成到现有的IT体系结构中,并使各种系统的协作更加顺畅。
第三,A2A旨在支持企业级身份验证和授权。使用A2A协议可以快速进行身份验证并安全地获取数据,从而确保数据传输的安全性和合规性,并防止数据泄漏风险。
第四,A2A足够灵活,可以支持各种场景,从快速任务到可能需要数小时甚至数天(当有人参与时)的深入研究。在整个过程中,A2A可以为用户提供实时反馈,通知和状态更新。
以一家研究机构为例。研究人员使用A2A协议下的智能代理来进行与新药开发相关的研究。简单的任务,例如快速检索数据库中现有的药物分子结构信息,可以在几秒钟内完成并反馈给研究人员。但是,对于复杂的任务,例如模拟新药物分子在人体环境中的反应,可能需要几天的时间。
在此期间,A2A协议将不断地将模拟进度推送到研究人员,例如已完成多少步骤,当前遇到的问题等等,从而使研究人员可以随时掌握情况,就像始终有助手报告工作进度一样。
第五,智能代理的世界不仅限于文本,因此A2A支持各种模式,包括音频,图像和视频流。
想象一下,将来,您的智能助手,公司的CRM系统,供应链管理AI,甚至不同云平台上的智能代理都可以像老朋友一样’聊聊任务,分配工作’,从而高效地完成从简单查询到复杂流程的各种需求,从而开启机器智能时代。
目前,该协议已经支持50多家主流技术公司的应用程序平台,包括Atlassian,Box,Cohere,Intuit,MongoDB,PayPal,Salesforce和SAP。
值得注意的是,这些都是与Google生态系统有微妙关系的公司。例如,独立的AI初创公司Cohere由三位先前曾在Google Brain工作的研究人员于2019年成立。他们与Google Cloud有着长期的技术合作伙伴关系,而Google Cloud为Cohere提供了训练模型所需的计算能力。
Atlassian是一家提供团队协作工具的公司,例如Jira和Confluence,许多人都在使用。他们与Google建立了合作伙伴关系,并且某些应用程序可以在Google产品中使用。
尽管Google表示A2A是对Anthropic提出的MCP模型上下文协议的补充,但这有点像Google过去率先与80多家公司一起开发Android系统。随着越来越多的公司加入,A2A的商业价值将大大提高,并且将促进整个智能代理生态系统的快速发展。
从’连接工具’到’支配生态系统’
MCP和A2A代表了AI互连的两种不同路径。MCP作为底层模型交互协议,可确保应用程序与不同模型之间的无缝对接;A2A在此基础上提供了智能代理之间的协作框架,强调智能代理之间的自主发现和灵活协作。这种分层结构可以同时满足模型标准化和智能代理协作的需求。
同时,两者都在各自的子领域中取得了主导地位。MCP在企业级应用程序,跨模型服务和标准化方案中具有优势;A2A在开源社区,研究项目和创新应用程序中获得了更多支持。
从宏观的角度来看,MCP和A2A的兴起不仅与未来的AI技术标准有关,而且预示着AI行业格局的重大变化。我们正在见证AI从’单机智能’到’协作网络’的历史性转折点。正如互联网的发展历史所表明的那样,开放和标准化协议的建立将成为推动行业发展的关键力量。
但从更深层次上讲,MCP和A2A隐藏着巨大的商业利益和对未来AI技术话语权的竞争。
在商业模式方面,两者正在开辟不同的盈利途径。Anthropic计划推出基于MCP的企业版服务,根据API调用量向公司收费。公司使用MCP将内部数据与AI深度集成,提高业务效率,并且需要为此便捷服务付费。
Google正在使用A2A协议来推广云服务订阅。当公司使用A2A构建智能代理协作网络时,他们将被引导使用Google Cloud强大的计算能力和相关服务,从而增加Google Cloud的业务收入。
在数据垄断方面,掌握协议标准意味着控制AI数据的流动。通过A2A协议,Google在许多企业智能代理的协作过程中收集大量数据。这些数据反馈到其核心广告算法中,从而进一步巩固其在广告市场中的主导地位。Anthropic希望使用MCP使AI渗透到企业数据的核心。如果形成规模优势,它还将积累大量的行业数据,为扩展业务和开发更符合企业需求的AI产品提供数据支持。
在开源策略方面,尽管两者都声称是开源的,但它们都有自己的计划。MCP核心协议是开源的,吸引开发人员参与生态系统建设,但是企业级关键功能(例如远程连接高级功能和对多模式数据的深入处理)需要付费才能解锁,从而平衡了开源和商业利益。在A2A协议是开源的,它指导50多个企业合作伙伴优先使用Google Cloud服务,从而将开源生态系统与其自身的商业系统紧密结合,并增强用户粘性和平台竞争力。
技术本身没有好坏之分,但是当它嵌入到利益链中时,它就成为权力和控制的载体。每一次技术革命都在重塑世界的利益链。工业革命将利益链从土地和劳动力转移到资本和机器上,而数字革命将其推向了数据和算法。
开源工具当然可以探索创新路径,但不要期望使用数据和算法密钥来打开所有门,因为每个密钥字符串上都刻有平台的利益密码。
尽管科技公司似乎正在开放AI生态系统,但实际上,他们正在围绕更有利于自己的应用程序场景构建高而厚的生态墙,以防止数据金矿被盗,毕竟,AI时代的最终竞争力仍然是数据。
MCP和A2A最终是否可以合并仍不确定。如果他们各自独立行动,那么技术巨头很可能会建立’AI小院墙’。结果,数据孤岛现象将变得更加严重,不同协议阵营中的公司之间的数据流通将受到阻碍,从而限制了AI创新应用的范围;开发人员将需要掌握多种协议开发技能,从而增加了学习成本和开发工作量,从而抑制了创新活力;行业创新方向很容易受到巨型协议的指导,并且初创企业由于难以支持多种协议而在竞争中处于不利地位,从而阻碍了行业的整体创新步伐。
我们希望MCP和A2A的兴起将推动全球AI行业朝着协作而非对抗的方向发展。
就像19世纪的铁路轨距争议和20世纪的移动通信标准战一样,每一次技术分裂都伴随着巨大的社会成本。AI标准和协议争议的后果可能更为深远。它将决定我们是朝着’万物互联’的星际联邦前进,还是陷入’猜疑链’盛行的黑暗森林。