中国正在经历 AI Agent 开发和应用的热潮,这些复杂系统旨在自主地为用户执行任务。这一趋势延续了去年对基础模型的关注,基础模型是为大部分 AI 革命提供动力的大型语言模型。现在,重点已经转移到创建能够处理各种功能的 AI Agent,从管理电子邮件到规划复杂的行程。
AI Agent 初创公司的涌现
最近涌现出许多中国初创公司,致力于构建能够显著提高生产力和便利性的通用数字工具。这些 AI Agent 旨在协助处理各种任务,包括回复电子邮件、进行互联网研究以进行度假计划,甚至创建交互式网站。这些初创公司的崛起速度非常快,许多公司在过去几个月内出现,其灵感来自 Manus 的成功,Manus 是一款 AI Agent,在社交媒体上引起了相当大的轰动。
与主要响应用户查询的大型语言模型 (LLM) 不同,这些 AI Agent 是建立在 LLM 之上的,采用结构化的、基于工作流程的方法来完成任务。这涉及与 AI 的不同交互模式,重点是管理和执行多步骤流程,例如预订航班、组织日程安排和进行深入研究。这些 Agent 的独特之处在于它们能够利用外部工具并保留指令,从而确保无缝高效的用户体验。
中国在 AI Agent 领域的潜在领导地位
中国有潜力引领 AI Agent 的发展,这归功于其独特的生态系统,该生态系统的特点是紧密集成的应用程序、快速的产品开发周期以及精通数字技术的用户群。这种环境特别有利于将 AI 嵌入到日常生活中,从而使用户更容易采用这些工具并将其集成到日常生活中。
目前,中国领先的 AI Agent 初创公司主要瞄准国际市场。这主要是因为许多最先进的西方 AI 模型在中国互联网防火墙内无法访问。然而,随着字节跳动和腾讯等主要科技公司开发自己的 AI Agent,这种情况正在发生变化。这些 AI Agent 可以直接集成到他们现有的超级应用程序中,利用其生态系统中的海量数据和资源来增强日常生活的各个方面的自动化。
定义 AI Agent 的功能和实用性的竞赛正在加剧,雄心勃勃的初创公司和老牌科技巨头都在探索如何有效地实施这些工具以及适用于哪些用户群体。这种竞争格局正在推动创新并突破 AI Agent 可以实现的边界。
Manus:AI Agent 领域的开拓者
由初创公司 Butterfly Effect 开发的 Manus 经历了显著的增长。该公司获得了由美国风险投资公司 Benchmark 领投的 7500 万美元融资,开始了全球路演以推广其产品,并大幅扩展了其员工队伍。
早在 5 月份公开发布之前,Manus 就已成为通用型以消费者为中心的 AI Agent 应该具备的能力的基准。与专为特定业务任务设计的 AI Agent 不同,Manus 旨在协助处理各种日常任务,例如规划旅行、比较股票期权和帮助完成学校项目。
Manus 提供了一个独特的基于浏览器的沙盒环境,允许用户实时监控 Agent 的活动。此功能允许用户观察 Agent 导航网页、阅读文章和编码操作。此外,Manus 主动寻求用户的澄清并保持长期记忆,以便为未来的任务提供上下文,从而增强其处理复杂和正在进行的项目能力。
Simular 是一家专注于创建运行真实计算机的 AI Agent 的初创公司,其联合创始人兼首席执行官 Ang Li 认为,Manus 代表了 AI Agent 用户体验的重大进步。他认为,由于国内竞争激烈,中国初创企业在设计消费产品方面具有独特的优势,这推动了快速创新和对产品细节的细致关注。
竞争和全球抱负
AI Agent 市场的竞争正在迅速加剧。Genspark 和 Flowith 等新兴参与者已经在展示与 Manus 匹敌或超过 Manus 的基准分数。这些初创公司与 Manus 拥有共同的全球雄心,Genspark 和 Flowith 都将国际市场作为他们的首要关注点。
由中国企业家领导的初创公司,如 Manus、Genspark 和 Flowith,越来越准备好融入全球科技格局并在国际范围内有效竞争。行业专家和投资者认为,这些公司的特点是它们的敏捷性、高效的执行能力和快速开发创新产品的能力。
财务激励也推动了向海外扩张。更高的客户消费能力和有利的汇率使国际市场特别有吸引力。正如 Manus 联合创始人肖虹指出的那样,以美元定价可以带来显着的收入倍增效应。这使得在国际市场上运营极具吸引力,即使文化差异可能会带来一些挑战。
中国市场的挑战与机遇
在中国创建类似的 AI Agent 功能面临着独特的挑战。由于地缘政治风险和监管复杂性,美国主要的 AI 公司,如 OpenAI 和 Anthropic,选择避开中国大陆。这种缺失最初导致了一个黑市,用户依靠 VPN 和第三方镜像来访问 ChatGPT 和 Claude 等工具。然而,这种差距刺激了中国本土聊天机器人(如 DeepSeek、Doubao 和 Kimi)的增长,尽管对外国模型的需求仍然很大。
例如,Manus 利用了 Anthropic 的 Claude Sonnet,该模型被广泛认为是 Agent 任务的领先模型。Manus 联合创始人张涛一直称赞 Claude 管理工具、记住上下文和进行多轮对话的能力,所有这些对于将 AI 从单纯的聊天机器人转变为有效的执行助理至关重要。
然而,对 Sonnet 的依赖意味着 Manus 在没有 VPN 的情况下在中国境内实际上无法使用。从中国大陆 IP 地址访问 Manus 的用户将看到一条通知,提示该团队正在努力集成 Qwen 的模型,这是基于阿里巴巴开源模型的本地版本。
一位参与字节跳动 AI Agent 开发的工程师表示,缺少 Claude Sonnet 模型极大地限制了它们在中国的能力。他指出,虽然 DeepSeek 的开放模型可用,但它们仍然经常产生幻觉,并且没有针对真实世界的工作流程进行充分的训练。开发人员通常认为阿里巴巴的 Qwen 系列是最好的国内替代品,但切换到 Qwen 可能会导致性能下降。
斯坦福大学以人为本 AI 研究所的博士后研究员贾新培乐观地认为,随着时间的推移,这些性能差距将会缩小。他认为,将 Agent 功能集成到底层 LLM 中正成为许多 LLM 开发人员的主要关注点,并且这些功能的价值将推动快速发展。
专注于海外扩张
目前,Manus 正在优先考虑在其可以轻松为用户提供服务的市场进行扩张。该公司表示,其主要重点是国际扩张,最近在旧金山、新加坡和东京开设了新的办事处。
虽然 AI Agent 的概念仍然相对较新,但中国的面向消费者的 AI 应用程序市场已经挤满了主要的科技公司。DeepSeek 仍然是最广泛使用的,而字节跳动的 Doubao 和 Moonshot 的 Kimi 也越来越受欢迎。然而,这些应用程序中的大多数仍然针对聊天和娱乐进行了优化,而不是任务执行。这种差距促使中国的大型科技公司推出自己的面向用户的 Agent,这些 Agent 目前的质量参差不齐,并且仍然被认为是粗糙的。
大型科技公司的回应:字节跳动和智谱 AI
字节跳动目前正在测试 Coze Space,这是一个由其 Doubao 模型系列提供支持的 AI Agent。Coze Space 允许用户在“计划”和“执行”模式之间切换,使他们能够直接指导 Agent 的操作或允许它自主工作。它连接到 14 个流行的应用程序,包括 GitHub、Notion 和字节跳动的 Lark 办公套件。早期评论表明,虽然该工具可能笨拙且失败率很高,但它的目标是匹配 Manus 提供的功能。
智谱 AI 已经推出了 AutoGLM Rumination,这是一个基于其 ChatGLM 模型构建的免费 Agent。总部位于上海的 Minimax 推出了 Minimax Agent。这两种产品都具有与 Manus 类似的界面,并演示了基本任务,例如构建简单的网站、规划旅行、创建简单的 Flash 游戏或运行数据分析。
腾讯的超级应用程序战略
尽管在中国推出的大多数通用 AI Agent 的可用性有限,但主要公司计划改变这种局面。在 5 月 15 日的财报电话会议上,腾讯总裁刘炽平暗示将推出一种 Agent,该 Agent 将自动化直接集成到微信中,微信是中国最普及的应用程序。
微信被认为是最初的超级应用程序,它结合了消息传递、移动支付、新闻和数百万个作为嵌入式应用程序运行的小程序。这些小程序使腾讯及其开发人员能够访问来自各种服务的数据,从而使他们在提供集成自动化方面具有显着优势。
互操作性挑战
从历史上看,中国的消费者互联网一直被相互竞争的围墙花园所分割。例如,在微信中分享淘宝链接只会显示为纯文本,而没有预览卡片。与更具互操作性的西方互联网不同,中国的科技巨头通常抵制彼此的集成,优先考虑平台战争,而不是无缝的用户体验。
然而,小程序使微信在前所未有地覆盖了以前抵制互操作性的服务,从健身房预订到杂货订单。能够导航此生态系统的 AI Agent 可以绕过独立初创公司面临的许多集成挑战。
阿里巴巴的 AI 努力
阿里巴巴是 Qwen 模型系列背后的电子商务巨头,一直是中国的 AI 竞赛的领跑者,但在发布面向消费者的产品方面一直较慢。尽管 Qwen 是 2024 年 Hugging Face 上下载次数最多的开源模型,但直到 2025 年初,它才为专用的聊天机器人应用程序提供支持。3 月,阿里巴巴将其云存储和搜索应用程序 Quark 重塑为一体化 AI 搜索工具。到 6 月,Quark 推出了 DeepResearch,这是一种新模式,标志着其迄今为止最像 Agent 的努力。
中国 AI Agent 的未来
Simular 的 Li 认为,中国的科技产品历来奉行一体化、超级应用程序的方法,最新的中国 AI Agent 也反映了这一趋势。他指出,美国的 AI Agent 更侧重于服务特定的垂直领域。
斯坦福大学的研究员 Pei 认为,现有的科技巨头在将通用 AI Agent 变为现实方面可能具有显着优势,特别是那些在各种服务中内置集成的公司。他认为,面向客户的 AI Agent 市场仍处于早期阶段,面临身份验证和责任等挑战。然而,已经在各种服务中运营的公司自然更有能力大规模部署 Agent。