Manus:昙花一现还是中国AI的未来?

炒作的剖析:解构 Manus

Manus 的出现并非凭空而来。有报道指出,该平台并非从零开始构建,而是由现有和经过微调的 AI 模型精心编织而成。据报道,它利用了 Anthropic 的 Claude 和阿里巴巴的 Qwen 等模型的能力,将它们用于从研究报告生成到财务文件复杂分析等任务。

然而,Manus 背后的中国公司 The Butterfly Effect 在其网站上描绘了一幅更为雄心勃勃的图景。该平台被吹捧为能够实现房地产收购和视频游戏编程等多种多样的壮举——乍一看,这些说法似乎近乎天方夜谭。

大胆的声明和病毒式传播的视频:感知的力量

Manus 的研究负责人 Yichao ‘Peak’ Ji 在 X(前身为 Twitter)上发布的一段病毒式传播的视频进一步助长了炒作。他将 Manus 定位为现有智能体工具的卓越替代品,包括 OpenAI 的 deep research 和 Operator。Ji 声称 Manus 在 GAIA(一种广泛用于评估通用 AI 助手的基准测试)上优于 deep research。该基准测试通过导航网络、与软件交互等方式来探测 AI 执行现实世界任务的能力。

‘[Manus] 不仅仅是另一个聊天机器人或工作流程,’ Ji 在视频中宣称。’它是一个完全自主的智能体,弥合了概念和执行之间的差距 […]。我们认为它是人机协作的下一个范式。’ 这些确实是大胆的声明,它们极大地促成了该平台迅速蹿红。

现实检验:用户体验描绘了不同的图景

虽然 Manus 的架构师和一些有影响力的人士对其赞不绝口,但早期的用户体验却讲述了一个不那么讨人喜欢的故事。关于故障、局限性和彻底失败的报告已经开始浮出水面,给该平台据称的能力蒙上了一层阴影。

AI 初创公司 Pleias 的联合创始人 Alexander Doria 在 X 上分享了他对 Manus 不太理想的体验。他在测试过程中遇到了令人沮丧的错误消息和无限循环。其他用户也表达了类似的担忧,指出 Manus 容易出现事实错误、引文不一致以及倾向于忽略网上 readily available 的信息。

个人遭遇:令人沮丧的第一手资料

我自己尝试让 Manus 接受考验,结果同样令人失望。我从一个看似简单的请求开始:从我配送范围内一家评价很高的快餐店订购一份炸鸡三明治。等待十分钟后,平台崩溃了。第二次尝试产生了一个符合我标准的菜单项,但 Manus 无法完成订单,甚至无法提供结账链接。

我没有气馁,又让 Manus 在附近的一家餐馆预订一张单人桌。几分钟后,再次失败。最后,我要求该平台构建一款以火影忍者为灵感的格斗游戏。经过半小时的处理,它抛出了一个错误,有效地结束了我的实验。

公司的回应:承认成长的烦恼

Manus 的一位发言人在提供给 TechCrunch 的一份声明中承认了该平台目前的局限性:

‘作为一个小团队,我们的重点是不断改进 Manus,并制造出真正帮助用户解决问题的 AI 智能体 […]。当前封闭测试的主要目标是对系统的各个部分进行压力测试并识别问题。我们非常感谢大家分享的宝贵见解。’

这份声明虽然承认了这些问题,但也强调了该平台的早期访问性质。它表明当前版本更像是一个压力测试,而不是一个准备好广泛采用的成熟产品。

炒作周期:排他性、虚假信息和民族自豪感

如果 Manus 在目前的状态下存在明显缺陷,为什么它会引起如此强烈的关注?有几个因素促成了这种现象:

  • **排他性:**有限的邀请名额营造了一种排他性的氛围,推高了需求和好奇心。
  • **媒体炒作:**中国媒体迅速将 Manus 誉为一项重大的 AI 突破,《QQ 新闻》等出版物称其为’国货之光’。
  • **社交媒体放大:**社交媒体上的 AI 影响者在传播有关 Manus 能力的(有时是不准确的)信息方面发挥了重要作用。一段广为流传的视频,据称展示了 Manus 在多个智能手机应用程序之间无缝交互,后来被 Ji 证实为失实陈述。
  • **与 DeepSeek 的比较:**X 上的一些有影响力的 AI 账号将 Manus 与另一家中国 AI 公司 DeepSeek 进行了比较。然而,这些比较并不完全准确。与 DeepSeek 不同,The Butterfly Effect 尚未开发任何专有模型。此外,虽然 DeepSeek 已经开源了其许多技术,但 Manus 目前仍然是一个封闭系统。

一点保留意见:早期访问和未来潜力

必须重申的是,Manus 目前处于非常早期的开发阶段。The Butterfly Effect 坚称,它正在积极扩大计算能力并解决报告的问题。然而,就目前而言,Manus 是一个强有力的例子,说明炒作超过了技术现实。该平台能否发展到满足其为自己设定的崇高期望还有待观察。潜力无疑是存在的,但实现这一潜力的道路似乎充满了挑战。目前的迭代版本与病毒式传播的视频和宣传材料中描述的无缝、自主的智能体相去甚远。愿望与执行之间的差距仍然很大。