Manus:基于Claude的新型AI Agent

Manus的出现及其能力

AI Agent领域发展迅速,最近出现了一系列活动,让人想起DeepSeek现象。一家来自中国深圳的初创公司Manus推出了一款名为“通用AI Agent”的产品,在AI社区内引发了广泛的讨论和兴奋。

Manus的设计目标是成为一个多功能的AI Agent,能够自主规划、执行并交付全面的结果。该Agent可以实时与网站交互,处理各种类型的数据,并利用一套工具来实现其目标。

尽管处于邀请测试阶段,Manus凭借其令人印象深刻的能力迅速获得了关注。Menlo Ventures的负责人Deedy Das称赞Manus说:“Manus,这个每个人都在谈论的新AI产品,值得大肆宣传。这就是我们所期待的AI Agent。”Das强调,该Agent能够将通常需要两周专业工作的时间缩短到大约一小时。

技术控股公司Tiny的联合创始人Andrew Wilkinson表达了类似的看法,他说:“我感觉自己穿越到了六个月后的未来。”Wilkinson甚至分享了他让Manus开发并替代一个软件解决方案的任务,他的公司目前每年为此花费6000美元。

Manus展示了广泛的功能,包括:

  • 详细行程创建: 生成全面的旅行计划。
  • 深入数据分析: 对股票和企业进行彻底的分析。
  • 研究报告生成: 生成关于各种主题的报告。
  • 游戏设计: 构思和设计游戏。
  • 互动教育课程: 开发引人入胜的学习体验。

用户将Manus描述为一个多方面的工具,结合了深度研究能力、自主操作、计算机使用功能以及配备内存的编码Agent。

用户体验和性能基准测试

正如一些人所说,除了其“令人兴奋”的Agent能力外,Manus还因其用户体验(UX)而受到称赞。Hugging Face的产品负责人Victor Mustar指出:“用户体验是许多其他产品所承诺的,但这一次它确实有效。”Manus的设计还结合了人工监督,需要对各种操作进行批准和授权。

Manus还在GAIA基准测试中进行了测试,该基准测试评估通用AI助手解决现实世界问题的能力。根据报告的结果,Manus表现出优于OpenAI的Deep Research的性能。

‘Wrapper’之争与Manus的价值

在最初的兴奋浪潮过去几天后,X(以前的Twitter)上的一些用户发现Manus是在Anthropic的Claude Sonnet模型以及Browser Use等其他工具之上运行的。这一发现引起了一些失望,一些批评者认为Manus缺乏独特的“护城河”或竞争优势。

事实上,Manus为了实现其令人印象深刻的功能,充当了现有最先进AI模型的“Wrapper”。然而,这种方法在社交媒体上却遭遇了一些奇怪的负面看法。最终,Manus成功地创建了一个精心设计的界面,有效地利用了基础AI模型的Agent潜力。

OpenAI的专业人士Aidan McLaughlin在X上评论说,“Wrapper”方面并不是一个重大问题。他强调说:“如果它创造了价值,就值得我尊重。关心的是能力,而不是架构。”

此外,对Manus的初步评论强调了当前AI模型尚未开发的潜力,甚至是开发它们的实验室都没有完全意识到的能力。GitGlance.co的创始人Richardson Dackam表示:“Manus不仅仅是在模型上添加了一个API。他们构建了一个自主系统,可以执行深度研究、深度思考和多步骤任务,这是其他AI无法做到的。”

这就提出了一个有趣的问题:如果Manus是建立在美国现有模型之上的,为什么这些模型的创建者自己不能提供类似的功能?AI研究员Dean W Ball表示:“我认为每个美国实验室都在幕后拥有这些或更好的能力,但由于风险规避而没有发布,其中一些风险来自监管风险。”

开源愿望和OpenManus的出现

Manus建立在现有LLM之上这一事实表明,它的功能有可能被复制。这一认识在X上的许多用户中引发了一波期待,一些人表示希望有一个开源版本。

这些希望似乎很快就得到了回应。GitHub上的一组开发人员已经创建了一个Manus的开源替代品,恰如其分地命名为“OpenManus”。该项目现在可以在GitHub上公开获得。

对Manus的批评和挑战

尽管受到了积极的评价,Manus也遇到了一些批评。一些用户报告说,Manus花了过多的时间来完成任务,在某些情况下,甚至未能完成任务。生物医学科学家Derya Unutmaz将Manus与OpenAI的Deep Research进行了比较,指出后者在15分钟内完成了任务,而Manus AI在50分钟后失败,卡在20个步骤中的第18步。

Klick Health的生成式AI执行副总裁Simon Smith将这些问题归因于Manus的底层模型可能不如OpenAI的Deep Research强大。他进一步表示,由于Manus使用了多个模型,它可能需要比Deep Research更多的时间来生成完整的报告。

另一位用户强调,Manus有时会在网络搜索过程中卡住,由于基于代码的任务的上下文问题而出现“中断”,并且表现出普遍的缓慢。

一些批评者还针对Manus的仅限邀请访问方式,认为邀请主要分发给社交媒体上的影响者以制造炒作。

Manus的未来和更广泛的AI格局

重要的是要认识到Manus仍处于开发的早期阶段,它可能会进一步完善和改进。然而,一个关键问题仍然存在:OpenAI、Anthropic甚至Google等主要参与者还需要多久才能推出一个更广泛可用的Manus当前提供的版本?Manus的出现有力地证明了AI Agent的潜力,以及创建用户友好界面以释放现有AI模型能力的价值。虽然存在挑战和批评,但Manus代表了AI驱动工具发展的重要一步,以及它们处理复杂、现实世界任务的能力。OpenManus的开发进一步强调了社区对探索和扩展这种AI Agent新方法所带来的可能性的兴趣。未来可能会看到该领域的持续创新和竞争,推动更复杂和更易于访问的AI Agent的开发。