Manus：基于Claude的新型AI Agent | zh-CN

Manus的出现及其能力

AI Agent领域发展迅速，最近出现了一系列活动，让人想起DeepSeek现象。一家来自中国深圳的初创公司Manus推出了一款名为“通用AI Agent”的产品，在AI社区内引发了广泛的讨论和兴奋。

Manus的设计目标是成为一个多功能的AI Agent，能够自主规划、执行并交付全面的结果。该Agent可以实时与网站交互，处理各种类型的数据，并利用一套工具来实现其目标。

尽管处于邀请测试阶段，Manus凭借其令人印象深刻的能力迅速获得了关注。Menlo Ventures的负责人Deedy Das称赞Manus说：“Manus，这个每个人都在谈论的新AI产品，值得大肆宣传。这就是我们所期待的AI Agent。”Das强调，该Agent能够将通常需要两周专业工作的时间缩短到大约一小时。

技术控股公司Tiny的联合创始人Andrew Wilkinson表达了类似的看法，他说：“我感觉自己穿越到了六个月后的未来。”Wilkinson甚至分享了他让Manus开发并替代一个软件解决方案的任务，他的公司目前每年为此花费6000美元。

Manus展示了广泛的功能，包括：

详细行程创建： 生成全面的旅行计划。
深入数据分析： 对股票和企业进行彻底的分析。
研究报告生成： 生成关于各种主题的报告。
游戏设计： 构思和设计游戏。
互动教育课程： 开发引人入胜的学习体验。

用户将Manus描述为一个多方面的工具，结合了深度研究能力、自主操作、计算机使用功能以及配备内存的编码Agent。

用户体验和性能基准测试

正如一些人所说，除了其“令人兴奋”的Agent能力外，Manus还因其用户体验（UX）而受到称赞。Hugging Face的产品负责人Victor Mustar指出：“用户体验是许多其他产品所承诺的，但这一次它确实有效。”Manus的设计还结合了人工监督，需要对各种操作进行批准和授权。

Manus还在GAIA基准测试中进行了测试，该基准测试评估通用AI助手解决现实世界问题的能力。根据报告的结果，Manus表现出优于OpenAI的Deep Research的性能。

‘Wrapper’之争与Manus的价值

在最初的兴奋浪潮过去几天后，X（以前的Twitter）上的一些用户发现Manus是在Anthropic的Claude Sonnet模型以及Browser Use等其他工具之上运行的。这一发现引起了一些失望，一些批评者认为Manus缺乏独特的“护城河”或竞争优势。

事实上，Manus为了实现其令人印象深刻的功能，充当了现有最先进AI模型的“Wrapper”。然而，这种方法在社交媒体上却遭遇了一些奇怪的负面看法。最终，Manus成功地创建了一个精心设计的界面，有效地利用了基础AI模型的Agent潜力。

OpenAI的专业人士Aidan McLaughlin在X上评论说，“Wrapper”方面并不是一个重大问题。他强调说：“如果它创造了价值，就值得我尊重。关心的是能力，而不是架构。”

此外，对Manus的初步评论强调了当前AI模型尚未开发的潜力，甚至是开发它们的实验室都没有完全意识到的能力。GitGlance.co的创始人Richardson Dackam表示：“Manus不仅仅是在模型上添加了一个API。他们构建了一个自主系统，可以执行深度研究、深度思考和多步骤任务，这是其他AI无法做到的。”

这就提出了一个有趣的问题：如果Manus是建立在美国现有模型之上的，为什么这些模型的创建者自己不能提供类似的功能？AI研究员Dean W Ball表示：“我认为每个美国实验室都在幕后拥有这些或更好的能力，但由于风险规避而没有发布，其中一些风险来自监管风险。”

开源愿望和OpenManus的出现

Manus建立在现有LLM之上这一事实表明，它的功能有可能被复制。这一认识在X上的许多用户中引发了一波期待，一些人表示希望有一个开源版本。

这些希望似乎很快就得到了回应。GitHub上的一组开发人员已经创建了一个Manus的开源替代品，恰如其分地命名为“OpenManus”。该项目现在可以在GitHub上公开获得。

对Manus的批评和挑战

尽管受到了积极的评价，Manus也遇到了一些批评。一些用户报告说，Manus花了过多的时间来完成任务，在某些情况下，甚至未能完成任务。生物医学科学家Derya Unutmaz将Manus与OpenAI的Deep Research进行了比较，指出后者在15分钟内完成了任务，而Manus AI在50分钟后失败，卡在20个步骤中的第18步。

Klick Health的生成式AI执行副总裁Simon Smith将这些问题归因于Manus的底层模型可能不如OpenAI的Deep Research强大。他进一步表示，由于Manus使用了多个模型，它可能需要比Deep Research更多的时间来生成完整的报告。

另一位用户强调，Manus有时会在网络搜索过程中卡住，由于基于代码的任务的上下文问题而出现“中断”，并且表现出普遍的缓慢。

一些批评者还针对Manus的仅限邀请访问方式，认为邀请主要分发给社交媒体上的影响者以制造炒作。

Manus的未来和更广泛的AI格局

重要的是要认识到Manus仍处于开发的早期阶段，它可能会进一步完善和改进。然而，一个关键问题仍然存在：OpenAI、Anthropic甚至Google等主要参与者还需要多久才能推出一个更广泛可用的Manus当前提供的版本？Manus的出现有力地证明了AI Agent的潜力，以及创建用户友好界面以释放现有AI模型能力的价值。虽然存在挑战和批评，但Manus代表了AI驱动工具发展的重要一步，以及它们处理复杂、现实世界任务的能力。OpenManus的开发进一步强调了社区对探索和扩展这种AI Agent新方法所带来的可能性的兴趣。未来可能会看到该领域的持续创新和竞争，推动更复杂和更易于访问的AI Agent的开发。

更新于 2025-03-11

# Anthropic # Claude # Agent