Manus 的崛起及其能力
AI 代理領域發展迅速,最近出現了一系列活動,讓人想起 DeepSeek 現象。一家來自中國深圳的新創公司 Manus,推出了一款被稱為「通用 AI 代理」的產品,在 AI 社群內引發了相當多的討論和興奮。
Manus 的創造旨在作為一個多功能的 AI 代理,能夠自主規劃、執行和交付全面的結果。該代理可以與網站即時互動,處理各種類型的數據,並利用一套工具來實現其目標。
儘管處於僅限邀請階段,Manus 憑藉其令人印象深刻的能力迅速獲得了關注。Menlo Ventures 的負責人 Deedy Das 稱讚 Manus,表示:「Manus,這個每個人都在談論的新 AI 產品,值得大肆宣傳。這就是我們所期待的 AI 代理。」Das 強調,該代理能夠將通常需要兩週專業工作的內容壓縮到大約一小時內完成。
科技控股公司 Tiny 的聯合創始人 Andrew Wilkinson 也表達了類似的看法,他說:「我覺得自己像是穿越到了六個月後的未來。」Wilkinson 甚至分享說,他讓 Manus 開發並替代了他公司目前每年花費 6,000 美元的軟體解決方案。
Manus 展示了廣泛的功能,包括:
- 詳細行程創建: 生成全面的旅行計劃。
- 深入數據分析: 對股票和企業進行徹底分析。
- 研究報告生成: 製作關於不同主題的報告。
- 遊戲設計: 構思和設計遊戲。
- 互動式教育課程: 開發引人入勝的學習體驗。
用戶將 Manus 描述為一個多方面的工具,結合了深度研究能力、自主操作、電腦使用功能以及配備記憶體的編碼代理。
用戶體驗和效能基準測試
正如一些人所說,除了其「令人興奮」的代理能力外,Manus 還因其用戶體驗 (UX) 而受到讚譽。Hugging Face 的產品負責人 Victor Mustar 指出:「用戶體驗是許多其他人承諾的,但這一次它確實有效。」Manus 的設計還納入了人工監督,需要對各種操作進行批准和許可。
Manus 還在 GAIA 基準測試中進行了測試,該基準測試評估通用 AI 助理解決現實世界問題的能力。根據報告的結果,Manus 表現出優於 OpenAI’s Deep Research 的性能。
「Wrapper」爭論和 Manus 的價值
在最初的興奮浪潮過後的幾天,X(以前的 Twitter)上的一些用戶發現 Manus 是在 Anthropic’s Claude Sonnet 模型之上運行的,同時還使用了 Browser Use 等其他工具。這一發現引起了一些失望的聲音,一些批評者認為 Manus 缺乏獨特的「護城河」或競爭優勢。
事實上,Manus 為了實現其令人印象深刻的功能,充當了圍繞一些最先進的 AI 模型的「包裝器」。然而,這種方法在社交媒體上有時會遇到一種奇怪的負面看法。最終,Manus 成功地創建了一個設計良好的介面,有效地利用了基礎 AI 模型的代理潛力。
OpenAI 的專業人士 Aidan McLaughlin 在 X 上評論說,「包裝器」方面並不是一個重要的問題。他強調說:「如果它創造了價值,就值得我尊重。關心的是能力,而不是架構。」
此外,對 Manus 的初步評論突出了當前 AI 模型尚未開發的潛力,即使是開發它們的實驗室也沒有完全意識到這些能力。GitGlance.co 的創始人 Richardson Dackam 表示:「Manus 不僅僅是在模型上附加了一個 API。他們建立了一個自主系統,可以執行深度研究、深度思考和多步驟任務,這是其他 AI 無法做到的。」
這提出了一個有趣的問題:如果 Manus 是建立在美國現有模型之上的,為什麼這些模型的創建者自己卻無法提供類似的功能?AI 研究員 Dean W Ball 認為:「我假設每個美國實驗室都在幕後擁有這些或更好的能力,但由於風險規避而沒有發布它們,其中一些風險來自監管風險。」
開源願景和 OpenManus 的出現
Manus 建立在現有 LLM 之上的事實表明,它的功能有可能被複製。這一認識在 X 上的許多用戶中引發了一波期待,一些人表示希望有一個開源版本。
這些希望似乎很快就得到了回應。GitHub 上的一群開發人員已經創建了一個 Manus 的開源替代品,恰如其分地命名為「OpenManus」。該專案現在可以在 GitHub 上公開獲得。
對 Manus 的批評和挑戰
儘管受到了積極的評價,Manus 也遇到了一些批評。一些用戶報告說,Manus 花費了過多的時間來完成任務,並且在某些情況下,根本無法完成任務。生物醫學科學家 Derya Unutmaz 將 Manus 與 OpenAI’s Deep Research 進行了比較,指出後者在 15 分鐘內完成了任務,而 Manus AI 在 50 分鐘後失敗,卡在 20 個步驟中的第 18 步。
Klick Health 的生成式 AI 執行副總裁 Simon Smith 將這些問題歸因於 Manus 的底層模型可能不如 OpenAI’s Deep Research 強大。他進一步表示,由於 Manus 使用多個模型,因此可能需要比 Deep Research 更多的時間來生成完整的報告。
另一位用戶強調,Manus 有時會在網路搜尋期間卡住,由於基於程式碼的任務的上下文問題而經歷「中間中斷」,並且表現出普遍的緩慢。
一些批評者還針對 Manus 的僅限邀請訪問方式,認為邀請主要是分發給社交媒體上的影響者以製造炒作。
Manus 的未來和更廣闊的 AI 格局
重要的是要承認 Manus 仍處於開發的早期階段,並且可能會進一步完善和改進。然而,一個關鍵問題仍然存在:OpenAI、Anthropic 甚至 Google 等主要參與者需要多長時間才能推出 Manus 目前提供的更廣泛使用的版本?Manus 的出現有力地證明了 AI 代理的潛力,以及創建用戶友好介面以釋放現有 AI 模型能力的價值。雖然存在挑戰和批評,但 Manus 代表了 AI 驅動工具演進的重要一步,以及它們處理複雜的現實世界任務的能力。OpenManus 的開發進一步強調了社群對探索和擴展這種 AI 代理新方法所呈現的可能性的興趣。未來可能會看到該領域的持續創新和競爭,推動更複雜和更易於訪問的 AI 代理的發展。