炒作或突破?中國新創推出'Manus',號稱'全球首款'全自主AI Agent

AI 互動的新途徑

Manus 上週進入了僅限邀請的早期訪問階段。儘管可用性有限,但它已引起了廣泛關注,可與中國另一款著名的 AI DeepSeek 的發布相提並論。這種興奮是由幾個因素推動的:

  • 業界領袖的認可: Hugging Face 的產品負責人稱讚 Manus 是「我試過的最令人印象深刻的 AI 工具」。
  • 專家認可: AI 政策研究員 Dean Ball 將其描述為「使用 AI 的最複雜的電腦」。
  • 社群迅速增長: Manus 的官方 Discord 伺服器在幾天內迅速積累了超過 138,000 名成員。
  • 高需求: 據報導,該平台的邀請在中國市場閒魚上以數千美元的價格出售。

這些反應突顯了人們對 Manus 的期待及其顛覆當前 AI 格局的潛力。Manus 的核心區別在於其操作模式。傳統的 AI 以請求-回應為基礎運作,需要使用者提供特定的提示,然後等待產生的回應。然而,Manus 的運作方式不同。它旨在處理背景中的複雜任務,僅在完成分配的工作後才通知使用者。

真實世界的應用和能力

為了說明其功能,請考慮使用者要求 Manus 尋找公寓的場景。與傳統的搜尋方法甚至現有的 AI 助理不同,Manus 可以進行全面的分析。這可能包括:

  1. 房地產市場分析: 評估所需區域的當前趨勢、價格和可用性。
  2. 犯罪率評估: 調查不同社區的安全和保障。
  3. 氣候條件評估: 考慮天氣模式和環境因素。
  4. 財務可行性: 根據使用者的財務狀況確定負擔能力。
  5. 個人化建議: 根據使用者的偏好和優先事項提供量身定制的建議。

這種程度的自主分析和決策使 Manus 脫穎而出。它展示了向更主動、更少被動的 AI 模式的轉變。

基準測試和性能

根據 Manus 背後的開發者之一 Yizhao ‘Pika’ Ji 的說法,該 AI 在 GAIA 基準測試中優於 OpenAI 的 Deep Research 和 Operator。該基準測試專門用於評估 AI 與瀏覽器互動、使用軟體和執行複雜任務的能力。Ji 強調 Manus「不只是一個聊天機器人」。他將其定位為「一個完全自主的代理,彌合了概念和執行之間的差距」,表明人機協作方式的重大轉變。他進一步設想 Manus 是「人機協作的下一個典範」。

早期測試者的回饋和挑戰

儘管有大量的炒作和雄心勃勃的聲明,但早期測試者報告了一些重大問題。新創公司 Pleias 的聯合創始人 Oleksandr Doria 指出,在測試期間,Manus 遇到了錯誤並經歷了無休止的重啟循環。這些報告表明,該系統雖然很有前景,但尚未完全穩定或可靠。

此外,X(前身為 Twitter)上的許多使用者指出 Manus 存在事實錯誤。人們還對其正確引用來源的能力表示擔憂,使用者注意到明顯的資訊被遺漏的情況。這引發了人們對 Manus 提供的資訊的準確性和可信度的質疑。

解決問題

Manus 的一位代表在給 TechCrunch 的評論中承認了這些批評。他們說:

「作為一個小團隊,我們的重點是不斷改進 Manus,並製造出真正幫助使用者解決問題的 AI 代理。目前封閉測試的主要目標是對系統的各個部分進行壓力測試並找出問題。我們非常感謝大家分享的寶貴見解。」

此回應表明他們意識到現有問題並承諾解決這些問題。開發人員還表示他們打算擴大計算能力並解決已發現的問題。

一個有前途但不完整的產品

然而,必須認識到,在開發的早期階段,Manus 似乎更像是一個實驗,而不是一個完全完善的技術產品。雖然改變遊戲規則的 AI 的潛力顯而易見,但目前的現實表明,Manus 更準確地說是一個概念驗證,而不是一個準備好廣泛採用的、功能齊全的 AI 代理。報告的缺陷和不一致之處突顯了在 Manus 真正實現其雄心勃勃的目標之前,需要進一步開發和完善。從有前途的原型到可靠且強大的 AI 代理的過程通常是漫長而複雜的,而 Manus 似乎正處於該旅程的起點。未來幾個月和幾年對於確定它是否能夠克服挑戰並發揮其潛力至關重要。
代理設計的創新使其能夠自主工作,這與傳統的互動模式明顯不同。Manus 不僅僅是回應提示,而是採取主動,分析情況、制定計劃並在沒有持續的人為指導下執行它們。

圍繞 Manus 的熱情不僅僅基於理論能力。AI 社群中知名人士的反應及其使用者群的快速增長為其感知潛力提供了切實的證據。該平台的邀請在二級市場上價格高昂,這一事實進一步凸顯了人們的興趣和期待程度。

然而,早期測試者的報告引入了一個重要的謹慎因素。技術困難、錯誤和不準確的經歷不容忽視。這些問題突顯了開發如此先進的 AI 系統所固有的挑戰,並提醒人們,創建真正自主和可靠的 AI 代理的道路充滿了障礙。

開發人員對批評的回應令人鼓舞。他們承認問題並承諾改進,表明他們願意從回饋中學習並完善他們的創作。在封閉測試階段強調壓力測試和識別問題是軟體開發中的標準做法,並表明採用有條不紊的方法來解決缺點。

最終的問題仍然是:Manus 能否克服這些最初的障礙並兌現其承諾?答案在於系統的未來開發和完善。Manus 目前的狀態突顯了 AI 領域雄心與實用性之間固有的張力。雖然完全自主的 AI 代理的願景引人注目,但創建這樣一個系統的現實是複雜且要求很高的。Manus 是 AI 持續發展的一個有價值的案例研究,展示了突破可能性的潛力和挑戰。該項目的未來發展軌跡將受到 AI 社群的密切關注,並且無疑將為自主 AI 系統的開發提供寶貴的見解。目前的局限性不一定會否定長期潛力,但它們確實強調了持續進行嚴格測試、開發和完善的必要性。