炒作的剖析:解構 Manus
Manus 的出現並非憑空而來。報導指出,該平台並非從零開始打造,而是由現有和微調過的 AI 模型精心編織而成。據報導,它利用了 Anthropic 的 Claude 和阿里巴巴的 Qwen 等模型的能力,將其用於研究報告生成到財務文件複雜分析等任務。
然而,Manus 背後的中國公司 The Butterfly Effect 在其網站上描繪了一幅更為雄心勃勃的藍圖。該平台被吹捧為能夠完成房地產收購和電子遊戲編程等各種任務——乍看之下,這些說法似乎近乎天方夜譚。
大膽的聲明和病毒式影片:感知的力量
Manus 的研究負責人 Yichao ‘Peak’ Ji 在 X(前身為 Twitter)上發布的一段病毒式影片進一步助長了炒作。他將 Manus 定位為現有 Agentic 工具的卓越替代品,包括 OpenAI 的 deep research 和 Operator。Ji 聲稱 Manus 在 GAIA(一種廣泛用於評估通用 AI 助手的基準)上優於 deep research。該基準測試 AI 通過瀏覽網頁、與軟體交互等方式執行實際任務的能力。
「[Manus] 不僅僅是另一個聊天機器人或工作流程,」Ji 在影片中宣稱。「它是一個完全自主的代理,彌合了概念和執行之間的差距 […]。我們將其視為人機協作的下一個範式。」 這些確實是大膽的聲明,它們對該平台迅速躥紅起到了重要作用。
現實檢驗:用戶體驗描繪了不同的景象
雖然 Manus 的架構師和一些有影響力的人士對其讚不絕口,但早期的用戶體驗卻講述了一個不那麼討人喜歡的故事。關於故障、限制和徹底失敗的報告已經開始浮出水面,給該平台所謂的能力蒙上了一層陰影。
AI 初創公司 Pleias 的聯合創始人 Alexander Doria 在 X 上分享了他對 Manus 不太理想的體驗。他在測試過程中遇到了一連串令人沮喪的錯誤訊息和無限循環。其他用戶也表達了類似的擔憂,指出 Manus 容易出現事實錯誤、引文做法不一致,以及傾向於忽略網路上隨手可得的資訊。
個人遭遇:令人沮喪的第一手資料
我自己嘗試讓 Manus 接受考驗,結果同樣令人失望。我從一個看似簡單的請求開始:從我配送範圍內一家評價很高的快餐店訂購一份炸雞三明治。等待十分鐘後,平台崩潰了。第二次嘗試產生了一個符合我標準的菜單項,但 Manus 無法完成訂單,甚至無法提供結帳連結。
我不氣餒,讓 Manus 在附近的一家餐廳預訂一張單人桌。幾分鐘後,再次失敗。最後,我要求平台構建一款以火影忍者為靈感的格鬥遊戲。經過半小時的處理,它拋出了一個錯誤,有效地結束了我的實驗。
公司的回應:承認成長的煩惱
Manus 的一位發言人在提供給 TechCrunch 的一份聲明中承認了該平台目前的局限性:
「作為一個小團隊,我們的重點是不斷改進 Manus,並製造出真正幫助用戶解決問題的 AI 代理 […]。目前封閉 Beta 測試的主要目標是對系統的各個部分進行壓力測試並找出問題。我們非常感謝大家分享的寶貴見解。」
這份聲明雖然承認了這些問題,但也強調了該平台的早期訪問性質。它表明,當前版本更像是一個壓力測試,而不是一個準備好廣泛採用的成熟產品。
炒作週期:排他性、錯誤訊息和民族自豪感
如果 Manus 在目前狀態下存在明顯缺陷,為什麼它會引起如此強烈的關注?有幾個因素促成了這種現象:
- **排他性:**有限的邀請名額營造了一種排他性的氛圍,推高了需求和好奇心。
- **媒體熱議:**中國媒體迅速將 Manus 譽為重大的 AI 突破,像 QQ News 這樣的出版物稱其為「國產產品的驕傲」。
- **社交媒體放大:**社交媒體上的 AI 影響者在傳播關於 Manus 能力的訊息方面發揮了重要作用,有時甚至是錯誤的訊息。一段廣泛流傳的影片,據稱展示了 Manus 在多個智能手機應用程式之間的無縫交互,後來被 Ji 確認為失實陳述。
- **與 DeepSeek 的比較:**X 上的一些有影響力的 AI 帳戶將 Manus 與另一家中國 AI 公司 DeepSeek 進行了比較。然而,這些比較並不完全準確。與 DeepSeek 不同,The Butterfly Effect 沒有開發任何專有模型。此外,雖然 DeepSeek 已經開源了其許多技術,但 Manus 目前仍然是一個封閉系統。
一點保留:早期訪問和未來潛力
必須重申的是,Manus 目前處於非常早期的開發階段。The Butterfly Effect 堅稱,它正在積極擴展計算能力並解決報告的問題。然而,就目前而言,Manus 是炒作超越技術現實的一個有力例子。該平台能否發展到滿足其為自己設定的崇高期望還有待觀察。潛力無疑是存在的,但實現這一潛力的道路似乎充滿挑戰。目前的版本與病毒式影片和宣傳材料中描述的無縫、自主代理相去甚遠。願望與執行之間的差距仍然很大。
炒作的本質:解構Manus
Manus的出現並非偶然。 報導指出,這個平台並非從頭開始建立,而是由現有和經過微調的AI模型精心編織而成。 據悉,它利用了Anthropic的Claude和阿里巴巴的Qwen等模型的能力,將其應用於從研究報告生成到財務文件複雜分析等任務。
然而,Manus背後的中國公司The Butterfly Effect在其網站上描繪了一幅更加雄心勃勃的圖景。 該平台被吹捧為能夠完成房地產收購和電子遊戲編程等各種任務——乍一看,這些說法似乎近乎天方夜譚。
大膽的宣稱與病毒式傳播的影片:認知的力量
Manus的研究負責人Yichao ‘Peak’ Ji在X(前身為Twitter)上發布的一段病毒式傳播的影片進一步助長了炒作。 他將Manus定位為現有Agentic工具的卓越替代品,包括OpenAI的deep research和Operator。 Ji聲稱Manus在GAIA(一種廣泛用於評估通用AI助手的基準)上優於deep research。 該基準測試AI通過瀏覽網頁、與軟體交互等方式執行實際任務的能力。
「[Manus]不僅僅是另一個聊天機器人或工作流程,」Ji在影片中宣稱。 「它是一個完全自主的代理,彌合了概念和執行之間的差距[…]。 我們將其視為人機協作的下一個範式。」 這些確實是大膽的聲明,它們對該平台迅速躥紅起到了重要作用。
現實檢驗:用戶體驗描繪出不同的圖景
儘管Manus的架構師和一些有影響力的人士對其讚不絕口,但早期的用戶體驗卻講述了一個不那麼討人喜歡的故事。 關於故障、限制和徹底失敗的報告已經開始浮出水面,給該平台所謂的能力蒙上了一層陰影。
AI初創公司Pleias的聯合創始人Alexander Doria在X上分享了他對Manus不太理想的體驗。 他在測試過程中遇到了一連串令人沮喪的錯誤訊息和無限循環。 其他用戶也表達了類似的擔憂,指出Manus容易出現事實錯誤、引文做法不一致,以及傾向於忽略網路上隨手可得的資訊。
親身經歷:令人沮喪的第一手記錄
我自己嘗試讓Manus接受考驗,結果同樣令人失望。 我從一個看似簡單的請求開始:從我配送範圍內一家評價很高的快餐店訂購一份炸雞三明治。 等待十分鐘後,平台崩潰了。 第二次嘗試產生了一個符合我標準的菜單項,但Manus無法完成訂單,甚至無法提供結帳連結。
我不氣餒,讓Manus在附近的一家餐廳預訂一張單人桌。 幾分鐘後,再次失敗。 最後,我要求平台構建一款以火影忍者為靈感的格鬥遊戲。 經過半小時的處理,它拋出了一個錯誤,有效地結束了我的實驗。
公司的回應:承認成長的陣痛
Manus的一位發言人在提供給TechCrunch的一份聲明中承認了該平台目前的局限性:
「作為一個小團隊,我們的重點是不斷改進Manus,並製造出真正幫助用戶解決問題的AI代理[…]。 目前封閉Beta測試的主要目標是對系統的各個部分進行壓力測試並找出問題。 我們非常感謝大家分享的寶貴見解。」
這份聲明雖然承認了這些問題,但也強調了該平台的早期訪問性質。 它表明,當前版本更像是一個壓力測試,而不是一個準備好廣泛採用的成熟產品。
炒作週期:獨佔性、錯誤訊息和民族自豪感
如果Manus在目前狀態下存在明顯缺陷,為什麼它會引起如此強烈的關注? 有幾個因素促成了這種現象:
- **獨佔性:**有限的邀請名額營造了一種獨佔性的氛圍,推高了需求和好奇心。
- **媒體熱議:**中國媒體迅速將Manus譽為重大的AI突破,像QQ News這樣的出版物稱其為「國產產品的驕傲」。
- **社交媒體放大:**社交媒體上的AI影響者在傳播關於Manus能力的訊息方面發揮了重要作用,有時甚至是錯誤的訊息。 一段廣泛流傳的影片,據稱展示了Manus在多個智慧手機應用程式之間的無縫交互,後來被Ji確認為失實陳述。
- **與DeepSeek的比較:**X上的一些有影響力的AI帳戶將Manus與另一家中國AI公司DeepSeek進行了比較。 然而,這些比較並不完全準確。 與DeepSeek不同,The Butterfly Effect沒有開發任何專有模型。 此外,雖然DeepSeek已經開源了其許多技術,但Manus目前仍然是一個封閉系統。
一點保留:早期訪問和未來潛力
必須重申的是,Manus目前處於非常早期的開發階段。 The Butterfly Effect堅稱,它正在積極擴展計算能力並解決報告的問題。 然而,就目前而言,Manus是炒作超越技術現實的一個有力例子。 該平台能否發展到滿足其為自己設定的崇高期望還有待觀察。 潛力無疑是存在的,但實現這一潛力的道路似乎充滿挑戰。 目前的版本與病毒式傳播的影片和宣傳材料中描述的無縫、自主代理相去甚遠。 願望與執行之間的差距仍然很大。