Manus:中国AIの未来か、一過性の流行か?

ハイプの構造:Manusを解剖する

Manusの登場は、突然変異ではありません。 報道によると、このプラットフォームはゼロから構築されたものではなく、既存のAIモデルを微調整して組み合わせたものです。AnthropicのClaudeやAlibabaのQwenなどのモデルの機能を活用し、調査レポートの作成から財務書類の複雑な分析まで、さまざまなタスクに利用していると報じられています。

しかし、Manusを開発した中国企業The Butterfly Effectは、そのウェブサイトで、はるかに野心的なビジョンを描いています。 不動産取得やビデオゲームプログラミングなど、多岐にわたる能力を持つと宣伝されていますが、これらの主張は、一見すると、空想の域を出ないように見えます。

大胆な主張とバイラルビデオ:認識の力

Manusの研究リーダーであるYichao ‘Peak’ Ji氏は、X(旧Twitter)でバイラルビデオを公開し、さらに誇大宣伝を煽りました。 彼は、Manusを、OpenAIのdeep researchやOperatorを含む既存のエージェント型ツールよりも優れた代替手段として位置づけました。 Ji氏は、Manusが、一般的なAIアシスタントの評価に広く使用されているベンチマークであるGAIAにおいて、deep researchを凌駕すると主張しました。 このベンチマークは、AIがウェブをナビゲートしたり、ソフトウェアと対話したりするなど、現実世界のタスクを実行する能力を調査します。

「[Manus]は、単なるチャットボットやワークフローではありません」とJi氏はビデオで宣言しました。「これは、概念と実行の間のギャップを埋める完全に自律的なエージェントです[…]。私たちは、これを人間と機械のコラボレーションの次のパラダイムと見なしています。」 これらは確かに大胆な主張であり、プラットフォームが急速にバイラルな名声を得るのに大きく貢献しました。

現実確認:ユーザーエクスペリエンスは異なる状況を描く

Manusの開発者や一部の影響力のある人々がその賞賛を歌っている一方で、初期のユーザーエクスペリエンスは、あまり好ましくない状況を示しています。 グリッチ、制限、そして完全な失敗の報告が表面化し始め、プラットフォームの能力に疑問の影を投げかけています。

AIスタートアップPleiasの共同創設者であるAlexander Doria氏は、XでManusとのあまり良くない経験を共有しました。 彼は、テスト中にエラーメッセージと無限ループの集中砲火に遭遇しました。 他のユーザーもこれらの懸念を繰り返し、Manusの事実誤認の傾向、一貫性のない引用方法、オンラインで容易に入手できる情報を見落とす傾向を指摘しています。

個人的な遭遇:フラストレーションの直接的な説明

私自身がManusを試してみたところ、同様に残念な結果が得られました。 私は、配達範囲内にある高評価のファーストフードレストランでフライドチキンサンドイッチを注文するという、一見単純なリクエストから始めました。 10分待った後、プラットフォームはクラッシュしました。 2回目の試行では、私の基準に一致するメニュー項目が表示されましたが、Manusは注文を完了することも、チェックアウトリンクを提供することもできませんでした。

めげずに、私はManusに近くのレストランで1人分のテーブルを予約するように依頼しました。 再び、数分後に失敗しました。 最後に、私はプラットフォームにナルトに触発された格闘ゲームを構築するように挑戦しました。 30分間の処理の後、エラーが発生し、事実上私の実験は終了しました。

会社の対応:成長の痛みを認める

Manusの広報担当者は、TechCrunchに提供された声明の中で、プラットフォームの現在の制限を認めました。

「小規模なチームとして、私たちの焦点はManusを改善し続け、ユーザーが問題を解決するのに実際に役立つAIエージェントを作成することです[…]。現在のクローズドベータの主な目標は、システムのさまざまな部分をストレステストし、問題を特定することです。 皆様から共有された貴重な洞察に深く感謝いたします。」

この声明は、問題を認めている一方で、プラットフォームの早期アクセス性も強調しています。 これは、現在のバージョンが、広く採用できる洗練された製品というよりも、ストレステストに近いものであることを示唆しています。

ハイプサイクル:独占性、誤報、そして国家の誇り

Manusが現在の状態で明らかに欠陥がある場合、なぜこれほど注目を集めているのでしょうか? いくつかの要因がこの現象に寄与しています。

  • 独占性: 招待状の数が限られているため、独占性のオーラが生まれ、需要と好奇心が高まっています。
  • メディアの話題: 中国のメディアは、Manusを重要なAIのブレークスルーとして迅速に取り上げ、QQ Newsなどの出版物は「国産品の誇り」と称賛しています。
  • ソーシャルメディアの増幅: ソーシャルメディア上のAIインフルエンサーは、Manusの機能に関する不正確な情報を広める上で重要な役割を果たしました。 広く流布されたビデオは、Manusが複数のスマートフォンアプリ間でシームレスに相互作用している様子を示しているとされていましたが、後にJi氏によって誤りであることが確認されました。
  • DeepSeekとの比較: Xの一部の影響力のあるAIアカウントは、ManusとDeepSeek(別の中国のAI企業)を比較しています。 ただし、これらの比較は完全に正確ではありません。 DeepSeekとは異なり、The Butterfly Effectは独自のモデルを開発していません。 さらに、DeepSeekは多くのテクノロジーをオープンソース化していますが、Manusは今のところクローズドシステムです。

鵜呑みにしないこと:早期アクセスと将来の可能性

Manusは現在、開発の非常に初期段階にあることを繰り返し強調することが重要です。 The Butterfly Effectは、コンピューティング能力を拡張し、報告された問題に対処するために積極的に取り組んでいると主張しています。 しかし、現状では、Manusは、技術的な現実を上回る誇大宣伝の強力な例として機能します。 プラットフォームが、自ら設定した高い期待に応えるように進化できるかどうかは、まだわかりません。 潜在能力は間違いなくありますが、その潜在能力を実現するための道は、課題に満ちているようです。 現在のバージョンは、バイラルビデオや販促資料に描かれているシームレスで自律的なエージェントとはかけ離れています。 願望と実行の間のギャップは依然として大きいです。