Manus: 반짝 인기일까, 중국 AI의 미래일까?

과대 광고의 해부: Manus 해체하기

Manus의 등장은 갑작스러운 것이 아닙니다. 보고서에 따르면 이 플랫폼은 처음부터 새로 만든 것이 아니라 기존의 미세 조정된 AI 모델들을 정교하게 엮은 것입니다. Anthropic의 Claude와 Alibaba의 Qwen과 같은 모델의 기능을 활용하여 연구 보고서 생성부터 복잡한 재무 문서 분석에 이르기까지 다양한 작업을 수행하는 것으로 알려졌습니다.

그러나 Manus를 개발한 중국 회사 The Butterfly Effect는 웹사이트에서 훨씬 더 야심 찬 그림을 그리고 있습니다. 이 플랫폼은 부동산 취득 및 비디오 게임 프로그래밍과 같은 다양한 기능을 수행할 수 있다고 홍보하는데, 이는 언뜻 보기에는 환상에 가까워 보입니다.

과감한 주장과 바이럴 비디오: 인식의 힘

Manus의 연구 책임자인 Yichao ‘Peak’ Ji는 X(이전 Twitter)에 올린 바이럴 비디오에서 과대 광고를 더욱 부추겼습니다. 그는 Manus를 OpenAI의 deep research 및 Operator를 포함한 기존 에이전트 도구보다 우수한 대안으로 제시했습니다. Ji는 Manus가 일반 AI 어시스턴트를 평가하는 데 널리 사용되는 벤치마크인 GAIA에서 deep research보다 뛰어나다고 주장했습니다. 이 벤치마크는 AI가 웹을 탐색하고 소프트웨어와 상호 작용하는 등 실제 작업을 수행하는 능력을 테스트합니다.

Ji는 비디오에서 “[Manus]는 단순한 챗봇이나 워크플로우가 아닙니다.”라고 말했습니다. “이것은 개념과 실행 사이의 격차를 해소하는 완전히 자율적인 에이전트입니다 […]. 우리는 이것을 인간-기계 협업의 다음 패러다임으로 봅니다.” 이것은 참으로 대담한 주장이며, 플랫폼이 빠르게 입소문을 타는 데 크게 기여했습니다.

현실 점검: 사용자 경험은 다른 그림을 그립니다.

Manus의 설계자와 일부 영향력 있는 사람들은 칭찬을 아끼지 않았지만, 초기 사용자 경험은 덜 긍정적인 이야기를 들려줍니다. 플랫폼의 기능에 대한 의문을 제기하는 결함, 제한 사항 및 완전한 실패에 대한 보고가 나오기 시작했습니다.

AI 스타트업 Pleias의 공동 설립자인 Alexander Doria는 X에서 Manus에 대한 좋지 않은 경험을 공유했습니다. 그는 테스트 중에 답답한 오류 메시지와 끝없는 루프를 경험했습니다. 다른 사용자들도 이러한 우려를 표명하며 Manus의 사실 오류, 일관성 없는 인용 관행, 온라인에서 쉽게 찾을 수 있는 정보를 간과하는 경향을 지적했습니다.

개인적인 경험: 좌절에 대한 직접적인 설명

Manus를 테스트하려는 필자의 시도 역시 실망스러운 결과를 낳았습니다. 필자는 배달 반경 내에 있는 평점이 높은 패스트푸드점에서 프라이드 치킨 샌드위치를 주문하는 간단한 요청으로 시작했습니다. 10분을 기다린 후 플랫폼이 다운되었습니다. 두 번째 시도에서는 기준에 맞는 메뉴 항목이 나왔지만 Manus는 주문을 완료하거나 결제 링크를 제공할 수 없었습니다.

이에 굴하지 않고 필자는 Manus에게 근처 레스토랑에 1인용 테이블을 예약하도록 요청했습니다. 몇 분 후 다시 실패했습니다. 마지막으로 필자는 플랫폼에 나루토에서 영감을 받은 격투 게임을 만들도록 요청했습니다. 30분 동안 처리한 후 오류가 발생하여 실험이 종료되었습니다.

회사의 대응: 성장통 인정

Manus 대변인은 TechCrunch에 제공한 성명에서 플랫폼의 현재 한계를 인정했습니다.

“소규모 팀으로서 우리의 초점은 Manus를 지속적으로 개선하고 사용자가 실제로 문제를 해결하는 데 도움이 되는 AI 에이전트를 만드는 것입니다 […]. 현재 클로즈드 베타의 주요 목표는 시스템의 다양한 부분을 스트레스 테스트하고 문제를 식별하는 것입니다. 모든 분들이 공유해주신 귀중한 통찰력에 깊이 감사드립니다.”

이 성명은 문제를 인정하면서도 플랫폼의 초기 액세스 특성을 강조합니다. 현재 버전은 광범위하게 채택할 준비가 된 세련된 제품이라기보다는 스트레스 테스트에 가깝다는 것을 시사합니다.

과대 광고 주기: 독점성, 잘못된 정보 및 국가적 자부심

Manus가 현재 상태에서 명백한 결함이 있다면 왜 그렇게 많은 관심을 받았을까요? 이 현상에는 몇 가지 요인이 작용했습니다.

  • 독점성: 제한된 초대장 가용성은 독점적인 분위기를 조성하여 수요와 호기심을 높였습니다.
  • 미디어 버즈: 중국 언론 매체는 Manus를 중요한 AI 혁신으로 빠르게 칭송했으며, QQ News와 같은 간행물은 이를 ‘국내 제품의 자부심’이라고 칭송했습니다.
  • 소셜 미디어 증폭: 소셜 미디어의 AI 인플루언서들은 Manus의 기능에 대한 때로는 부정확한 정보를 퍼뜨리는 데 중요한 역할을 했습니다. Manus가 여러 스마트폰 앱에서 원활하게 상호 작용하는 모습을 보여주는 것으로 알려진 널리 퍼진 비디오는 나중에 Ji에 의해 잘못된 표현으로 확인되었습니다.
  • DeepSeek와의 비교: X의 일부 영향력 있는 AI 계정은 Manus와 또 다른 중국 AI 회사인 DeepSeek를 비교했습니다. 그러나 이러한 비교는 전적으로 정확하지 않습니다. DeepSeek와 달리 The Butterfly Effect는 독점 모델을 개발하지 않았습니다. 또한 DeepSeek는 많은 기술을 오픈 소스로 공개했지만 Manus는 현재로서는 폐쇄형 시스템입니다.

약간의 의심: 초기 액세스 및 미래 잠재력

Manus는 현재 개발 초기 단계에 있다는 점을 다시 한번 강조하는 것이 중요합니다. The Butterfly Effect는 컴퓨팅 용량을 확장하고 보고된 문제를 해결하기 위해 적극적으로 노력하고 있다고 주장합니다. 그러나 현재로서는 Manus가 기술적 현실을 앞지르는 과대 광고의 강력한 예입니다. 플랫폼이 스스로 설정한 높은 기대치를 충족하도록 진화할 수 있을지는 미지수입니다. 잠재력은 분명히 있지만, 그 잠재력을 실현하기 위한 길은 어려움으로 가득 차 있는 것 같습니다. 현재 버전은 바이럴 비디오와 홍보 자료에 묘사된 원활하고 자율적인 에이전트와는 거리가 멉니다. 열망과 실행 사이의 격차는 여전히 큽니다.