Manus: Thoáng qua hay tương lai AI Trung Quốc?

Giải Phẫu Sự Cường Điệu: Phân Tích Manus

Sự xuất hiện của Manus không phải là ngẫu nhiên. Các báo cáo chỉ ra rằng nền tảng này không phải là một sáng tạo từ đầu, mà là một tấm thảm phức tạp được dệt từ các mô hình AI hiện có và được tinh chỉnh. Nó được cho là tận dụng khả năng của các mô hình như Claude của Anthropic và Qwen của Alibaba, sử dụng chúng cho các nhiệm vụ khác nhau, từ tạo báo cáo nghiên cứu đến phân tích tài liệu tài chính phức tạp.

Tuy nhiên, The Butterfly Effect, công ty Trung Quốc đứng sau Manus, vẽ ra một bức tranh tham vọng hơn nhiều trên trang web của mình. Nền tảng này được quảng cáo là có khả năng thực hiện các kỳ công đa dạng như mua bất động sản và lập trình trò chơi điện tử – những tuyên bố mà thoạt nhìn có vẻ như là điều viển vông.

Những Tuyên Bố Táo Bạo và Video Lan Truyền: Sức Mạnh Của Nhận Thức

Yichao ‘Peak’ Ji, trưởng nhóm nghiên cứu của Manus, càng thổi bùng sự cường điệu trong một video lan truyền trên X (trước đây là Twitter). Anh ấy định vị Manus như một giải pháp thay thế vượt trội cho các công cụ đại diện hiện có, bao gồm nghiên cứu sâu của OpenAI và Operator. Ji khẳng định rằng Manus vượt trội hơn nghiên cứu sâu về GAIA, một chuẩn mực được sử dụng rộng rãi để đánh giá các trợ lý AI tổng quát. Chuẩn mực này thăm dò khả năng của AI trong việc thực hiện các nhiệm vụ trong thế giới thực bằng cách điều hướng web, tương tác với phần mềm, v.v.

‘[Manus] không chỉ là một chatbot hay quy trình làm việc khác,’ Ji tuyên bố trong video. ‘Nó là một tác nhân hoàn toàn tự chủ, thu hẹp khoảng cách giữa ý tưởng và thực hiện […]. Chúng tôi xem nó như mô hình tiếp theo của sự cộng tác giữa con người và máy móc.’ Đây là những tuyên bố táo bạo, và chúng đã góp phần đáng kể vào việc nền tảng này nhanh chóng trở nên nổi tiếng.

Kiểm Chứng Thực Tế: Trải Nghiệm Người Dùng Vẽ Ra Một Bức Tranh Khác

Trong khi các kiến trúc sư của Manus và một số tiếng nói có ảnh hưởng đã ca ngợi nó, thì những trải nghiệm ban đầu của người dùng lại kể một câu chuyện kém hấp dẫn hơn. Các báo cáo về trục trặc, hạn chế và thất bại hoàn toàn đã bắt đầu xuất hiện, làm dấy lên sự nghi ngờ về khả năng được cho là của nền tảng.

Alexander Doria, đồng sáng lập công ty khởi nghiệp AI Pleias, đã chia sẻ trải nghiệm không mấy tốt đẹp của mình với Manus trên X. Anh ấy đã gặp phải một loạt thông báo lỗi và vòng lặp vô tận trong quá trình thử nghiệm. Những người dùng khác cũng lặp lại những lo ngại này, chỉ ra xu hướng mắc lỗi thực tế của Manus, các phương pháp trích dẫn không nhất quán và xu hướng bỏ qua thông tin có sẵn trực tuyến.

Những Cuộc Gặp Gỡ Cá Nhân: Một Tài Khoản Trực Tiếp Về Sự Thất Vọng

Những nỗ lực của riêng tôi để đưa Manus vào thử nghiệm cũng mang lại kết quả đáng thất vọng tương tự. Tôi bắt đầu với một yêu cầu có vẻ đơn giản: đặt một chiếc bánh mì kẹp gà rán từ một nhà hàng thức ăn nhanh được đánh giá cao trong bán kính giao hàng của tôi. Sau mười phút chờ đợi, nền tảng bị sập. Lần thử thứ hai mang lại một món trong thực đơn phù hợp với tiêu chí của tôi, nhưng Manus tỏ ra không có khả năng hoàn thành đơn đặt hàng hoặc thậm chí cung cấp liên kết thanh toán.

Không nản lòng, tôi giao cho Manus nhiệm vụ đặt bàn cho một người tại một nhà hàng gần đó. Một lần nữa, thất bại xảy ra sau vài phút. Cuối cùng, tôi đã thách thức nền tảng này xây dựng một trò chơi chiến đấu lấy cảm hứng từ Naruto. Sau nửa giờ xử lý, nó báo lỗi, kết thúc hiệu quả thử nghiệm của tôi.

Phản Hồi Của Công Ty: Thừa Nhận Những Khó Khăn Đang Phát Triển

Một phát ngôn viên của Manus, trong một tuyên bố cung cấp cho TechCrunch, đã thừa nhận những hạn chế hiện tại của nền tảng:

‘Là một nhóm nhỏ, trọng tâm của chúng tôi là tiếp tục cải thiện Manus và tạo ra các tác nhân AI thực sự giúp người dùng giải quyết vấn đề […]. Mục tiêu chính của bản beta kín hiện tại là kiểm tra căng thẳng các phần khác nhau của hệ thống và xác định các vấn đề. Chúng tôi đánh giá sâu sắc những hiểu biết có giá trị được chia sẻ bởi tất cả mọi người.’

Tuyên bố này, trong khi thừa nhận các vấn đề, cũng nhấn mạnh tính chất truy cập sớm của nền tảng. Nó cho thấy rằng phiên bản hiện tại giống như một bài kiểm tra căng thẳng hơn là một sản phẩm hoàn thiện sẵn sàng để áp dụng rộng rãi.

Chu Kỳ Cường Điệu: Tính Độc Quyền, Thông Tin Sai Lệch và Niềm Tự Hào Dân Tộc

Nếu Manus, ở trạng thái hiện tại, rõ ràng là có sai sót, tại sao nó lại thu hút được sự chú ý mạnh mẽ như vậy? Một số yếu tố đã góp phần vào hiện tượng này:

  • Tính độc quyền: Số lượng lời mời hạn chế đã tạo ra một hào quang độc quyền, làm tăng nhu cầu và sự tò mò.
  • Tiếng vang truyền thông: Các phương tiện truyền thông Trung Quốc đã nhanh chóng coi Manus là một bước đột phá AI quan trọng, với các ấn phẩm như QQ News ca ngợi nó là ‘niềm tự hào của các sản phẩm nội địa.’
  • Khuếch đại truyền thông xã hội: Những người có ảnh hưởng AI trên mạng xã hội đã đóng một vai trò quan trọng trong việc lan truyền, đôi khi, thông tin không chính xác về khả năng của Manus. Một video được lan truyền rộng rãi, được cho là giới thiệu Manus tương tác liền mạch trên nhiều ứng dụng điện thoại thông minh, sau đó đã được Ji xác nhận là một sự xuyên tạc.
  • So sánh với DeepSeek: Một số tài khoản AI có ảnh hưởng trên X đã so sánh Manus với DeepSeek, một công ty AI khác của Trung Quốc. Tuy nhiên, những so sánh này không hoàn toàn chính xác. Không giống như DeepSeek, The Butterfly Effect không phát triển bất kỳ mô hình độc quyền nào. Hơn nữa, trong khi DeepSeek đã mở nguồn nhiều công nghệ của mình, Manus vẫn là một hệ thống đóng.

Một Hạt Muối: Truy Cập Sớm và Tiềm Năng Tương Lai

Điều quan trọng cần nhắc lại là Manus hiện đang ở giai đoạn phát triển rất sớm. The Butterfly Effect khẳng định rằng họ đang tích cực làm việc để mở rộng quy mô năng lực tính toán và giải quyết các vấn đề được báo cáo. Tuy nhiên, hiện tại, Manus đóng vai trò như một ví dụ điển hình về sự cường điệu vượt xa thực tế công nghệ. Vẫn còn phải xem liệu nền tảng này có thể phát triển để đáp ứng những kỳ vọng cao mà nó đã đặt ra cho chính mình hay không. Tiềm năng chắc chắn là có, nhưng con đường để hiện thực hóa tiềm năng đó dường như đầy rẫy những thách thức. Phiên bản hiện tại khác xa với tác nhân tự động, liền mạch được mô tả trong các video lan truyền và tài liệu quảng cáo. Khoảng cách giữa khát vọng và thực hiện vẫn còn rất lớn.