Sự cường điệu hay đột phá? Startup Trung Quốc ra mắt Manus, Đặc vụ AI tự động hoàn toàn ‘Đầu tiên trên thế giới’
The Butterfly Effect, một nhóm phát triển Trung Quốc, gần đây đã giới thiệu Manus, được ca ngợi là đặc vụ trí tuệ nhân tạo (AI) tự động hoàn toàn đầu tiên trên thế giới. Sản phẩm mới này khác biệt với các chatbot AI thông thường, chẳng hạn như ChatGPT, Gemini của Google hoặc Grok của xAI, tất cả đều phụ thuộc vào đầu vào của con người. Ngược lại, Manus có khả năng đưa ra quyết định và thực hiện các nhiệm vụ một cách độc lập mà không cần sự giám sát liên tục của con người.
Một cách tiếp cận mới trong tương tác AI
Manus đã bước vào giai đoạn truy cập sớm vào tuần trước theo hệ thống chỉ dành cho người được mời. Mặc dù tính khả dụng hạn chế này, nó đã tạo ra tiếng vang đáng kể, thu hút sự so sánh với sự ra mắt của DeepSeek, một AI đáng chú ý khác đến từ Trung Quốc. Sự phấn khích này được thúc đẩy bởi một số yếu tố:
- Sự ủng hộ từ các nhà lãnh đạo trong ngành: Người đứng đầu sản phẩm tại Hugging Face đã ca ngợi Manus là “công cụ AI ấn tượng nhất mà tôi từng thử”.
- Sự công nhận của chuyên gia: Nhà nghiên cứu chính sách AI Dean Ball mô tả nó là “máy tính phức tạp nhất sử dụng AI”.
- Sự phát triển nhanh chóng của cộng đồng: Máy chủ Discord chính thức của Manus đã nhanh chóng thu hút hơn 138.000 thành viên trong vòng vài ngày.
- Nhu cầu cao: Lời mời tham gia nền tảng này được cho là đang được bán với giá hàng nghìn đô la trên thị trường Trung Quốc Xianyu.
Những phản hồi này làm nổi bật sự mong đợi xung quanh Manus và tiềm năng của nó trong việc phá vỡ bối cảnh AI hiện tại. Sự khác biệt cốt lõi của Manus nằm ở mô hình hoạt động của nó. Các AI truyền thống hoạt động trên cơ sở yêu cầu-phản hồi, yêu cầu người dùng cung cấp các câu lệnh cụ thể và sau đó chờ đợi một phản hồi được tạo ra. Tuy nhiên, Manus hoạt động khác. Nó được thiết kế để xử lý các tác vụ phức tạp trong nền, chỉ thông báo cho người dùng khi hoàn thành công việc được giao.
Các ứng dụng và khả năng trong thế giới thực
Để minh họa khả năng của nó, hãy xem xét một tình huống trong đó người dùng giao nhiệm vụ cho Manus tìm một căn hộ. Không giống như các phương pháp tìm kiếm thông thường hoặc thậm chí các trợ lý AI hiện có, Manus có thể đi sâu vào phân tích toàn diện. Điều này có thể bao gồm:
- Phân tích thị trường bất động sản: Đánh giá xu hướng hiện tại, giá cả và tính khả dụng trong khu vực mong muốn.
- Đánh giá tỷ lệ tội phạm: Điều tra sự an toàn và an ninh của các khu dân cư khác nhau.
- Đánh giá điều kiện khí hậu: Xem xét các kiểu thời tiết và các yếu tố môi trường.
- Tính khả thi về tài chính: Xác định khả năng chi trả dựa trên tình hình tài chính của người dùng.
- Đề xuất được cá nhân hóa: Cung cấp các đề xuất phù hợp dựa trên sở thích và ưu tiên của người dùng.
Mức độ phân tích và ra quyết định tự động này làm cho Manus trở nên khác biệt. Nó thể hiện một sự chuyển hướng sang một mô hình AI chủ động hơn và ít phản ứng hơn.
Điểm chuẩn và hiệu suất
Theo Yizhao “Pika” Ji, một trong những nhà phát triển đứng sau Manus, AI này vượt trội hơn Deep Research và Operator của OpenAI trong bài kiểm tra GAIA. Bài kiểm tra này được thiết kế đặc biệt để đánh giá khả năng tương tác với trình duyệt, sử dụng phần mềm và thực hiện các tác vụ phức tạp của AI. Ji nhấn mạnh rằng Manus “không chỉ là một chatbot khác”. Ông định vị nó là “một đặc vụ hoàn toàn tự động thu hẹp khoảng cách giữa ý tưởng và thực thi”, gợi ý một sự thay đổi đáng kể trong cách con người và máy móc cộng tác. Ông còn hình dung Manus là “mô hình tiếp theo của sự hợp tác giữa người và máy”.
Phản hồi của người thử nghiệm sớm và những thách thức
Bất chấp sự cường điệu đáng kể và những tuyên bố đầy tham vọng, những người thử nghiệm ban đầu đã báo cáo một số vấn đề quan trọng. Oleksandr Doria, đồng sáng lập của startup Pleias, lưu ý rằng trong quá trình thử nghiệm, Manus đã gặp lỗi và trải qua các chu kỳ khởi động lại vô tận. Những báo cáo này cho thấy rằng hệ thống, mặc dù đầy hứa hẹn, nhưng vẫn chưa hoàn toàn ổn định hoặc đáng tin cậy.
Hơn nữa, nhiều người dùng trên X (trước đây là Twitter) đã chỉ ra rằng Manus mắc lỗi thực tế. Các mối quan ngại cũng đã được nêu ra về khả năng trích dẫn nguồn chính xác của nó, với những người dùng lưu ý các trường hợp thông tin rõ ràng bị bỏ qua. Điều này đặt ra câu hỏi về tính chính xác và độ tin cậy của thông tin do Manus cung cấp.
Giải quyết các mối quan ngại
Một đại diện của Manus đã thừa nhận những lời chỉ trích này trong một bình luận với TechCrunch. Họ tuyên bố:
“Là một nhóm nhỏ, trọng tâm của chúng tôi là tiếp tục cải thiện Manus và tạo ra các đặc vụ AI thực sự giúp người dùng giải quyết vấn đề. Mục tiêu chính của bản beta kín hiện tại là kiểm tra sức chịu đựng của các phần khác nhau của hệ thống và xác định các vấn đề. Chúng tôi đánh giá sâu sắc những hiểu biết có giá trị được chia sẻ bởi tất cả mọi người.”
Phản hồi này cho thấy sự nhận thức về các vấn đề hiện có và cam kết giải quyết chúng. Các nhà phát triển cũng đã tuyên bố ý định mở rộng quy mô sức mạnh tính toán và giải quyết các vấn đề đã được xác định.
Một sản phẩm đầy hứa hẹn nhưng chưa hoàn thiện
Tuy nhiên, điều quan trọng cần nhận ra là ở giai đoạn phát triển ban đầu này, Manus dường như là một thử nghiệm hơn là một sản phẩm công nghệ hoàn thiện. Mặc dù tiềm năng cho một AI thay đổi cuộc chơi là rõ ràng, thực tế hiện tại cho thấy Manus được mô tả chính xác hơn là một bằng chứng về khái niệm (proof-of-concept) hơn là một đặc vụ AI hoạt động đầy đủ sẵn sàng để áp dụng rộng rãi. Các lỗi và sự không nhất quán được báo cáo làm nổi bật sự cần thiết phải phát triển và tinh chỉnh thêm trước khi Manus có thể thực sự sống đúng với những tuyên bố đầy tham vọng của mình. Hành trình từ một nguyên mẫu đầy hứa hẹn đến một đặc vụ AI đáng tin cậy và mạnh mẽ thường dài và phức tạp, và Manus dường như đang ở giai đoạn đầu của hành trình đó. Những tháng và năm tới sẽ rất quan trọng trong việc xác định liệu nó có thể vượt qua những thách thức và thực hiện tiềm năng của mình hay không.
Sự đổi mới trong thiết kế của đặc vụ, cho phép nó hoạt động tự động, thể hiện một sự khác biệt rõ rệt so với các mô hình tương tác thông thường. Thay vì chỉ phản hồi các câu lệnh, Manus chủ động, phân tích các tình huống, xây dựng kế hoạch và thực hiện chúng mà không cần sự chỉ đạo liên tục của con người.
Sự nhiệt tình xung quanh Manus không chỉ dựa trên khả năng lý thuyết. Phản ứng từ các nhân vật nổi bật trong cộng đồng AI và sự phát triển nhanh chóng của cơ sở người dùng của nó cung cấp bằng chứng hữu hình về tiềm năng được nhận thức của nó. Việc các lời mời tham gia nền tảng có giá cao trên thị trường thứ cấp càng nhấn mạnh mức độ quan tâm và mong đợi.
Tuy nhiên, các báo cáo từ những người thử nghiệm ban đầu đưa ra một yếu tố quan trọng của sự thận trọng. Những kinh nghiệm về khó khăn kỹ thuật, lỗi và sự không chính xác không thể bỏ qua. Những vấn đề này làm nổi bật những thách thức cố hữu trong việc phát triển một hệ thống AI tiên tiến như vậy và đóng vai trò như một lời nhắc nhở rằng con đường để tạo ra một đặc vụ AI thực sự tự động và đáng tin cậy có rất nhiều trở ngại.
Phản ứng của các nhà phát triển đối với những lời chỉ trích là đáng khích lệ. Sự thừa nhận của họ về các vấn đề và cam kết cải thiện thể hiện sự sẵn sàng học hỏi từ phản hồi và tinh chỉnh sáng tạo của họ. Việc nhấn mạnh vào việc kiểm tra sức chịu đựng và xác định các vấn đề trong giai đoạn thử nghiệm beta kín là một thực tiễn tiêu chuẩn trong phát triển phần mềm và cho thấy một cách tiếp cận có phương pháp để giải quyết những thiếu sót.
Câu hỏi cuối cùng vẫn là: Manus có thể vượt qua những trở ngại ban đầu này và thực hiện lời hứa của mình không? Câu trả lời nằm ở sự phát triển và tinh chỉnh trong tương lai của hệ thống. Tình trạng hiện tại của Manus làm nổi bật sự căng thẳng vốn có giữa tham vọng và tính thực tế trong lĩnh vực AI. Mặc dù tầm nhìn về một đặc vụ AI hoàn toàn tự động là hấp dẫn, thực tế của việc tạo ra một hệ thống như vậy là phức tạp và đòi hỏi khắt khe. Manus đóng vai trò như một nghiên cứu điển hình có giá trị trong sự phát triển không ngừng của AI, thể hiện cả tiềm năng và thách thức của việc vượt qua các ranh giới của những gì có thể. Quỹ đạo tương lai của dự án sẽ được cộng đồng AI theo dõi chặt chẽ và chắc chắn sẽ cung cấp những hiểu biết có giá trị về sự phát triển của các hệ thống AI tự động. Các hạn chế hiện tại không nhất thiết phủ nhận tiềm năng lâu dài, nhưng chúng nhấn mạnh sự cần thiết phải tiếp tục thử nghiệm, phát triển và tinh chỉnh nghiêm ngặt.