Anatomi Hype: Membedah Manus
Kemunculan Manus bukanlah secara tiba-tiba. Laporan menunjukkan bahawa platform ini bukanlah ciptaan dari asas, tetapi lebih kepada gabungan rumit daripada model AI sedia ada dan yang telah diperhalusi. Ia dilaporkan memanfaatkan keupayaan model seperti Claude dari Anthropic dan Qwen dari Alibaba, menggunakannya untuk tugasan daripada penjanaan laporan penyelidikan hinggalah analisis rumit dokumen kewangan.
Walau bagaimanapun, The Butterfly Effect, syarikat China di sebalik Manus, menggambarkan gambaran yang jauh lebih bercita-cita tinggi di laman webnya. Platform ini digembar-gemburkan sebagai mampu melakukan pelbagai perkara seperti pemerolehan hartanah dan pengaturcaraan permainan video – dakwaan yang, pada pandangan pertama, kelihatan agak luar biasa.
Dakwaan Berani dan Video Tular: Kuasa Persepsi
Yichao ‘Peak’ Ji, ketua penyelidikan untuk Manus, terus menyemarakkan hype dalam video tular di X (dahulunya Twitter). Beliau meletakkan Manus sebagai alternatif yang lebih baik kepada alat agentik sedia ada, termasuk penyelidikan mendalam OpenAI dan Operator. Ji menegaskan bahawa Manus mengatasi penyelidikan mendalam mengenai GAIA, penanda aras yang digunakan secara meluas untuk menilai pembantu AI umum. Penanda aras ini menguji keupayaan AI untuk melaksanakan tugas dunia sebenar dengan menavigasi web, berinteraksi dengan perisian dan banyak lagi.
‘[Manus] bukan sekadar chatbot atau aliran kerja lain,’ Ji mengisytiharkan dalam video itu. ‘Ia adalah ejen autonomi sepenuhnya yang merapatkan jurang antara konsep dan pelaksanaan […]. Kami melihatnya sebagai paradigma seterusnya dalam kerjasama manusia-mesin.’ Ini adalah dakwaan yang berani, dan ia telah menyumbang dengan ketara kepada kenaikan pesat platform itu kepada kemasyhuran tular.
Semakan Realiti: Pengalaman Pengguna Melukis Gambaran Berbeza
Walaupun arkitek Manus dan beberapa suara berpengaruh telah memuji-mujinya, pengalaman pengguna awal menceritakan kisah yang kurang memberangsangkan. Laporan tentang gangguan, batasan dan kegagalan secara langsung telah mula muncul, menimbulkan keraguan terhadap keupayaan platform yang dikatakan itu.
Alexander Doria, pengasas bersama syarikat permulaan AI Pleias, berkongsi pengalamannya yang kurang memberangsangkan dengan Manus di X. Beliau menghadapi rentetan mesej ralat dan gelung yang tidak berkesudahan semasa ujiannya. Pengguna lain telah menyuarakan kebimbangan ini, menunjukkan kecenderungan Manus untuk kesilapan fakta, amalan petikan yang tidak konsisten, dan kecenderungannya untuk mengabaikan maklumat yang sedia ada dalam talian.
Pertemuan Peribadi: Akaun Langsung tentang Kekecewaan
Percubaan saya sendiri untuk menguji Manus juga memberikan hasil yang mengecewakan. Saya mulakan dengan permintaan yang kelihatan mudah: memesan sandwic ayam goreng dari restoran makanan segera yang dinilai tinggi dalam radius penghantaran saya. Selepas menunggu sepuluh minit, platform itu ranap. Percubaan kedua menghasilkan item menu yang sepadan dengan kriteria saya, tetapi Manus terbukti tidak berupaya untuk melengkapkan pesanan atau menyediakan pautan pembayaran.
Tidak terhalang, saya menugaskan Manus untuk menempah meja untuk satu orang di restoran berdekatan. Sekali lagi, kegagalan berlaku selepas beberapa minit. Akhirnya, saya mencabar platform itu untuk membina permainan pertarungan yang diilhamkan oleh Naruto. Selepas setengah jam pemprosesan, ia mengeluarkan ralat, dengan berkesan menamatkan eksperimen saya.
Respons Syarikat: Mengakui Kesakitan yang Berkembang
Jurucakap Manus, dalam satu kenyataan yang diberikan kepada TechCrunch, mengakui batasan semasa platform:
‘Sebagai sebuah pasukan kecil, tumpuan kami adalah untuk terus menambah baik Manus dan membuat ejen AI yang benar-benar membantu pengguna menyelesaikan masalah […]. Matlamat utama beta tertutup semasa adalah untuk menguji tekanan pelbagai bahagian sistem dan mengenal pasti isu. Kami amat menghargai pandangan berharga yang dikongsi oleh semua orang.’
Kenyataan ini, walaupun mengakui isu-isu tersebut, juga menyerlahkan sifat akses awal platform. Ia menunjukkan bahawa versi semasa lebih kepada ujian tekanan daripada produk yang digilap yang sedia untuk penggunaan meluas.
Kitaran Hype: Eksklusiviti, Maklumat Salah dan Kebanggaan Negara
Jika Manus, dalam keadaannya sekarang, terbukti cacat, mengapa ia mendapat perhatian yang begitu hebat? Beberapa faktor telah menyumbang kepada fenomena ini:
- Eksklusiviti: Ketersediaan jemputan yang terhad telah mewujudkan aura eksklusiviti, meningkatkan permintaan dan rasa ingin tahu.
- Buzz Media: Media China pantas memperjuangkan Manus sebagai satu kejayaan AI yang ketara, dengan penerbitan seperti QQ News menganggapnya sebagai ‘kebanggaan produk domestik.’
- Amplifikasi Media Sosial: Pengaruh AI di media sosial telah memainkan peranan penting dalam menyebarkan, kadangkala, maklumat yang tidak tepat tentang keupayaan Manus. Video yang diedarkan secara meluas, yang kononnya mempamerkan Manus berinteraksi dengan lancar merentas berbilang aplikasi telefon pintar, kemudiannya disahkan oleh Ji sebagai salah nyata.
- Perbandingan dengan DeepSeek: Beberapa akaun AI yang berpengaruh di X telah membuat perbandingan antara Manus dan DeepSeek, sebuah lagi syarikat AI China. Perbandingan ini, bagaimanapun, tidak sepenuhnya tepat. Tidak seperti DeepSeek, The Butterfly Effect tidak membangunkan sebarang model proprietari. Tambahan pula, walaupun DeepSeek telah membuka sumber banyak teknologinya, Manus kekal, buat masa ini, sebagai sistem tertutup.
Secubit Garam: Akses Awal dan Potensi Masa Depan
Adalah penting untuk mengulangi bahawa Manus kini berada di peringkat awal pembangunan. The Butterfly Effect mengekalkan bahawa ia sedang giat berusaha untuk meningkatkan kapasiti pengkomputeran dan menangani isu yang dilaporkan. Walau bagaimanapun, pada masa ini, Manus berfungsi sebagai contoh kuat hype yang mengatasi realiti teknologi. Masih belum dapat dilihat sama ada platform itu boleh berkembang untuk memenuhi jangkaan tinggi yang telah ditetapkan untuk dirinya sendiri. Potensi itu sudah pasti ada, tetapi laluan untuk merealisasikan potensi itu nampaknya penuh dengan cabaran. Lelaran semasa adalah jauh daripada ejen autonomi yang lancar yang digambarkan dalam video tular dan bahan promosi. Jurang antara aspirasi dan pelaksanaan kekal besar.