Hype atau Kejayaan? Ejen AI Pertama

Pendekatan Baharu kepada Interaksi AI

The Butterfly Effect, sebuah pasukan pembangunan dari China, baru-baru ini memperkenalkan Manus, yang diuar-uarkan sebagai ejen kecerdasan buatan (AI) autonomi penuh pertama di dunia. Ciptaan baharu ini membezakan dirinya daripada chatbot AI konvensional, seperti ChatGPT, Google’s Gemini, atau xAI’s Grok, yang kesemuanya bergantung pada input manusia. Manus, sebaliknya, mempunyai keupayaan untuk membuat keputusan dan melaksanakan tugas secara bebas, tanpa memerlukan pengawasan manusia yang berterusan.

Manus memasuki akses awal minggu lepas di bawah sistem jemputan sahaja. Walaupun ketersediaannya terhad, ia telah menjana keterujaan yang ketara, menarik perbandingan dengan pelancaran DeepSeek, satu lagi AI terkenal dari China. Keterujaan ini didorong oleh beberapa faktor:

  • Sokongan daripada Pemimpin Industri: Ketua produk di Hugging Face memuji Manus sebagai ‘alat AI paling mengagumkan yang pernah saya cuba.’
  • Pengiktirafan Pakar: Penyelidik dasar AI, Dean Ball, menggambarkannya sebagai ‘komputer paling kompleks yang menggunakan AI.’
  • Pertumbuhan Komuniti yang Pantas: Pelayan Discord rasmi Manus dengan pantas mengumpulkan lebih 138,000 ahli dalam masa beberapa hari.
  • Permintaan Tinggi: Jemputan ke platform itu dilaporkan dijual dengan harga beribu-ribu dolar di pasaran China, Xianyu.

Respons ini menyerlahkan jangkaan yang menyelubungi Manus dan potensinya untuk mengganggu landskap AI semasa. Perbezaan teras Manus terletak pada model operasinya. AI tradisional berfungsi berdasarkan permintaan-respons, memerlukan pengguna untuk memberikan arahan khusus dan kemudian menunggu respons yang dijana. Manus, bagaimanapun, beroperasi secara berbeza. Ia direka untuk mengendalikan tugas yang kompleks di latar belakang, hanya memberitahu pengguna setelah selesai kerja yang diberikan.

Aplikasi dan Keupayaan Dunia Sebenar

Untuk menggambarkan keupayaannya, pertimbangkan senario di mana pengguna menugaskan Manus untuk mencari apartmen. Tidak seperti kaedah carian konvensional atau pembantu AI sedia ada, Manus boleh menyelidiki analisis yang komprehensif. Ini boleh termasuk:

  1. Analisis Pasaran Hartanah: Menilai trend semasa, harga dan ketersediaan di kawasan yang dikehendaki.
  2. Penilaian Kadar Jenayah: Menyiasat keselamatan dan sekuriti kawasan kejiranan yang berbeza.
  3. Penilaian Keadaan Iklim: Mempertimbangkan corak cuaca dan faktor persekitaran.
  4. Kebolehlaksanaan Kewangan: Menentukan kemampuan berdasarkan keadaan kewangan pengguna.
  5. Cadangan Diperibadikan: Memberikan cadangan yang disesuaikan berdasarkan keutamaan dan prioriti pengguna.

Tahap analisis dan pembuatan keputusan autonomi ini membezakan Manus. Ia menunjukkan peralihan ke arah model AI yang lebih proaktif dan kurang reaktif.

Penanda Aras dan Prestasi

Menurut Yizhao “Pika” Ji, salah seorang pembangun di sebalik Manus, AI tersebut mengatasi Deep Research dan Operator OpenAI dalam penanda aras GAIA. Penanda aras ini direka khusus untuk menilai keupayaan AI untuk berinteraksi dengan pelayar, menggunakan perisian dan melaksanakan tugas yang kompleks. Ji menekankan bahawa Manus ‘bukan sekadar chatbot lain.’ Beliau meletakkannya sebagai ‘ejen autonomi sepenuhnya yang merapatkan jurang antara konsep dan pelaksanaan,’ mencadangkan peralihan ketara dalam cara manusia dan mesin bekerjasama. Beliau seterusnya membayangkan Manus sebagai ‘paradigma seterusnya kerjasama manusia-mesin.’

Maklum Balas Penguji Awal dan Cabaran

Walaupun gembar-gembur yang besar dan dakwaan yang bercita-cita tinggi, penguji awal telah melaporkan beberapa isu penting. Oleksandr Doria, pengasas bersama syarikat permulaan Pleias, menyatakan bahawa semasa ujian, Manus menghadapi ralat dan mengalami kitaran but semula yang tidak berkesudahan. Laporan ini menunjukkan bahawa sistem itu, walaupun menjanjikan, belum lagi stabil atau boleh dipercayai sepenuhnya.

Tambahan pula, ramai pengguna di X (dahulunya Twitter) telah menegaskan bahawa Manus membuat kesilapan fakta. Kebimbangan juga telah dibangkitkan tentang keupayaannya untuk memetik sumber dengan betul, dengan pengguna menyatakan contoh di mana maklumat yang jelas ditinggalkan. Ini menimbulkan persoalan tentang ketepatan dan kebolehpercayaan maklumat yang diberikan oleh Manus.

Menangani Kebimbangan

Seorang wakil daripada Manus mengakui kritikan ini dalam komen kepada TechCrunch. Mereka menyatakan:

“Sebagai sebuah pasukan kecil, tumpuan kami adalah untuk terus menambah baik Manus dan membuat ejen AI yang benar-benar membantu pengguna menyelesaikan masalah. Matlamat utama beta tertutup semasa adalah untuk menguji tekanan pelbagai bahagian sistem dan mengenal pasti isu. Kami amat menghargai pandangan berharga yang dikongsi oleh semua orang.”

Respons ini menunjukkan kesedaran tentang masalah yang sedia ada dan komitmen untuk menanganinya. Pembangun juga telah menyatakan hasrat mereka untuk meningkatkan kuasa pengkomputeran dan menyelesaikan isu yang dikenal pasti.

Produk yang Menjanjikan tetapi Belum Selesai

Walau bagaimanapun, adalah penting untuk menyedari bahawa pada peringkat awal pembangunan ini, Manus kelihatan lebih kepada eksperimen daripada produk teknologi yang digilap sepenuhnya. Walaupun potensi untuk AI yang mengubah permainan adalah jelas, realiti semasa menunjukkan bahawa Manus lebih tepat digambarkan sebagai bukti konsep daripada ejen AI yang berfungsi sepenuhnya yang sedia untuk penggunaan meluas. Kelemahan dan ketidakkonsistenan yang dilaporkan menyerlahkan keperluan untuk pembangunan dan penghalusan selanjutnya sebelum Manus benar-benar dapat memenuhi jangkaan yang tinggi. Perjalanan daripada prototaip yang menjanjikan kepada ejen AI yang boleh dipercayai dan teguh selalunya panjang dan kompleks, dan Manus nampaknya berada di permulaan perjalanan itu. Bulan-bulan dan tahun-tahun akan datang adalah penting dalam menentukan sama ada ia boleh mengatasi cabaran dan memenuhi potensinya.

Inovasi dalam reka bentuk ejen, yang membolehkannya berfungsi secara autonomi, membentangkan perbezaan yang ketara daripada model interaktif konvensional. Daripada hanya bertindak balas kepada arahan, Manus mengambil inisiatif, menganalisis situasi, merumuskan rancangan dan melaksanakannya tanpa arahan manusia yang berterusan.

Keghairahan yang menyelubungi Manus bukan semata-mata berdasarkan keupayaan teori. Reaksi daripada tokoh terkemuka dalam komuniti AI dan pertumbuhan pesat pangkalan penggunanya memberikan bukti ketara tentang potensi yang dilihat. Hakikat bahawa jemputan ke platform itu mendapat harga yang tinggi di pasaran sekunder seterusnya menggariskan tahap minat dan jangkaan.

Walau bagaimanapun, laporan daripada penguji awal memperkenalkan elemen berhati-hati yang penting. Pengalaman kesukaran teknikal, ralat dan ketidaktepatan tidak boleh diabaikan. Isu-isu ini menyerlahkan cabaran yang wujud dalam membangunkan sistem AI yang begitu maju dan berfungsi sebagai peringatan bahawa laluan untuk mencipta ejen AI yang benar-benar autonomi dan boleh dipercayai adalah penuh dengan halangan.

Respons pembangun terhadap kritikan itu adalah menggalakkan. Pengakuan mereka terhadap masalah dan komitmen untuk penambahbaikan menunjukkan kesediaan untuk belajar daripada maklum balas dan memperhalusi ciptaan mereka. Penekanan pada ujian tekanan dan mengenal pasti isu semasa fasa beta tertutup adalah amalan standard dalam pembangunan perisian dan mencadangkan pendekatan yang teratur untuk menangani kelemahan.

Persoalan utama kekal: Bolehkah Manus mengatasi halangan awal ini dan menunaikan janjinya? Jawapannya terletak pada pembangunan dan penghalusan sistem pada masa hadapan. Keadaan semasa Manus menyerlahkan ketegangan yang wujud antara cita-cita dan kepraktisan dalam bidang AI. Walaupun visi ejen AI yang autonomi sepenuhnya adalah menarik, realiti mencipta sistem sedemikian adalah kompleks dan mencabar. Manus berfungsi sebagai kajian kes yang berharga dalam evolusi AI yang berterusan, menunjukkan kedua-dua potensi dan cabaran untuk menolak sempadan apa yang mungkin. Trajektori masa depan projek akan dipantau dengan teliti oleh komuniti AI dan sudah pasti akan memberikan pandangan berharga ke dalam pembangunan sistem AI autonomi. Pengehadan semasa tidak semestinya menafikan potensi jangka panjang, tetapi ia menekankan keperluan untuk ujian, pembangunan dan penghalusan yang berterusan.