Ujian Penaakulan yang Luar Biasa
Anthropic, sebuah syarikat penyelidikan AI terkemuka, telah memulakan eksperimen unik untuk menguji keupayaan model AI terbarunya, Claude 3.7 Sonnet. Daripada penanda aras tradisional, Anthropic telah memilih pendekatan yang lebih luar biasa: membiarkan AI bermain Pokémon Red di siaran langsung Twitch. Usaha ini telah menarik perhatian pelbagai penonton, kerana penonton menonton untuk menyaksikan kemajuan AI yang perlahan tetapi teratur melalui tajuk Game Boy klasik.
Mengapa Pokémon? Cabaran yang Sangat Kompleks
Pada pandangan pertama, Pokémon Red, permainan yang direka terutamanya untuk kanak-kanak, mungkin kelihatan seperti pilihan yang ganjil untuk menilai AI yang canggih. Walau bagaimanapun, permainan ini membentangkan satu set cabaran yang sangat kompleks yang memerlukan penaakulan logik, penyelesaian masalah, dan perancangan strategik. Ini adalah bidang yang tepat di mana Anthropic berhasrat untuk menolak sempadan pembangunan AI.
Sifat dunia terbuka permainan, dengan pelbagai teka-teki, halangan, dan interaksi watak yang saling berkaitan, menyediakan persekitaran yang kaya untuk menguji keupayaan AI untuk:
- Memahami dan bertindak balas kepada arahan bahasa semula jadi: AI mesti mentafsir arahan berasaskan teks dan maklum balas daripada persekitaran permainan.
- Merumuskan matlamat jangka pendek dan jangka panjang: Daripada memilih Pokémon yang betul untuk pertempuran hingga menavigasi laluan yang kompleks, AI perlu merancang lebih awal.
- Menyesuaikan diri dengan situasi yang tidak dijangka: Permainan ini penuh dengan pertemuan rawak dan peristiwa yang tidak dapat diramalkan, memaksa AI untuk menyesuaikan strateginya dengan cepat.
- Belajar daripada pengalaman: AI mesti mengingati kejayaan dan kegagalan masa lalu untuk meningkatkan prestasinya dari semasa ke semasa.
Kemajuan Perlahan dan Mantap: Perjalanan AI
Siaran langsung telah mendedahkan perjalanan yang menarik, walaupun sering perlahan, Claude 3.7 Sonnet melalui dunia Pokémon. Permainan AI dicirikan oleh gabungan pencapaian penaakulan yang mengagumkan dan detik-detik kebingungan.
Pada peringkat awal, AI bergelut dengan tugas yang paling asas. Meninggalkan bandar permulaan, tugas yang boleh dilakukan oleh pemain manusia dalam beberapa minit, terbukti menjadi halangan yang ketara bagi Claude. Ia menghabiskan masa berjam-jam bergelut dengan kawalan permainan dan susun atur ruang, sering terperangkap di sudut atau berulang kali berinteraksi dengan objek yang sama.
Walau bagaimanapun, apabila siaran langsung itu berlangsung, AI mula menunjukkan pemahaman yang semakin meningkat tentang mekanik permainan. Ia belajar bagaimana untuk:
- Menavigasi melalui kawasan yang berbeza.
- Terlibat dalam pertempuran dengan jurulatih Pokémon lain.
- Menangkap Pokémon liar.
- Menggunakan item secara strategik.
- Malah mengalahkan beberapa ketua gim, satu pencapaian penting dalam permainan.
Detik-Detik Kecemerlangan dan Kekecewaan
Detik-detik kecemerlangan AI sering diselang-seli dengan tempoh tidak aktif yang mengecewakan atau keputusan yang kelihatan tidak logik.Terdapat keadaan di mana Claude:
- Menjadi terpaku pada objek yang kelihatan tidak penting, seperti dinding batu, menghabiskan masa berjam-jam cuba berinteraksi dengannya sebelum akhirnya menaakul jalan keluarnya.
- Membuat pilihan yang membingungkan dalam pertempuran, seperti menggunakan gerakan yang tidak berkesan atau beralih kepada Pokémon yang lebih lemah.
- Terperangkap dalam gelung, mengulangi tindakan yang sama berulang kali tanpa membuat sebarang kemajuan.
Detik-detik ini menyerlahkan cabaran yang wujud dalam membangunkan AI yang benar-benar dapat memahami dan berinteraksi dengan persekitaran yang kompleks dan dinamik. Walaupun Claude 3.7 Sonnet telah mencapai kemajuan yang ketara dalam penaakulan dan penyelesaian masalah, ia masih mempunyai jalan yang panjang sebelum ia dapat menandingi pemahaman intuitif dan kebolehsuaian pemain manusia.
Mengimbau Kembali: ‘Twitch Plays Pokémon’
Eksperimen ini tidak dapat dielakkan menarik perbandingan dengan fenomena tular ‘Twitch Plays Pokémon,’ yang memikat internet beberapa tahun lalu. Dalam eksperimen itu, beribu-ribu penonton Twitch bekerjasama untuk mengawal satu watak dalam Pokémon Red, menggunakan arahan berasaskan teks dalam sembang. Hasilnya ialah permainan yang huru-hara tetapi akhirnya berjaya, didorong oleh kecerdasan kolektif (dan ‘trolling’ sekali-sekala) komuniti dalam talian.
Eksperimen Anthropic, bagaimanapun, mewakili perbezaan yang ketara daripada model kolaboratif ini. Di sini, AI bermain secara solo, cuba menavigasi cabaran permainan tanpa sebarang campur tangan manusia. Peralihan daripada permainan manusia kolektif kepada kawalan AI individu ini telah mencetuskan reaksi bercampur-campur daripada penonton. Ada yang mengagumi kemajuan teknologi yang dipamerkan, manakala yang lain meratapi kehilangan pengalaman bersama dan jenaka yang tidak dapat diramalkan yang mencirikan ‘Twitch Plays Pokémon.’
Gambaran Lebih Besar: Implikasi untuk Pembangunan AI
Di luar nilai hiburan, eksperimen Pokémon Anthropic mempunyai implikasi yang lebih luas untuk bidang pembangunan AI. Ia memberikan pandangan berharga tentang kekuatan dan kelemahan model AI semasa, terutamanya dalam bidang:
- Pemprosesan Bahasa Semula Jadi: Keupayaan AI untuk memahami dan bertindak balas kepada maklumat berasaskan teks dalam permainan adalah penting untuk kejayaannya.
- Pembelajaran Pengukuhan: AI belajar melalui percubaan dan kesilapan, secara beransur-ansur meningkatkan prestasinya berdasarkan ganjaran dan hukuman yang diterimanya dalam permainan.
- Generalisasi: Keupayaan AI untuk menggunakan apa yang telah dipelajarinya dalam satu situasi kepada situasi baharu yang tidak dikenali adalah kunci kepada kemajuan jangka panjangnya.
Dengan mengkaji cara Claude 3.7 Sonnet menangani cabaran Pokémon Red, penyelidik Anthropic boleh memperoleh pemahaman yang lebih baik tentang cara membangunkan sistem AI yang lebih teguh, boleh disesuaikan dan mampu mengendalikan kerumitan dunia sebenar.
Masa Depan AI dan Permainan
Persimpangan AI dan permainan video ialah bidang yang berkembang pesat, dengan potensi aplikasi jauh melangkaui hiburan. Permainan menyediakan persekitaran terkawal dan boleh diukur untuk menguji dan memperhalusi algoritma AI, dan pengajaran yang diperoleh boleh digunakan untuk pelbagai masalah dunia sebenar, seperti:
- Robotik: Melatih robot untuk menavigasi persekitaran yang kompleks dan berinteraksi dengan objek.
- Kenderaan Autonomi: Membangunkan kereta pandu sendiri yang boleh membuat keputusan yang selamat dan boleh dipercayai dalam keadaan lalu lintas yang tidak dapat diramalkan.
- Penjagaan Kesihatan: Mencipta alat diagnostik berkuasa AI dan pelan rawatan yang diperibadikan.
- Pendidikan: Merekabentuk sistem tunjuk ajar pintar yang boleh menyesuaikan diri dengan keperluan pelajar individu.
Memandangkan teknologi AI terus maju, kita boleh menjangkakan aplikasi AI yang lebih canggih dan mengejutkan dalam permainan video, dan seterusnya. Eksperimen Pokémon Anthropic hanyalah satu langkah kecil dalam perjalanan yang menarik ini, tetapi ia menawarkan gambaran sekilas tentang potensi AI untuk mengubah cara kita hidup, bekerja dan bermain. Permainan ini mungkin direka untuk kanak-kanak, tetapi ia terbukti menjadi alat yang sangat berguna untuk penyelidikan AI. Cabaran persekitaran memaksa AI untuk membangunkan kemahiran menaakul, dan menawarkan banyak peluang untuk belajar. Walaupun AI jauh daripada sempurna, ia telah menunjukkan bahawa model menjadi lebih baik dalam menyelesaikan teka-teki yang kompleks.
Eksperimen ini telah mengimbau kembali kenangan ‘Twitch Plays Pokemon’, di mana beribu-ribu orang bekerjasama. Kini, AI sedang menghadapi cabaran ini secara solo, menunjukkan sejauh mana teknologi telah berkembang. Ia merupakan peralihan besar daripada permainan manusia kolaboratif kepada mesin yang bermain, dan ia menunjukkan betapa banyak AI sedang berkembang.