Kebangkitan Konsep Ejen
Dalam beberapa tahun kebelakangan ini, dengan pengenalan pelayan GitHub MCP oleh Microsoft, penerbitan protokol komunikasi antara ejen pintar A2A oleh Google, dan pelancaran pelayan MCP oleh Alipay, bidang Ejen (agen pintar) telah menerima perhatian pasaran yang belum pernah terjadi sebelumnya. Walaupun definisi Ejen belum mencapai persetujuan penuh, tiga komponen teras ‘perancangan’, ‘ingatan’ dan ‘penggunaan alat’ yang dicadangkan oleh bekas penyelidik OpenAI, Lilian Weng, diiktiraf secara meluas dan menjadi elemen penting untuk memahami Ejen.
Dalam bidang kecerdasan buatan, konsep Ejen bukanlah perkara baharu, tetapi dengan perkembangan pesat model bahasa besar (LLM), prospek aplikasi Ejen telah mencapai satu kejayaan baharu. Ejen boleh dilihat sebagai sistem pintar yang mampu memahami persekitaran, merancang secara autonomi dan melaksanakan tugas. Terasnya terletak pada keupayaan untuk mensimulasikan proses membuat keputusan manusia dan menggunakan pelbagai alat dan sumber untuk mencapai matlamat yang ditetapkan.
Status Semasa Pembangunan Ejen: Potensi Besar, Kadar Penembusan Perlu Ditingkatkan
Sebagai versi evolusi chatbot, kebanyakan aplikasi Ejen semasa disepadukan ke dalam perkhidmatan berbayar model besar, dan hanya sebilangan kecil Ejen seperti Manus dan Devin menyediakan perkhidmatan berbayar bebas. Walaupun begitu, Ejen seperti Deep Research dan Manus yang mempunyai keupayaan perancangan autonomi masih mempunyai banyak batasan dalam penggunaan, dan bilangan pengguna yang benar-benar dapat mengalaminya mungkin tidak ramai, dan masih ada ruang yang besar untuk peningkatan sebelum aplikasi ‘blockbuster’ muncul.
Walau bagaimanapun, dengan peningkatan berterusan keupayaan inferens model besar, Ejen secara beransur-ansur menjadi tumpuan inovasi aplikasi. Semakin banyak pembangun dan penyelidik mula meneroka aplikasi Ejen dalam pelbagai bidang, seperti pembantu pintar, proses automasi dan analisis data. Potensi Ejen secara beransur-ansur diterokai, dan ruang pembangunan masa depan sangat luas.
Aplikasi Skala Besar Ejen Akan Datang: Didorong oleh Pelbagai Keadaan yang Menggalakkan
Kejayaan dalam Latihan Model
- Tetingkap Konteks Berkembang Pesat: Tetingkap konteks (Context Window) bagi model besar merujuk kepada panjang teks maksimum yang boleh dipertimbangkan oleh model apabila memproses teks. Dengan kemajuan teknologi, tetingkap konteks model berkembang pesat, yang bermaksud model dapat memahami konteks teks panjang dengan lebih baik, dan dengan itu membuat keputusan yang lebih tepat.
- Pembelajaran Pengukuhan Digunakan Secara Mendalam: Pembelajaran pengukuhan ialah kaedah melatih Ejen melalui ganjaran dan hukuman. Dalam tahun-tahun kebelakangan ini, pembelajaran pengukuhan telah digunakan secara meluas dalam latihan Ejen, membolehkan Ejen menyesuaikan diri dengan lebih baik kepada persekitaran yang kompleks dan mempelajari strategi yang optimum.
- Model Inferens Semakin Matang: Model inferens ialah komponen teras Ejen, bertanggungjawab untuk membuat inferens dan pertimbangan berdasarkan maklumat input. Dengan pendalaman penyelidikan, model inferens menjadi semakin matang, dan dapat menyokong aplikasi Ejen yang pelbagai dengan lebih baik.
Ekosistem BerkembangMaju
- MCP dan Protokol A2A Berkembang Pesat: MCP (Model Communication Protocol) dan A2A (Agent-to-Agent) ialah dua protokol komunikasi Ejen yang penting. Perkembangan pesat protokol ini membolehkan Ejen memanggil pelbagai alat dan perkhidmatan dengan lebih mudah, dan dengan itu mencapai fungsi yang lebih kompleks.
- Ejen Memanggil Alat Menjadi Lebih Mudah: Dengan kemajuan teknologi, cara Ejen memanggil alat dan perkhidmatan luaran menjadi semakin mudah. Contohnya, melalui API (Application Programming Interface), Ejen boleh mengakses pelbagai sumber data dan perkhidmatan dalam talian dengan mudah, dan dengan itu mengembangkan keupayaannya sendiri.
Pada November 2024, Anthropic menerbitkan dan sumber terbuka protokol MCP, yang bertujuan untuk menyeragamkan cara data dan alat luaran memberikan konteks kepada model. Langkah ini akan menggalakkan pembangunan ekosistem Ejen secara besar-besaran, membolehkan Ejen memanfaatkan sumber luaran dengan lebih baik.
MCP dan A2A: Kunci Saling Hubung Ejen
Protokol MCP: Menghubungkan Ejen dengan Dunia Luaran
Matlamat utama protokol MCP ialah untuk mencapai ‘saling hubungan satu klik’ antara Ejen dan data serta alat luaran. Melalui protokol MCP, Ejen boleh mengakses pelbagai sumber luaran dengan mudah, seperti pangkalan data, API, perkhidmatan Web, dll. Ini membolehkan Ejen memahami persekitaran dengan lebih baik, dan membuat keputusan yang lebih bijak.
Protokol A2A: Membina Jambatan Komunikasi Antara Ejen
Matlamat protokol A2A ialah untuk mencapai komunikasi antara Ejen. Melalui protokol A2A, Ejen boleh bekerjasama antara satu sama lain untuk menyelesaikan tugas yang kompleks. Ini adalah penting untuk membina sistem pintar teragih.
Walaupun matlamat protokol A2A adalah untuk komunikasi antara Ejen, dan MCP adalah untuk Ejen dan alat serta data luaran, dalam situasi kompleks di mana ‘alat juga boleh dibungkus sebagai Ejen’, fungsi kedua-duanya mungkin bertindih, tetapi persaingan ini membantu mengurangkan kos model besar untuk memanggil alat luaran dan berkomunikasi. Persaingan ini akan memacu kemajuan teknologi, dan akhirnya memberi manfaat kepada keseluruhan ekosistem Ejen.
Prospek Pembangunan Ejen
Ejen Hujung ke Hujung: Tanpa Campur Tangan Manual
Pada masa ini, terdapat sebilangan besar ‘ejen pintar’ di pasaran, tetapi sebahagian besar daripadanya dibangunkan berdasarkan platform seperti Coze dan Dify, dan memerlukan manusia untuk menulis aliran kerja terlebih dahulu. Ejen ini lebih seperti superposisi kejuruteraan perkataan gesaan, dan tergolong dalam Ejen yang agak rendah.
Ejen yang lebih maju adalah ‘hujung ke hujung’, yang bermaksud ‘memasukkan tugas ke dalam Ejen, dan Ejen secara automatik menyelesaikan hasil tugas yang diperlukan oleh manusia’. Contohnya, pengguna hanya perlu memasukkan matlamat kepada Ejen, dan Ejen dapat merancang dan melaksanakan tugas secara autonomi, dan akhirnya mencapai matlamat tersebut. Ejen lanjutan seperti L3/L4/L5 lebih memenuhi keperluan manusia dan akan menjadi hala tuju penting pembangunan Ejen pada masa hadapan.
Ejen Membantu Robot dan Pemanduan Automatik
Apabila definisi Ejen digunakan pada kecerdasan embodied, didapati bahawa robot dan kenderaan yang didominasi oleh model besar juga merupakan Ejen. Khususnya, halangan pembangunan robot semasa bukanlah terletak pada ‘cara membuat tindakan fizikal’ ‘otak kecil’, tetapi dalam memikirkan ‘jenis tindakan fizikal yang perlu dibuat’ ‘otak besar’, dan ini tepatnya termasuk dalam julat Ejen.
Dalam bidang robotik, Ejen boleh membantu robot memahami persekitaran dengan lebih baik, dan membuat keputusan yang lebih munasabah. Contohnya, Ejen boleh merancang laluan pergerakan robot secara autonomi berdasarkan objek dan orang dalam persekitaran, dan melaksanakan pelbagai tugas.
Dalam bidang pemanduan automatik, Ejen boleh membantu kenderaan memahami persekitaran sekeliling dengan lebih baik, dan membuat keputusan pemanduan yang lebih selamat. Contohnya, Ejen boleh menyesuaikan kelajuan dan arah kenderaan secara autonomi berdasarkan isyarat lalu lintas, kenderaan lain dan pejalan kaki, dan dengan itu mengelakkan kemalangan lalu lintas.
Saling Hubung Ejen dan Rangkaian Asli AI
Pada masa hadapan, mungkin semua Ejen antara satu sama lain sepatutnya dapat berkomunikasi, boleh mengatur sendiri, berunding sendiri, membina rangkaian kerjasama yang kosnya lebih rendah dan kecekapannya lebih tinggi daripada Internet sedia ada. Komuniti pembangun China juga sedang membina protokol seperti ANP, yang bertujuan untuk menjadi protokol HTTP era Internet Ejen. Mengenai pengesahan identiti antara Ejen, teknologi seperti DID boleh digunakan.
- Saling Hubung Ejen: Saling hubung antara Ejen boleh merealisasikan perkongsian sumber dan kerjasama, dan dengan itu meningkatkan kecekapan keseluruhan sistem. Contohnya, Ejen yang berbeza boleh berkongsi data, alat dan perkhidmatan, dan dengan itu menyelesaikan tugas yang kompleks bersama-sama.
- Rangkaian Asli AI: Rangkaian asli AI merujuk kepada rangkaian yang direka khas untuk aplikasi kecerdasan buatan. Rangkaian ini boleh menyediakan lebar jalur yang lebih tinggi, kependaman yang lebih rendah dan keselamatan yang lebih kukuh, dan dengan itu menyokong aplikasi Ejen yang pelbagai dengan lebih baik.
- Teknologi DID: DID (Decentralized Identifier) ialah teknologi pengesahan identiti terpencar. Melalui teknologi DID, Ejen boleh memiliki identiti mereka sendiri, dan dengan itu mencapai komunikasi yang lebih selamat dan boleh dipercayai.
Pembangunan teknologi Ejen akan membawa perubahan yang besar. Internet masa depan tidak lagi menjadi rangkaian penghantaran maklumat yang mudah, tetapi rangkaian kerjasama yang penuh dengan kecerdasan.