Baru-baru ini, Google meluncurkan protokol terbuka baru untuk Agen yang disebut Agent2Agent, atau disingkat A2A. Secara bersamaan, Bailian dari Alibaba Cloud juga mengumumkan terjun ke MCP. Mari kita selidiki apa itu A2A dan MCP.
Untuk memahami protokol ini, pertimbangkan analogi diplomasi antar negara. Bayangkan setiap agen AI sebagai negara kecil dengan bahasa dan adat istiadatnya sendiri. “Negara-negara” ini memiliki kedutaan yang ditempatkan di dalam gedung yang sama, mencoba berkomunikasi, berdagang, dan bertukar informasi.
Dalam skenario ideal, negara-negara ini akan menjaga hubungan baik dan mematuhi serangkaian aturan diplomatik yang jelas, memungkinkan mereka untuk berinteraksi dengan mulus, menandatangani perjanjian, dan berkolaborasi dalam proyek-proyek internasional di sekitar meja konferensi.
Namun, kenyataannya adalah bahwa setiap kedutaan beroperasi secara independen dengan protokol yang berbeda. Akibatnya, memulai perjanjian perdagangan sederhana dengan “Negara A” mengharuskan pemenuhan sejumlah besar persyaratan, termasuk ketentuan, sertifikasi, terjemahan, dan kunci khusus. Terlibat dengan “Negara B” dan “Negara C” mengharuskan pengulangan prosedur serupa berkali-kali. Pendekatan ad-hoc, terfragmentasi, dan multi-faceted ini meningkatkan biaya komunikasi, dengan setiap interaksi menimbulkan “tarif informasi” tambahan.
Di masa lalu, agen AI menemui kesulitan serupa ketika mencoba berkolaborasi.
Misalnya, Anda mungkin memiliki agen yang secara otomatis menanggapi email dan yang lain terintegrasi ke dalam aplikasi kalender untuk membantu penjadwalan. Namun, entitas AI ini berjuang untuk berkomunikasi secara langsung, yang mengharuskan penyalinan dan penempelan informasi secara manual atau bergantung pada antarmuka yang dibuat khusus.
Akibatnya, agen AI beroperasi secara terpisah, menunjukkan interoperabilitas yang buruk. Fragmentasi ini membuat frustrasi pengguna yang harus menavigasi antara beberapa aplikasi AI dan membatasi potensi AI. Tugas-tugas kompleks yang dapat diselesaikan melalui kolaborasi multi-agen secara artifisial terbatas dalam silo individu.
Situasi ini mencerminkan lanskap pasca-Perang Dunia II, di mana setiap agen AI bertindak secara otonom, tanpa aturan terpadu dan menghadapi hambatan komunikasi. Ekosistem AI saat ini menyerupai gurun pascaperang, yang mengharuskan kepatuhan terhadap antarmuka dan protokol tertentu untuk mengakses data dan fungsionalitas. Tidak adanya standar memaksakan “tarif” tambahan dengan setiap hubungan kolaboratif baru, yang mengarah ke ekosistem AI yang terputus-putus dan tidak efisien yang ditandai dengan isolasi dan kepentingan pribadi.
Industri AI sedang menjajaki kemungkinan membangun protokol yang diterima secara universal untuk memfasilitasi interaksi yang mulus antara agen dan alat eksternal. Google dan Anthropic telah muncul sebagai yang terdepan, masing-masing mengusulkan solusi: protokol A2A dan protokol MCP.
Protokol A2A
Protokol A2A, singkatan dari Agent2Agent, memungkinkan agen AI untuk berkomunikasi dan berkolaborasi secara langsung.
Tujuan utama dari protokol A2A adalah untuk memungkinkan agen dari berbagai asal dan vendor untuk memahami dan bekerja sama satu sama lain, mirip dengan upaya Organisasi Perdagangan Dunia untuk mengurangi hambatan perdagangan.
Dengan mengadopsi A2A, agen dari vendor dan kerangka kerja yang berbeda dapat bergabung dengan zona perdagangan bebas, berkomunikasi menggunakan bahasa umum dan berkolaborasi dengan mulus untuk menyelesaikan tugas-tugas kompleks di luar kemampuan agen individu.
Untuk menggambarkan bagaimana A2A beroperasi, pertimbangkan analogi berikut:
1. Agen = Diplomat Nasional
Setiap agen berfungsi sebagai diplomat yang mewakili kedutaan negara. Protokol A2A bertujuan untuk membangun etiket diplomatik dan prosedur komunikasi yang seragam. Sebelumnya, diplomat dari “Negara A” berkomunikasi secara eksklusif dalam bahasa Prancis, sementara mereka dari “Negara B” menggunakan aksara Cyrillic, dan “Negara C” menuntut korespondensi melalui surat-surat daun emas kuno. Protokol A2A memastikan bahwa semua peserta dapat berkomunikasi dalam bahasa yang telah disepakati sebelumnya, menyerahkan dokumen dalam format yang sama, dan mengeksekusi hasil yang disepakati.
2. Kartu Agen = Kredensial Diplomatik / Kartu Nama Duta Besar
Dalam kerangka kerja A2A, setiap agen diharuskan untuk menerbitkan “Kartu Agen,” yang analog dengan kartu nama diplomat, yang berisi detail seperti nama agen, versi, kemampuan, dan bahasa atau format yang didukung.
Mirip dengan bagaimana kartu nama diplomat mengidentifikasi peran dan afiliasi mereka, Kartu Agen mencantumkan keterampilan agen, metode otentikasi, dan format input/output. Ini memungkinkan diplomat lain untuk dengan cepat mengidentifikasi dan memahami kemampuan, meminimalkan hambatan komunikasi.
3. Tugas = Proyek Diplomatik Bilateral atau Multilateral
Konsep Tugas adalah inti dari A2A. Ketika seorang agen bermaksud untuk mendelegasikan tugas ke agen lain, ia mengeluarkan “surat pernyataan niat proyek kerja sama.” Setelah diterima, kedua belah pihak mencatat ID Tugas untuk melacak kemajuan dan bertukar informasi hingga selesai.
Dalam istilah diplomatik, suatu negara mungkin mengusulkan kepada negara lain, “Kami ingin berkolaborasi dalam membangun jalur kereta api berkecepatan tinggi lintas batas; silakan kirim tim teknik Anda.” Ini mencerminkan Tugas A2A, di mana pihak yang memulai menguraikan persyaratan, agen jarak jauh menerima, dan kedua belah pihak secara teratur memperbarui kemajuan di seluruh proyek.
Pesan mewakili komunikasi yang dipertukarkan selama tahap awal atau menengah proyek, mirip dengan kabel diplomatik, catatan, dan pertukaran utusan.
4. Pemberitahuan Push = Buletin Kedutaan Diplomatik
Dalam A2A, jika Tugas adalah proyek jangka panjang yang membutuhkan waktu penyelesaian yang lama, agen jarak jauh dapat memperbarui pihak yang memulai melalui pemberitahuan push, mirip dengan negara yang memberikan pembaruan berkala tentang proyek infrastruktur jangka panjang. Ini meningkatkan kemampuan kolaborasi asinkron.
5. Otentikasi dan Keamanan = Hak dan Protokol Diplomatik
A2A menggunakan strategi otentikasi tingkat perusahaan, yang mengharuskan kedua pihak yang berkomunikasi untuk memverifikasi kredensial untuk mencegah peniruan identitas atau penyadapan jahat. Mekanisme ini sejajar dengan hak dan protokol diplomatik.
Intinya, A2A mencerminkan dinamika diplomasi internasional atau kolaborasi bisnis, menekankan komunikasi dan keamanan yang terstandarisasi.
Protokol MCP
Protokol MCP, atau Model Context Protocol, adalah standar yang diperkenalkan dan sumber terbuka oleh Anthropic pada November 2024.
Sementara A2A membahas proses komunikasi antar diplomat AI, tantangan abadi tetap ada: tidak adanya sumber informasi yang dapat diandalkan. Bahkan diplomat atau eksekutif bisnis yang paling fasih pun tidak diperlengkapi dengan baik untuk beroperasi secara efektif tanpa informasi akurat tentang lanskap internasional dan alokasi sumber daya.
Diplomat modern mengandalkan alat eksternal, seperti sistem visa, sistem penyelesaian internasional, dan basis data intelijen, untuk menjalankan tugas mereka. Demikian pula, seorang agen yang memikul tanggung jawab kompleks harus terhubung ke berbagai basis data, sistem dokumen, aplikasi perusahaan, dan bahkan perangkat keras.
Ini dapat disamakan dengan membangun lembaga intelijen komprehensif untuk diplomat dan memberi mereka akses ke alat untuk memfasilitasi pekerjaan mereka.
Sebelumnya, agen harus mengembangkan plugin khusus dan terintegrasi secara mendalam dengan alat yang berbeda, yang sangat melelahkan dan memakan waktu. Namun, MCP sekarang tersedia untuk merampingkan proses.
MCP menstandarisasi interaksi antara model bahasa besar dan sumber data dan alat eksternal. Anthropic menyamakan MCP dengan port USB-C untuk aplikasi AI.
USB-C berfungsi sebagai antarmuka universal untuk perangkat, menangani pengisian daya dan transfer data melalui satu port. MCP bertujuan untuk membuat antarmuka universal di domain AI, memungkinkan berbagai model dan sistem eksternal untuk terhubung menggunakan protokol yang sama, alih-alih mengembangkan solusi integrasi khusus setiap kali.
Model AI yang terhubung ke basis data, mesin pencari, atau aplikasi pihak ketiga dapat berkomunikasi dengan mulus jika mereka semua mendukung MCP.
MCP menggunakan arsitektur klien-server:
1. Server MCP = Badan Intelijen Konsolidasi
Organisasi atau individu dapat merangkum basis data, sistem file, kalender, dan layanan pihak ketiga ke dalam Server MCP. Server-server ini mematuhi protokol MCP, mengekspos titik akhir akses berformat seragam, memungkinkan setiap agen yang sesuai dengan standar klien MCP untuk mengirim permintaan, mengambil informasi, atau menjalankan operasi.
2. Klien MCP = Peralatan Terminal yang Digunakan oleh Diplomat
Seorang diplomat agen membawa peralatan terminal khusus, yang memungkinkan mereka untuk memasukkan perintah, seperti “Ambil data inventaris dari sistem keuangan,” “Kirim permintaan ke API,” atau “Ambil dokumen PDF.”
Tanpa MCP, berintegrasi dengan berbagai sistem mengharuskan penulisan kode akses yang berbeda, yang rumit. Namun, dengan MCP, klien yang mendukung protokol dapat dengan mudah beralih di antara server MCP yang berbeda, mengambil informasi dan menjalankan proses bisnis.
Intinya, MCP memfasilitasi integrasi yang mulus antara agen AI dan sumber daya eksternal.
Perbedaan Antara A2A dan MCP
Untuk memperjelas perbedaan antara A2A dan MCP, pertimbangkan pertemuan puncak internasional hipotetis di mana kepala negara (yang mewakili Agen AI perusahaan) berkumpul untuk berkolaborasi dalam tugas transnasional, seperti menghasilkan laporan analisis ekonomi global.
Tanpa protokol universal, pertemuan semacam itu hampir tidak mungkin, karena setiap perwakilan berbicara bahasa yang berbeda. Namun, dengan protokol A2A, semua perwakilan menandatangani “Konvensi Diplomatik Wina A2A” sebelum memasuki pertemuan, setuju untuk berkomunikasi menggunakan format yang seragam, mengidentifikasi diri mereka sendiri, menyatakan niat mereka, dan mengutip ID 发言 sebelumnya saat menanggapi.
Ini memungkinkan “Agen G” untuk mengirim pesan ke “Agen O” dalam format A2A, dan “Agen O” merespons sesuai dengan itu. Ini menandai contoh pertama komunikasi tanpa hambatan antara agen AI dari perusahaan yang berbeda.
Selama diskusi, perwakilan AI perlu berkonsultasi dengan data atau menggunakan alat untuk analisis. “Agen A” dari Anthropic menyarankan untuk menggunakan sistem MCP untuk data atau dukungan alat eksternal.
Sebuah “ruang interpretasi simultan MCP” didirikan di samping ruang konferensi, yang diisi oleh para ahli yang dapat merespons dalam bahasa yang seragam melalui MCP setelah menerima permintaan.
Misalnya, “Agen Q” perlu mengakses basis data cloud mereka untuk perhitungan. Alih-alih mengirim seseorang kembali ke negara itu, mereka mengirim permintaan MCP untuk data dari basis data X. Administrator basis data MCP menerjemahkan permintaan, mengambil hasilnya, dan menanggapi “Agen Q” dalam bahasa MCP. Seluruh proses transparan bagi agen lain, yang memahami data yang dikutip oleh “Agen Q” karena terjemahan MCP dalam format yang diakui.
Saat penulisan laporan berlangsung, “Agen G” dan “Agen A” menyadari bahwa mereka perlu mengintegrasikan kontribusi masing-masing. “Agen G” berspesialisasi dalam analisis numerik, sementara “Agen A” unggul dalam peringkasan bahasa.
“Agen G” mengomunikasikan data tingkat pertumbuhan PDB melalui A2A, dan “Agen A” terhubung ke plugin spreadsheet Excel melalui MCP, memverifikasi tren data, dan merespons dengan paragraf ringkasan.
Dalam skenario ini, A2A memfasilitasi komunikasi antar agen, sementara MCP memungkinkan agen untuk mengakses alat dan informasi eksternal. Bersama-sama, protokol membuat perjanjian komunikasi yang disesuaikan untuk versi AI dari Perserikatan Bangsa-Bangsa. Dengan adanya protokol ini, agen AI dapat berkolaborasi secara efektif, membentuk ekosistem AI yang saling berhubungan.
A2A mirip dengan saluran telepon khusus untuk komunikasi diplomatik, yang membahas komunikasi agen langsung. MCP mirip dengan sistem interpretasi simultan dan berbagi sumber daya, yang membahas masalah entitas cerdas yang terhubung dengan informasi eksternal.
Munculnya A2A dan MCP mengumumkan evolusi industri AI menuju kolaborasi daripada persaingan. Agen AI yang tak terhitung jumlahnya akan digunakan seperti situs web, menemukan dan berkomunikasi melalui A2A dan mengakses sumber daya dan berbagi pengetahuan melalui MCP.