Lanskap Kecerdasan Buatan (Artificial Intelligence) berkembang pesat, dengan Agen AI (AI Agents) muncul sebagai komponen penting. Sebuah Agen AI pada dasarnya menggabungkan kecakapan kognitif dari Model Bahasa Besar (Large Language Model/LLM) dengan perangkat yang memungkinkannya untuk menjalankan perintah, mengambil informasi, dan menyelesaikan tugas secara mandiri. Agen-agen ini menanggapi permintaan dari pengguna atau berinteraksi dengan agen lain. Potensi agen AI terletak pada kemampuannya untuk meningkatkan skala operasi, mengotomatiskan proses rumit, dan meningkatkan efisiensi di berbagai fungsi bisnis, secara signifikan meningkatkan produktivitas individu.
Konsensusnya adalah bahwa agen “satu ukuran untuk semua” universal tidak dapat secara efektif menangani tugas-tugas yang beragam dan kompleks yang diharapkan dari agen AI. Solusinya terletak pada Alur Kerja Agentic (Agentic Workflows). Ini dibuat oleh jaringan Agen AI otonom yang dapat membuat keputusan, menjalankan tindakan, dan mengoordinasikan tugas dengan pengawasan manusia minimal.
Visi Google untuk Interoperabilitas Agen: Protokol Agent2Agent (A2A)
Google memperkenalkan protokol Agent2Agent (A2A) pada 9 April 2025. Ini dirancang untuk memfasilitasi komunikasi yang mulus antara agen AI, memungkinkan mereka untuk bertukar data secara aman dan mengotomatiskan alur kerja bisnis yang kompleks. Ini dicapai melalui interaksi dengan sistem perusahaan dan platform pihak ketiga.
Protokol A2A adalah hasil kolaborasi antara Google dan lebih dari 50 mitra industri, semuanya berbagi visi yang sama untuk masa depan kolaborasi Agen AI. Yang terpenting, kolaborasi ini melampaui teknologi spesifik dan didasarkan pada standar terbuka dan aman.
Prinsip Desain Inti A2A
Selama pengembangan protokol A2A, Google dan mitranya dipandu oleh beberapa prinsip fundamental:
- Terbuka dan Agnostik Vendor (Open and Vendor-Agnostic): Protokol A2A harus terbuka, yang berarti spesifikasinya dapat diakses publik. Ini memastikan bahwa setiap pengembang atau organisasi dapat mengimplementasikan protokol tanpa batasan kepemilikan. Agnostik vendor berarti protokol tidak terikat pada teknologi vendor tertentu. Ini mendorong lapangan permainan yang setara untuk semua peserta.
- Modalitas Alami untuk Kolaborasi (Natural Modalities for Collaboration): A2A memungkinkan agen untuk berkolaborasi menggunakan metode komunikasi bawaan dan tidak terstruktur mereka. Ini membedakan agen dari alat dan membedakan A2A dari Protokol Konteks Model (MCP).
- Dibangun di Atas Standar yang Ada (Built on Existing Standards): Untuk menyederhanakan integrasi dengan infrastruktur TI yang ada, protokol ini dibangun di atas standar yang mapan seperti HTTP, Server-Sent Events (SSE), dan JSON-RPC.
- Aman Secara Default (Secure by Default): Keamanan adalah perhatian utama. A2A menggabungkan mekanisme otentikasi dan otorisasi tingkat perusahaan untuk melindungi data sensitif dan memastikan interaksi yang aman.
- Agnostik Modalitas Data (Data Modality Agnostic): A2A tidak terbatas pada komunikasi berbasis teks. Ia dapat menangani berbagai jenis data, termasuk gambar, audio, dan aliran video.
Fungsionalitas A2A: Memberdayakan Kolaborasi Agen
A2A menyediakan berbagai fungsionalitas bawaan untuk menyederhanakan interaksi agen:
- Penemuan Kemampuan (Capability Discovery): Ini memungkinkan agen untuk mengiklankan kemampuan mereka. Klien dapat dengan mudah mengidentifikasi agen mana yang paling cocok untuk tugas tertentu. Pikirkan ini seperti pasar digital tempat agen memamerkan keterampilan dan keahlian mereka.
- Manajemen Tugas dan Status (Task and State Management): Komunikasi antara klien dan agen berkisar pada pelaksanaan Tugas (Tasks). Tugas-tugas ini didefinisikan oleh protokol dan memiliki siklus hidup yang terdefinisi dengan baik. Hasil dari suatu tugas disebut sebagai Artefak (Artifact). Manajemen baik tugas maupun statusnya memastikan alur kerja yang andal dan dapat dilacak.
- Kolaborasi Aman (Secure Collaboration): Agen dapat bertukar pesan dengan aman untuk berbagi konteks, memberikan respons, mengirimkan artefak, atau menyampaikan instruksi pengguna. Ini memfasilitasi lingkungan kolaboratif tempat agen dapat bekerja sama dengan lancar.
- Negosiasi Pengalaman Pengguna (User Experience Negotiation): Setiap pesan menyertakan “bagian (parts)”, yang merupakan potongan konten mandiri, seperti gambar yang dihasilkan. Setiap bagian memiliki jenis konten yang ditentukan, yang memungkinkan baik klien maupun agen jarak jauh untuk menyetujui format yang diperlukan. Fitur ini juga mencakup negosiasi kemampuan UI pengguna, seperti iframe, video, dan formulir web.
Fitur Penemuan Kemampuan dan Negosiasi Pengalaman Pengguna sangat menarik karena membuka jalan bagi pembuatan Pasar Agen (Agent Marketplaces). Di pasar ini, penyedia dapat mencantumkan agen mereka, dan klien dapat memilih agen yang paling tepat untuk melakukan tugas tertentu.
Meskipun konsep ini sangat menjanjikan dan berpotensi penting untuk pertumbuhan pasar Agen AI, mewujudkan visi ini membutuhkan lebih dari sekadar mendefinisikan protokol interaksi.
Menguraikan Konsep Protokol Agent2Agent
Memahami konsep inti yang mendasari protokol sangat penting untuk implementasi dan pemanfaatan yang efektif. Konsep-konsep ini sudah familiar bagi banyak pengembang Agen AI:
- Kartu Agen (Agent Card): Ini adalah file metadata publik yang merinci kemampuan, keterampilan, URL titik akhir, dan persyaratan otentikasi agen. Kartu Agen memainkan peran penting dalam fase penemuan, memungkinkan pengguna untuk memilih agen yang sesuai dan memahami cara berinteraksi dengannya.
- Server: Agen yang mengimplementasikan metode protokol A2A, seperti yang didefinisikan dalam spesifikasi JSON. Pada dasarnya, Server adalah agen yang menawarkan layanannya melalui protokol A2A.
- Klien (Client): Ini bisa berupa aplikasi atau agen lain yang mengonsumsi layanan A2A. Klien memulai permintaan dan memanfaatkan kemampuan yang ditawarkan oleh Server.
- Tugas (Task): Unit kerja fundamental untuk Agen. Dimulai oleh Klien dan dilakukan oleh Server, ia berkembang melalui berbagai status sepanjang siklus hidupnya.
- Pesan (Message): Mewakili pertukaran komunikasi antara Klien dan Agen. Setiap Pesan memiliki peran yang ditentukan dan terdiri dari Bagian (Parts).
- Bagian (Part): Ini adalah unit konten dasar dalam Pesan atau Artefak. Bagian dapat berupa teks, file, atau data terstruktur. Ini memungkinkan komunikasi fleksibel dari berbagai jenis data.
- Artefak (Artifact): Mewakili output yang dihasilkan oleh agen saat menyelesaikan Tugas. Seperti Pesan, Artefak berisi Bagian.
- Streaming: Protokol mendukung streaming, memungkinkan Server untuk memperbarui Klien tentang status tugas yang berjalan lama secara real-time. Ini meningkatkan pengalaman pengguna dengan memberikan umpan balik berkelanjutan.
Lanskap Terkini Proyek Agent2Agent
A2A baru-baru ini diperkenalkan kepada publik, dan spesifikasinya sekarang tersedia di GitHub. Sampai sekarang, tidak ada peta jalan resmi atau implementasi protokol yang siap produksi. Namun, Google secara aktif berkolaborasi dengan mitra untuk meluncurkan versi yang siap produksi pada akhir tahun 2025.
Repositori A2A GitHub menyediakan beberapa contoh kode dalam TypeScript dan Python, bersama dengan aplikasi demo yang komprehensif. Aplikasi ini menampilkan interaksi antara agen yang dikembangkan menggunakan berbagai Kit Pengembangan Agen (Agent Development Kits/ADK).
Meskipun ini memberikan dasar untuk eksperimen, A2A harus diintegrasikan ke dalam ekosistem kerangka kerja dan alat yang ada yang digunakan untuk menyebarkan Alur Kerja Agentic sebelum dapat diadopsi dalam aplikasi penting misi.
Dukungan dari sejumlah besar pemain utama (khususnya, tidak ada perusahaan yang menyediakan model fondasi yang hadir) yang bekerja dengan Google dalam definisi protokol sangat menunjukkan bahwa alat yang diperlukan akan segera tersedia dan bahwa A2A akan diintegrasikan ke dalam kerangka kerja agen terkemuka.
A2A vs. Protokol Konteks Model (Model Context Protocol/MCP): Memahami Perbedaan
Protokol Konteks Model (MCP), yang dikembangkan oleh Anthropic, memungkinkan aplikasi untuk memberikan konteks ke Model Bahasa Besar. Anthropic menggambarkan MCP sebagai “port USB-C untuk aplikasi AI,” menawarkan cara standar untuk menghubungkan LLM ke sumber data dan alat, seperti halnya USB menghubungkan berbagai periferal ke perangkat.
Menurut Google, A2A tidak dimaksudkan untuk menggantikan MCP. Ada tumpang tindih minimal antara kedua protokol; mereka mengatasi masalah yang berbeda dan beroperasi pada tingkat abstraksi yang berbeda. A2A memfasilitasi interaksi antara Agen, sementara MCP menghubungkan Model Bahasa Besar ke alat, yang pada gilirannya menghubungkannya ke layanan dan data. Kedua protokol tersebut dengan demikian saling melengkapi.
Agent2Agent dan Protokol Konteks Model adalah dua bagian dari teka-teki yang sama, dan keduanya akan diperlukan untuk mewujudkan visi masa depan untuk alur kerja agentic dan AI yang ada di mana-mana.
Dengan kata lain, A2A fokus pada bagaimana agen-agen AI berkomunikasi dan berkolaborasi satu sama lain untuk menyelesaikan tugas yang lebih kompleks. Ini memungkinkan agen untuk menemukan kemampuan agen lain, bertukar informasi, dan mengoordinasikan tindakan mereka. Sementara itu, MCP berfokus pada bagaimana sebuah aplikasi dapat memberikan konteks yang relevan kepada LLM agar LLM dapat menghasilkan respons yang lebih akurat dan relevan.
Analogi yang baik adalah membayangkan A2A sebagai protokol untuk mengoordinasikan tim pekerja, sedangkan MCP adalah cara untuk memberi setiap pekerja informasi yang mereka butuhkan untuk melakukan pekerjaan mereka dengan baik.
Tanpa A2A, agen-agen AI akan kesulitan untuk bekerja sama satu sama lain, yang akan membatasi kemampuan mereka untuk menyelesaikan tugas yang kompleks. Tanpa MCP, LLM akan kesulitan untuk memahami konteks pertanyaan atau perintah yang diberikan kepada mereka, yang akan menghasilkan respons yang kurang akurat atau relevan.
Keduanya sangat penting dalam membangun masa depan AI. Mereka memungkinkan agen-agen AI untuk bekerja sama secara efektif dan LLM untuk memahami konteks yang relevan. Dengan kombinasi kedua teknologi ini, kita dapat membangun sistem AI yang lebih cerdas, efisien, dan bermanfaat.
Meskipun A2A masih dalam tahap pengembangan awal, itu memiliki potensi untuk merevolusi cara kita berinteraksi dengan AI. Dengan memungkinkan agen-agen AI untuk bekerja sama secara efektif, kita dapat membangun sistem AI yang lebih kuat dan serbaguna yang dapat menyelesaikan tugas yang sebelumnya tidak mungkin.
Sebagai contoh, bayangkan sebuah sistem AI yang dapat merencanakan dan melaksanakan perjalanan. Sistem ini akan membutuhkan kemampuan untuk berinteraksi dengan berbagai agen, seperti agen pemesanan penerbangan, agen pemesanan hotel, dan agen penyewaan mobil. Dengan menggunakan A2A, sistem ini dapat menemukan kemampuan agen-agen ini, bertukar informasi, dan mengoordinasikan tindakan mereka untuk merencanakan dan melaksanakan perjalanan dengan lancar.
Contoh lain adalah sistem AI yang dapat membantu dokter mendiagnosis penyakit. Sistem ini akan membutuhkan kemampuan untuk menganalisis data medis, seperti catatan pasien, hasil tes laboratorium, dan gambar medis. Sistem ini juga perlu berinteraksi dengan agen lain, seperti agen penelitian medis dan agen ahli medis. Dengan menggunakan A2A, sistem ini dapat menemukan kemampuan agen-agen ini, bertukar informasi, dan mengoordinasikan tindakan mereka untuk membantu dokter mendiagnosis penyakit dengan lebih akurat dan efisien.
Singkatnya, A2A adalah teknologi yang menjanjikan yang memiliki potensi untuk merevolusi cara kita berinteraksi dengan AI. Dengan memungkinkan agen-agen AI untuk bekerja sama secara efektif, kita dapat membangun sistem AI yang lebih kuat dan serbaguna yang dapat menyelesaikan tugas yang sebelumnya tidak mungkin.
Masa depan AI terletak pada kolaborasi dan interoperabilitas. Protokol seperti A2A dan MCP adalah kunci untuk membuka potensi penuh AI dan mewujudkan visi masa depan yang lebih cerdas, efisien, dan bermanfaat. Seiring dengan perkembangan dan pematangan protokol-protokol ini, kita dapat mengharapkan untuk melihat peningkatan dramatis dalam kemampuan dan aplikasi AI.