Protokol Agent2Agent Google: Penerokaan Mendalam

Landskap Kecerdasan Buatan (Artificial Intelligence) berkembang pesat, dengan Ejen AI muncul sebagai komponen penting. Ejen AI pada asasnya menggabungkan kehebatan kognitif Model Bahasa Besar (LLM) dengan kit alat yang membolehkannya melaksanakan perintah, mendapatkan semula maklumat, dan menyelesaikan tugas secara autonomi. Ejen-ejen ini bertindak balas kepada permintaan daripada pengguna atau berinteraksi dengan ejen lain. Potensi ejen AI terletak pada keupayaan mereka untuk menskala operasi, mengautomasikan proses yang rumit, dan meningkatkan kecekapan merentasi pelbagai fungsi perniagaan, meningkatkan produktiviti individu dengan ketara.

Konsensusnya ialah ejen “satu saiz untuk semua” universal tidak dapat menangani tugas yang pelbagai dan kompleks yang diharapkan daripada ejen AI dengan berkesan. Penyelesaiannya terletak pada Aliran Kerja Keagenan (Agentic Workflows). Ini dicipta oleh rangkaian Ejen AI autonomi yang boleh membuat keputusan, melaksanakan tindakan, dan menyelaraskan tugas dengan pengawasan manusia yang minimum.

Visi Google untuk Kesalingoperasian Ejen: Protokol Agent2Agent (A2A)

Google memperkenalkan protokol Agent2Agent (A2A) pada 9 April 2025. Ia direka untuk memudahkan komunikasi lancar antara ejen AI, membolehkan mereka bertukar data dengan selamat dan mengautomasikan aliran kerja perniagaan yang kompleks. Ini dicapai melalui interaksi dengan sistem perusahaan dan platform pihak ketiga.

Protokol A2A adalah hasil kerjasama antara Google dan lebih 50 rakan industri, semuanya berkongsi visi yang sama untuk masa depan kerjasama Ejen AI. Pentingnya, kerjasama ini melangkaui teknologi tertentu dan diasaskan pada piawaian terbuka dan selamat.

Prinsip Reka Bentuk Teras A2A

Semasa pembangunan protokol A2A, Google dan rakan-rakannya dipandu oleh beberapa prinsip asas:

  • Terbuka dan Agnostik Vendor: Protokol A2A mestilah terbuka, bermakna spesifikasinya boleh diakses oleh umum. Ini memastikan bahawa mana-mana pembangun atau organisasi boleh melaksanakan protokol tanpa sekatan proprietari. Agnostik vendor bermakna protokol itu tidak terikat kepada teknologi vendor tertentu. Ini memupuk medan permainan yang sama rata untuk semua peserta.
  • Modaliti Semula Jadi untuk Kerjasama: A2A membenarkan ejen untuk bekerjasama menggunakan kaedah komunikasi yang sedia ada dan tidak berstruktur. Ini membezakan ejen daripada alat dan membezakan A2A daripada Protokol Konteks Model (MCP).
  • Dibina Berdasarkan Piawaian Sedia Ada: Untuk memudahkan penyepaduan dengan infrastruktur IT sedia ada, protokol ini dibina berdasarkan piawaian yang telah ditetapkan seperti HTTP, Server-Sent Events (SSE), dan JSON-RPC.
  • Selamat Secara Lalai: Keselamatan adalah kebimbangan utama. A2A menggabungkan mekanisme pengesahan dan kebenaran gred perusahaan untuk melindungi data sensitif dan memastikan interaksi yang selamat.
  • Agnostik Modaliti Data: A2A tidak terhad kepada komunikasi berasaskan teks. Ia boleh mengendalikan pelbagai jenis data, termasuk imej, audio, dan strim video.

Fungsi A2A: Memperkasakan Kerjasama Ejen

A2A menyediakan pelbagai fungsi terbina dalam untuk memperkemas interaksi ejen:

  • Penemuan Keupayaan: Ini membolehkan ejen mengiklankan keupayaan mereka. Pelanggan boleh dengan mudah mengenal pasti ejen mana yang paling sesuai untuk tugas tertentu. Bayangkan ia seperti pasaran digital di mana ejen mempamerkan kemahiran dan kepakaran mereka.
  • Pengurusan Tugas dan Keadaan: Komunikasi antara pelanggan dan ejen berkisar pada pelaksanaan Tugas. Tugas-tugas ini ditakrifkan oleh protokol dan mempunyai kitaran hayat yang ditakrifkan dengan baik. Hasil daripada tugas dirujuk sebagai Artifak. Pengurusan kedua-dua tugas dan keadaannya memastikan aliran kerja yang boleh dipercayai dan boleh dikesan.
  • Kerjasama Selamat: Ejen boleh bertukar mesej dengan selamat untuk berkongsi konteks, memberikan respons, menyampaikan artifak, atau menyampaikan arahan pengguna. Ini memudahkan persekitaran kerjasama di mana ejen boleh bekerjasama dengan lancar.
  • Rundingan Pengalaman Pengguna: Setiap mesej termasuk “bahagian,” yang merupakan kandungan kendiri, seperti imej yang dijana. Setiap bahagian mempunyai jenis kandungan yang ditentukan, yang membolehkan kedua-dua pelanggan dan ejen jauh bersetuju dengan format yang diperlukan. Ciri ini juga merangkumi rundingan keupayaan UI pengguna, seperti iframes, video, dan borang web.

Ciri Penemuan Keupayaan dan Rundingan Pengalaman Pengguna amat menarik kerana ia membuka jalan untuk penciptaan Pasaran Ejen. Di pasaran ini, penyedia boleh menyenaraikan ejen mereka, dan pelanggan boleh memilih ejen yang paling sesuai untuk melaksanakan tugas tertentu.

Walaupun konsep ini sangat menjanjikan dan berpotensi penting untuk pertumbuhan pasaran Ejen AI, merealisasikan visi ini memerlukan lebih daripada sekadar mentakrifkan protokol interaksi.

Menyahkod Konsep Protokol Agent2Agent

Memahami konsep teras yang mendasari protokol adalah penting untuk pelaksanaan dan penggunaan yang berkesan. Konsep-konsep ini sudah biasa kepada ramai pembangun Ejen AI:

  • Kad Ejen: Ini ialah fail metadata awam yang memperincikan keupayaan, kemahiran, URL titik akhir, dan keperluan pengesahan ejen. Kad Ejen memainkan peranan penting dalam fasa penemuan, membolehkan pengguna memilih ejen yang sesuai dan memahami cara berinteraksi dengannya.
  • Pelayan: Ejen yang melaksanakan kaedah protokol A2A, seperti yang ditakrifkan dalam spesifikasi JSON. Pada dasarnya, Pelayan ialah ejen yang menawarkan perkhidmatannya melalui protokol A2A.
  • Pelanggan: Ini boleh menjadi aplikasi atau ejen lain yang menggunakan perkhidmatan A2A. Pelanggan memulakan permintaan dan menggunakan keupayaan yang ditawarkan oleh Pelayan.
  • Tugas: Unit kerja asas untuk Ejen. Dimulakan oleh Pelanggan dan dilakukan oleh Pelayan, ia berlangsung melalui pelbagai keadaan sepanjang kitaran hayatnya.
  • Mesej: Mewakili pertukaran komunikasi antara Pelanggan dan Ejen. Setiap Mesej mempunyai peranan yang ditentukan dan terdiri daripada Bahagian.
  • Bahagian: Ini ialah unit kandungan asas dalam Mesej atau Artifak. Bahagian boleh berupa teks, fail, atau data berstruktur. Ini membolehkan komunikasi fleksibel pelbagai jenis data.
  • Artifak: Mewakili output yang dihasilkan oleh ejen semasa menyelesaikan Tugas. Seperti Mesej, Artifak mengandungi Bahagian.
  • Strim: Protokol menyokong penstriman, membenarkan Pelayan mengemas kini Pelanggan tentang status tugas yang berjalan lama dalam masa nyata. Ini meningkatkan pengalaman pengguna dengan memberikan maklum balas yang berterusan.

Landskap Semasa Projek Agent2Agent

A2A baru-baru ini diperkenalkan kepada umum, dan spesifikasinya kini tersedia di GitHub. Sehingga kini, tiada pelan hala tuju rasmi atau pelaksanaan protokol yang sedia untuk pengeluaran. Walau bagaimanapun, Google sedang aktif bekerjasama dengan rakan kongsi untuk melancarkan versi yang sedia untuk pengeluaran kemudian pada tahun 2025.

Repositori A2A GitHub menyediakan beberapa contoh kod dalam TypeScript dan Python, bersama dengan aplikasi demo yang komprehensif. Aplikasi ini mempamerkan interaksi antara ejen yang dibangunkan menggunakan Kit Pembangunan Ejen (ADK) yang berbeza.

Walaupun ini menyediakan asas untuk eksperimen, A2A mesti disepadukan ke dalam ekosistem rangka kerja dan alatan sedia ada yang digunakan untuk menggunakan Aliran Kerja Keagenan sebelum ia boleh diterima pakai dalam aplikasi kritikal misi.

Sokongan daripada sebilangan besar pemain utama (terutamanya, tiada satu pun syarikat yang menyediakan model asas hadir) yang bekerjasama dengan Google dalam definisi protokol sangat mencadangkan bahawa alatan yang diperlukan akan segera tersedia dan A2A akan disepadukan ke dalam rangka kerja ejen terkemuka.

A2A lwn. Protokol Konteks Model (MCP): Memahami Perbezaan

Protokol Konteks Model (MCP), yang dibangunkan oleh Anthropic, membolehkan aplikasi memberikan konteks kepada Model Bahasa Besar. Anthropic menyifatkan MCP sebagai “port USB-C untuk aplikasi AI,” menawarkan cara yang diseragamkan untuk menyambungkan LLM kepada sumber dan alatan data, sama seperti USB menyambungkan pelbagai periferal kepada peranti.

Menurut Google, A2A tidak bertujuan untuk menggantikan MCP. Terdapat pertindihan yang minimum antara kedua-dua protokol; mereka menangani masalah yang berbeza dan beroperasi pada tahap abstraksi yang berbeza. A2A memudahkan interaksi antara Ejen, manakala MCP menghubungkan Model Bahasa Besar kepada alatan, yang seterusnya menghubungkannya kepada perkhidmatan dan data. Oleh itu, kedua-dua protokol saling melengkapi.

Agent2Agent dan Protokol Konteks Model adalah dua kepingan kepada teka-teki yang sama, dan kedua-duanya akan diperlukan untuk merealisasikan visi masa depan untuk aliran kerja keagenan dan AI di mana-mana.