Menyahkod Protokol A2A dan MCP dalam Dunia Ejen

Baru-baru ini, Google telah memperkenalkan protokol terbuka baharu untuk Ejen yang dipanggil Agent2Agent, atau ringkasnya A2A. Pada masa yang sama, Bailian Alibaba Cloud juga mengumumkan kemasukan mereka ke dalam MCP. Mari kita mendalami tentang apa itu A2A dan MCP.

Untuk memahami protokol ini, pertimbangkan analogi diplomasi antara negara. Bayangkan setiap ejen AI sebagai sebuah negara kecil dengan bahasa dan adat resamnya sendiri. ‘Negara-negara’ ini mempunyai kedutaan yang ditempatkan di dalam bangunan yang sama, cuba berkomunikasi, berdagang dan bertukar maklumat.

Dalam senario yang ideal, negara-negara ini akan mengekalkan hubungan baik dan mematuhi set peraturan diplomatik yang jelas, membolehkan mereka berinteraksi, menandatangani perjanjian dan bekerjasama dalam projek antarabangsa di sekeliling meja persidangan dengan lancar.

Walau bagaimanapun, realitinya ialah setiap kedutaan beroperasi secara bebas dengan protokol yang berbeza. Akibatnya, memulakan perjanjian perdagangan mudah dengan ‘Negara A’ memerlukan memenuhi pelbagai keperluan, termasuk peruntukan, pensijilan, terjemahan dan kunci khusus. Melibatkan diri dengan ‘Negara B’ dan ‘Negara C’ memerlukan pengulangan prosedur yang serupa berkali-kali. Pendekatan ad-hoc, berpecah-belah dan pelbagai rupa ini meningkatkan kos komunikasi, dengan setiap interaksi menanggung ‘tarif maklumat’ tambahan.

Pada masa lalu, ejen AI menghadapi masalah yang sama apabila cuba bekerjasama.

Contohnya, anda mungkin mempunyai ejen yang membalas e-mel secara automatik dan satu lagi disepadukan ke dalam aplikasi kalendar untuk membantu penjadualan. Walau bagaimanapun, entiti AI ini sukar untuk berkomunikasi secara langsung, memerlukan penyalinan dan penampalan maklumat secara manual atau pergantungan pada antara muka yang dibina khas.

Akibatnya, ejen AI beroperasi secara berasingan, mempamerkan kebolehoperasian yang lemah. Fragmentasi ini mengecewakan pengguna yang mesti menavigasi antara berbilang aplikasi AI dan mengehadkan potensi AI. Tugas kompleks yang boleh dicapai melalui kerjasama berbilang ejen dihadkan secara artifisial dalam silo individu.

Keadaan ini mencerminkan landskap selepas Perang Dunia II, di mana setiap ejen AI bertindak secara autonomi, tanpa peraturan bersatu dan menghadapi halangan komunikasi. Ekosistem AI semasa menyerupai padang pasir selepas perang, memerlukan pematuhan kepada antara muka dan protokol khusus untuk mengakses data dan fungsi. Ketiadaan piawaian mengenakan ‘tarif’ tambahan dengan setiap hubungan kerjasama baharu, yang membawa kepada ekosistem AI yang tidak teratur dan tidak cekap yang dicirikan oleh pengasingan dan kepentingan diri.

Industri AI sedang meneroka kemungkinan mewujudkan protokol yang diterima umum untuk memudahkan interaksi lancar antara ejen dan alatan luaran. Google dan Anthropic telah muncul sebagai pelopor, masing-masing mencadangkan penyelesaian: protokol A2A dan protokol MCP.

Protokol A2A

Protokol A2A, singkatan untuk Agent2Agent, membolehkan ejen AI berkomunikasi dan bekerjasama secara langsung.

Objektif utama protokol A2A adalah untuk membolehkan ejen dari pelbagai asal dan vendor untuk memahami dan bekerjasama antara satu sama lain, sama seperti usaha Pertubuhan Perdagangan Dunia untuk mengurangkan halangan perdagangan.

Dengan menggunakan A2A, ejen daripada vendor dan rangka kerja yang berbeza boleh menyertai zon perdagangan bebas, berkomunikasi menggunakan bahasa yang sama dan bekerjasama dengan lancar untuk mencapai tugas kompleks di luar keupayaan ejen individu.

Untuk menggambarkan cara A2A beroperasi, pertimbangkan analogi berikut:

1. Ejen = Diplomat Negara

Setiap ejen berfungsi sebagai diplomat yang mewakili kedutaan negara. Protokol A2A bertujuan untuk mewujudkan etika diplomatik dan prosedur komunikasi yang seragam. Sebelum ini, diplomat dari ‘Negara A’ berkomunikasi secara eksklusif dalam bahasa Perancis, manakala mereka dari ‘Negara B’ menggunakan skrip Cyrillic, dan ‘Negara C’ menuntut surat-menyurat melalui surat daun emas purba. Protokol A2A memastikan bahawa semua peserta boleh berkomunikasi dalam bahasa yang dipersetujui terlebih dahulu, menyerahkan dokumen dalam format yang sama dan melaksanakan hasil yang dipersetujui.

2. Kad Ejen = Kelayakan Diplomatik / Kad Perniagaan Duta

Dalam rangka kerja A2A, setiap ejen dikehendaki menerbitkan ‘Kad Ejen,’ sama dengan kad perniagaan diplomat, yang mengandungi butiran seperti nama ejen, versi, keupayaan dan bahasa atau format yang disokong.

Sama seperti kad perniagaan diplomat mengenal pasti peranan dan gabungan mereka, Kad Ejen menyenaraikan kemahiran ejen, kaedah pengesahan dan format input/output. Ini membolehkan diplomat lain mengenal pasti dan memahami keupayaan dengan cepat, meminimumkan halangan komunikasi.

3. Tugas = Projek Diplomatik Dua Hala atau Pelbagai Hala

Konsep Tugas adalah teras kepada A2A. Apabila ejen berhasrat untuk mewakilkan tugas kepada ejen lain, ia mengeluarkan ‘surat niat projek kerjasama.’ Setelah diterima, kedua-dua pihak merekodkan ID Tugas untuk menjejaki kemajuan dan bertukar maklumat sehingga selesai.

Dari segi diplomatik, sesebuah negara mungkin mencadangkan kepada negara lain, ‘Kami ingin bekerjasama dalam membina landasan kereta api berkelajuan tinggi rentas sempadan; sila hantar pasukan kejuruteraan anda.’ Ini mencerminkan Tugas A2A, di mana pihak yang memulakan menggariskan keperluan, ejen jauh menerima dan kedua-dua pihak mengemas kini kemajuan secara kerap sepanjang projek.

Mesej mewakili komunikasi yang dipertukarkan semasa peringkat awal atau pertengahan projek, sama seperti kabel diplomatik, nota dan pertukaran utusan.

4. Pemberitahuan Tolak = Buletin Kedutaan Diplomatik

Dalam A2A, jika Tugas adalah projek jangka panjang yang memerlukan masa penyelesaian yang lama, ejen jauh boleh mengemas kini pihak yang memulakan melalui pemberitahuan tolak, sama seperti negara yang memberikan kemas kini berkala tentang projek infrastruktur jangka panjang. Ini meningkatkan keupayaan kerjasama tak segerak.

5. Pengesahan dan Keselamatan = Keistimewaan dan Protokol Diplomatik

A2A menggunakan strategi pengesahan gred perusahaan, yang memerlukan kedua-dua pihak yang berkomunikasi untuk mengesahkan kelayakan untuk mengelakkan penyamaran atau mencuri dengar yang berniat jahat. Mekanisme ini selari dengan keistimewaan dan protokol diplomatik.

Pada dasarnya, A2A mencerminkan dinamik diplomasi antarabangsa atau kerjasama perniagaan, menekankan komunikasi dan keselamatan yang diseragamkan.

Protokol MCP

Protokol MCP, atau Model Context Protocol, ialah piawaian yang diperkenalkan dan sumber terbuka oleh Anthropic pada November 2024.

Walaupun A2A menangani proses komunikasi antara diplomat AI, cabaran berterusan tetap wujud: ketiadaan sumber maklumat yang boleh dipercayai. Malah diplomat atau eksekutif perniagaan yang paling fasih pun tidak bersedia untuk beroperasi dengan berkesan tanpa maklumat yang tepat tentang landskap antarabangsa dan peruntukan sumber.

Diplomat moden bergantung pada alat luaran, seperti sistem visa, sistem penyelesaian antarabangsa dan pangkalan data perisikan, untuk melaksanakan tugas mereka. Begitu juga, ejen yang memikul tanggungjawab yang kompleks mesti menyambung ke pelbagai pangkalan data, sistem dokumen, aplikasi perusahaan dan juga peranti perkakasan.

Ini boleh disamakan dengan mewujudkan agensi perisikan yang komprehensif untuk diplomat dan memberikan mereka akses kepada alat untuk memudahkan kerja mereka.

Sebelum ini, ejen terpaksa membangunkan pemalam tersuai dan menyepadukan secara mendalam dengan alat yang berbeza, yang memakan masa dan memenatkan. Walau bagaimanapun, MCP kini tersedia untuk menyelaraskan proses.

MCP menyeragamkan interaksi antara model bahasa yang besar dan sumber data dan alatan luaran. Anthropic menyamakan MCP dengan port USB-C untuk aplikasi AI.

USB-C berfungsi sebagai antara muka universal untuk peranti, mengendalikan pengecasan dan pemindahan data melalui satu port. MCP bertujuan untuk mencipta antara muka universal dalam domain AI, membolehkan pelbagai model dan sistem luaran untuk menyambung menggunakan protokol yang sama, bukannya membangunkan penyelesaian penyepaduan tersuai setiap kali.

Model AI yang menyambung ke pangkalan data, enjin carian atau aplikasi pihak ketiga boleh berkomunikasi dengan lancar jika semuanya menyokong MCP.

MCP menggunakan seni bina pelanggan-pelayan:

1. Pelayan MCP = Agensi Perisikan Disatukan

Organisasi atau individu boleh merangkumkan pangkalan data, sistem fail, kalendar dan perkhidmatan pihak ketiga ke dalam Pelayan MCP. Pelayan ini mematuhi protokol MCP, mendedahkan titik akhir akses berformat seragam, membolehkan mana-mana ejen yang mematuhi piawaian klien MCP untuk menghantar permintaan, mendapatkan semula maklumat atau melaksanakan operasi.

2. Klien MCP = Peralatan Terminal yang Digunakan oleh Diplomat

Seorang diplomat ejen membawa peralatan terminal khusus, membolehkan mereka memasukkan arahan, seperti ‘Dapatkan semula data inventori daripada sistem kewangan,’ ‘Serahkan permintaan kepada API’ atau ‘Dapatkan semula dokumen PDF.’

Tanpa MCP, penyepaduan dengan pelbagai sistem memerlukan penulisan kod akses yang berbeza, yang menyusahkan. Walau bagaimanapun, dengan MCP, pelanggan yang menyokong protokol boleh bertukar dengan mudah antara pelayan MCP yang berbeza, mendapatkan semula maklumat dan melaksanakan proses perniagaan.

Pada dasarnya, MCP memudahkan penyepaduan lancar antara ejen AI dan sumber luaran.

Perbezaan Antara A2A dan MCP

Untuk menjelaskan perbezaan antara A2A dan MCP, pertimbangkan sidang kemuncak antarabangsa hipotesis di mana ketua negara (mewakili Ejen AI syarikat) berkumpul untuk bekerjasama dalam tugas transnasional, seperti menghasilkan laporan analisis ekonomi global.

Tanpa protokol universal, mesyuarat sedemikian hampir mustahil, kerana setiap wakil bertutur dalam bahasa yang berbeza. Walau bagaimanapun, dengan protokol A2A, semua wakil menandatangani ‘Konvensyen Diplomatik Vienna A2A’ sebelum memasuki mesyuarat, bersetuju untuk berkomunikasi menggunakan format seragam, mengenal pasti diri mereka, menyatakan niat mereka dan memetik ID发言 sebelumnya apabila membalas.

Ini membolehkan ‘Ejen G’ menghantar mesej kepada ‘Ejen O’ dalam format A2A, dan ‘Ejen O’ membalas dengan sewajarnya. Ini menandakan contoh pertama komunikasi tanpa halangan antara ejen AI daripada syarikat yang berbeza.

Semasa perbincangan, wakil AI perlu merujuk data atau menggunakan alatan untuk analisis. ‘Ejen A’ daripada Anthropic mencadangkan penggunaan sistem MCP untuk data luaran atau sokongan alatan.

‘Bilik tafsiran serentak MCP’ disediakan di samping dewan persidangan, yang dikendalikan oleh pakar yang boleh membalas dalam bahasa seragam melalui MCP apabila menerima permintaan.

Contohnya, ‘Ejen Q’ perlu mengakses pangkalan data awan mereka untuk pengiraan. Daripada menghantar seseorang kembali ke negara itu, mereka menghantar permintaan MCP untuk data daripada pangkalan data X. Pentadbir pangkalan data MCP menterjemahkan permintaan itu, mendapatkan semula hasilnya dan membalas kepada ‘Ejen Q’ dalam bahasa MCP. Keseluruhan proses adalah telus kepada ejen lain, yang memahami data yang disebut oleh ‘Ejen Q’ kerana terjemahan MCP adalah dalam format yang diiktiraf.

Apabila penulisan laporan berkembang, ‘Ejen G’ dan ‘Ejen A’ menyedari bahawa mereka perlu menyepadukan sumbangan masing-masing. ‘Ejen G’ pakar dalam analisis berangka, manakala ‘Ejen A’ cemerlang dalam ringkasan bahasa.

‘Ejen G’ menyampaikan data kadar pertumbuhan KDNK melalui A2A, dan ‘Ejen A’ menyambung ke pemalam hamparan Excel melalui MCP, mengesahkan aliran data dan membalas dengan perenggan ringkasan.

Dalam senario ini, A2A memudahkan komunikasi antara ejen, manakala MCP membolehkan ejen mengakses alatan dan maklumat luaran. Bersama-sama, protokol mewujudkan perjanjian komunikasi yang disesuaikan untuk versi AI Pertubuhan Bangsa-Bangsa Bersatu. Dengan protokol ini, ejen AI boleh bekerjasama dengan berkesan, membentuk ekosistem AI yang saling berkaitan.

A2A adalah seperti talian hotline khusus untuk komunikasi diplomatik, menangani komunikasi ejen langsung. MCP serupa dengan sistem tafsiran serentak dan perkongsian sumber, menangani isu entiti pintar yang berhubung dengan maklumat luaran.

Kebangkitan A2A dan MCP menandakan evolusi industri AI ke arah kerjasama dan bukannya persaingan. Ejen AI yang tidak terkira banyaknya akan digunakan seperti tapak web, menemui dan berkomunikasi melalui A2A serta mengakses sumber dan berkongsi pengetahuan melalui MCP.