Senibina Baru Ejen AI: A2A, MCP, Kafka, Flink

Lanskap digital berkembang melangkaui pelayaran web yang berpusatkan manusia ke alam ejen autonomi yang bekerjasama dengan lancar merentasi sistem yang pelbagai. Peralihan ini memerlukan infrastruktur baharu, dan penyelesaian yang menarik sedang terbentuk, terdiri daripada empat komponen sumber terbuka utama.

  • Agent2Agent (A2A) oleh Google: Protokol yang direka untuk memudahkan penemuan dan interaksi ejen.
  • Model Context Protocol (MCP) oleh Anthropic: Standard yang mentakrifkan cara ejen menggunakan alatan dan data kontekstual luaran.
  • Apache Kafka: Tulang belakang komunikasi yang teguh dan didorong acara yang membolehkan penyelarasan yang boleh dipercayai dan terpisah.
  • Apache Flink: Enjin pemprosesan masa nyata, penting untuk memperkaya, memantau dan bertindak ke atas aliran aktiviti ejen.

Artikel ini meneroka hubungan sinergi antara teknologi ini, menyoroti batasan pergantungan semata-mata pada protokol dan menunjukkan bagaimana senibina ini meletakkan asas untuk peralihan daripada bot terpencil kepada ekosistem ejen pintar yang dinamik.

Jangkaan percambahan ejen AI dalam organisasi menunjukkan bahawa kebanyakan syarikat akan menggunakan pelbagai ejen khusus dan bukannya satu yang merangkumi semua. Ejen ini akan mengautomasikan tugas seperti penjanaan kod, pengurusan tiket sokongan, analisis data pelanggan, orientasi pekerja dan pemantauan infrastruktur.

Walau bagaimanapun, alat semasa tidak mencukupi untuk menyokong masa depan sedemikian.

Cabaran ini melangkaui masalah ‘pulau ejen’, di mana ejen berfungsi dalam silo dan kekurangan keupayaan komunikasi. Ia merangkumi fragmentasi ekosistem yang lebih luas:

  • Kurangnya Komunikasi Antara Ejen: Ejen biasanya beroperasi dalam persekitaran terpencil. Ejen pengurusan perhubungan pelanggan (CRM) tidak menyedari cerapan yang diperoleh oleh ejen gudang data. Ejen sokongan tidak boleh bertindak balas terhadap anomali yang dikesan oleh ejen pemantauan.
  • Penggunaan Alat yang Rapuh dan Disesuaikan: Tanpa kaedah standard untuk mengakses alatan atau antara muka pengaturcaraan aplikasi (API) luaran, ejen bergantung pada penyepaduan berkod keras dan logik yang tidak boleh digunakan semula.
  • Rangka Kerja yang Tidak Konsisten: Rangka masa ejen yang berbeza menggunakan model yang pelbagai, melayan ejen sebagai chatbot, graf asiklik terarah (DAG) atau perancang rekursif. Ini menghasilkan ketiadaan lapisan pelaksanaan mudah alih atau keadaan kongsi.
  • Reka Bentuk Berfokuskan pada Persekitaran Buku Nota: Banyak ejen dibangunkan sebagai prototaip sekali sahaja, yang dicirikan oleh operasi linear, segerak dan sementara. Walau bagaimanapun, sistem dunia sebenar memerlukan pengendalian yang teguh bagi percubaan semula, kegagalan, penyelarasan, pengelogan dan penskalaan, yang memerlukan infrastruktur sokongan.
  • Ketiadaan Tulang Belakang Kolaboratif: Tiada bas acara, memori kongsi atau sejarah aktiviti dan alasan ejen yang boleh dikesan. Maklumat terhad kepada panggilan HTTP langsung atau tertimbus dalam log.

Seperti yang ditekankan oleh projek 12-Factor Agents, ejen harus mematuhi prinsip asli awan, mempamerkan kebolehperhatian, gandingan longgar, kebolehulangan dan kesedaran infrastruktur. Malangnya, majoriti dibina sebagai skrip rapuh, dipasang secara manual dan diandaikan beroperasi secara bebas.

Ini mengakibatkan ketidakcekapan, penduaan usaha dan kerapuhan.

Agent2Agent sebahagiannya menangani isu ini dengan menyediakan ejen dengan protokol standard untuk penemuan dan komunikasi. Walau bagaimanapun, peralihan melangkaui demonstrasi cetek kepada kebolehskalaan dan kebolehpercayaan yang dituntut oleh sistem pengeluaran memerlukan lebih daripada sekadar protokol. Ia memerlukan infrastruktur yang komprehensif.

Ekosistem ejen semasa mencerminkan peringkat awal web, yang dicirikan oleh sistem yang berkuasa tetapi terpencil dan tidak serasi. Sama seperti cabaran awal yang dihadapi oleh pelayar yang berkomunikasi dengan pelayan tanpa protokol standard, ejen AI hari ini bergelut untuk menemui, berkomunikasi dan bekerjasama antara satu sama lain dengan berkesan.

Agent2Agent (A2A) Google: Protokol Universal untuk Komunikasi Ejen

Protokol A2A Google ialah percubaan penting untuk menangani isu ini. Ia membezakan dirinya dengan bukan menjadi rangka kerja ejen yang lain, tetapi protokol universal yang direka untuk menghubungkan mana-mana ejen, tanpa mengira asal atau persekitaran penggunaan mereka.

Sama seperti cara HTTP menyeragamkan komunikasi tapak web, A2A mentakrifkan bahasa yang sama untuk ejen, membolehkan mereka:

  • Mengumumkan Keupayaan: Melalui AgentCard, deskriptor JSON yang menggariskan keupayaan dan kaedah interaksi ejen.
  • Menghantar dan Menerima Tugas: Melalui interaksi berstruktur menggunakan JSON-RPC, di mana satu ejen meminta bantuan dan yang lain membalas dengan hasil atau ‘artifak’.
  • Aliran Kemas Kini dengan Peristiwa Dihantar Pelayan (SSE): Memudahkan maklum balas masa nyata semasa tugas yang panjang atau kolaboratif.
  • Bertukar Kandungan Kaya: Menyokong pertukaran fail, data berstruktur dan borang, melangkaui teks ringkas.
  • Mengekalkan Keselamatan Secara Lalai: Membadankan sokongan terbina dalam untuk HTTPS, pengesahan dan kebenaran.

Kekuatan A2A terletak pada pengelakannya daripada mencipta semula penyelesaian yang mantap. Ia memanfaatkan piawaian web yang mantap, serupa dengan HTTP dan SMTP, memudahkan penerimaan yang lebih mudah dan penyepaduan yang lebih pantas.

Walau bagaimanapun, A2A hanya mewakili satu aspek penyelesaian keseluruhan.

Model Context Protocol (MCP) Anthropic: Menyeragamkan Penggunaan Alat dan Akses Konteks

MCP Anthropic menangani aspek penting tentang cara ejen menggunakan alatan dan mengakses maklumat kontekstual. MCP menyeragamkan proses di mana ejen memanggil API, memanggil fungsi dan menyepadukan dengan sistem luaran, pada dasarnya mentakrifkan cara mereka beroperasi dalam persekitaran mereka. Walaupun A2A mengawal komunikasi antara ejen, MCP memfokuskan pada interaksi ejen dengan dunia luar.

Pada asasnya:

  • MCP memperkasakan kecerdasan ejen individu.
  • A2A membolehkan kecerdasan kolektif.

Sama seperti cara HTTP dan SMTP memerlukan penerimaan, infrastruktur dan alat pembangun yang meluas untuk mencapai kejayaan yang meluas, A2A dan MCP akan memerlukan ekosistem yang teguh untuk merealisasikan sepenuhnya potensi mereka.

Walaupun dengan usaha penyeragaman seperti A2A dan MCP, soalan penting masih berterusan: Bagaimanakah komunikasi ejen boleh diskalakan dengan berkesan merentasi persekitaran perusahaan yang kompleks dan dinamik? Bergantung semata-mata pada sambungan langsung dan titik ke titik yang ditakrifkan oleh protokol ini memperkenalkan cabaran yang berkaitan dengan kebolehskalaan, daya tahan dan kebolehperhatian. Ini menyoroti keperluan untuk infrastruktur komunikasi asas yang teguh.

Pertimbangkan sebuah syarikat di mana pekerja hanya boleh berkomunikasi melalui mesej langsung dan satu lawan satu. Berkongsi kemas kini memerlukan menghantar mesej kepada setiap individu secara berasingan. Menyelaras projek merentasi berbilang pasukan akan melibatkan menyampaikan maklumat secara manual antara setiap kumpulan.

Menskala sistem sedemikian kepada beratus-ratus pekerja akan mengakibatkan kekacauan.

Senario ini mencerminkan cabaran yang dihadapi dalam ekosistem ejen yang dibina pada sambungan langsung. Setiap ejen mesti tahu ejen mana untuk dihubungi, cara menghubunginya dan ketersediaan mereka. Apabila bilangan ejen meningkat, bilangan sambungan yang diperlukan berkembang secara eksponen, menghasilkan sistem yang rapuh, sukar diurus dan tidak boleh diskalakan.

A2A dan MCP menyediakan ejen dengan bahasa dan struktur untuk komunikasi dan tindakan. Walau bagaimanapun, bahasa sahaja tidak mencukupi. Untuk menyelaraskan banyak ejen merentasi perusahaan, infrastruktur diperlukan untuk mengurus aliran mesej dan respons ejen.

Apache Kafka dan Apache Flink menyediakan infrastruktur penting ini.

Apache Kafka, yang asalnya dibangunkan di LinkedIn dan kini merupakan projek Apache Software Foundation, ialah platform penstriman acara teragih. Ia berfungsi sebagai bas mesej tahan lama dan berdaya pemprosesan tinggi, membolehkan sistem menerbitkan dan melanggan aliran acara masa nyata. Kafka digunakan secara meluas dalam pelbagai aplikasi, termasuk sistem kewangan, pengesanan penipuan dan saluran paip telemetri, kerana keupayaannya untuk memisahkan pengeluar daripada pengguna dan memastikan ketahanan data, kebolehulangan dan kebolehskalaan.

Flink, satu lagi projek Apache, ialah enjin pemprosesan aliran masa nyata yang direka untuk pemprosesan acara keadaan, daya pemprosesan tinggi dan kependaman rendah. Walaupun Kafka mengurus pergerakan data, Flink mengendalikan transformasi, pengayaan, pemantauan dan orkestrasi data semasa ia mengalir melalui sistem.

Bersama-sama, Kafka dan Flink membentuk gabungan yang berkuasa. Kafka berfungsi sebagai aliran darah, manakala Flink bertindak sebagai sistem refleks.

Sama seperti peranan A2A sebagai HTTP dunia ejen, Kafka dan Flink menyediakan asas didorong acara untuk komunikasi dan pengiraan ejen yang boleh diskalakan, menangani cabaran yang tidak boleh dilakukan oleh komunikasi langsung dan titik ke titik:

  • Pengasingan: Dengan Kafka, ejen tidak perlu mengetahui pengguna output mereka. Mereka menerbitkan acara (contohnya, ‘“TaskCompleted”‘, ‘“InsightGenerated”‘) ke topik, membenarkan mana-mana ejen atau sistem yang berminat untuk melanggan.
  • Kebolehperhatian dan Kebolehulangan: Kafka mengekalkan log semua acara yang tahan lama dan mengikut urutan masa, memastikan bahawa tingkah laku ejen boleh dikesan sepenuhnya, diaudit dan boleh diulang.
  • Pengambilan Keputusan Masa Nyata: Flink membenarkan ejen untuk bertindak balas dalam masa nyata kepada aliran acara, menapis, memperkaya, menyertai atau mencetuskan tindakan berdasarkan keadaan dinamik.
  • Daya Tahan dan Penskalaan: Tugas Flink boleh menskala secara bebas, pulih daripada kegagalan dan mengekalkan keadaan merentasi aliran kerja yang berjalan lama, yang penting untuk ejen yang melaksanakan tugas berbilang langkah yang kompleks.
  • Penyelarasan Asli Aliran: Daripada menunggu respons segerak, ejen boleh menyelaraskan melalui aliran acara, menerbitkan kemas kini, melanggan aliran kerja dan bekerjasama memajukan keadaan.

Ringkasnya:

  • A2A mentakrifkan cara ejen berkomunikasi.
  • MCP mentakrifkan cara mereka berinteraksi dengan alat luaran.
  • Kafka mentakrifkan cara mesej mereka mengalir.
  • Flink mentakrifkan cara aliran tersebut diproses, ditransformasi dan digunakan untuk membuat keputusan.

Protokol seperti A2A dan MCP adalah penting untuk menyeragamkan tingkah laku dan komunikasi ejen. Walau bagaimanapun, tanpa substrat didorong acara seperti Kafka dan masa jalan asli aliran seperti Flink, ejen kekal terpencil, tidak dapat menyelaraskan dengan berkesan, menskala dengan cekap atau menaakul dari semasa ke semasa.

Senibina Empat Lapisan untuk Ejen AI Gred Perusahaan

Untuk merealisasikan sepenuhnya visi ejen AI gred perusahaan yang boleh saling beroperasi, senibina empat lapisan diperlukan:

  • Protokol: A2A, MCP – mentakrifkan apa.
  • Rangka Kerja: LangGraph, CrewAI, ADK – mentakrifkan bagaimana.
  • Infrastruktur Pemesejan: Apache Kafka – menyokong aliran.
  • Pengiraan Masa Nyata: Apache Flink – menyokong pemikiran.

Bersama-sama, lapisan ini membentuk tindanan internet baharu untuk ejen AI, menyediakan asas untuk membina sistem yang bukan sahaja pintar tetapi juga kolaboratif, boleh diperhatikan dan sedia pengeluaran.

Kami kini berada pada titik penting dalam evolusi perisian.

Sama seperti tindanan internet asal – yang terdiri daripada protokol seperti HTTP dan SMTP dan infrastruktur seperti TCP/IP – membawa era sambungan global, tindanan baharu sedang muncul untuk ejen AI. Walau bagaimanapun, dan bukannya manusia menavigasi halaman web atau menghantar e-mel, tindanan ini direka untuk sistem autonomi yang bekerjasama untuk menaakul, membuat keputusan dan bertindak.

A2A dan MCP menyediakan protokol untuk komunikasi ejen dan penggunaan alat, manakala Kafka dan Flink menyediakan infrastruktur untuk penyelarasan, kebolehperhatian dan daya tahan masa nyata. Bersama-sama, mereka membolehkan peralihan daripada demonstrasi ejen yang terputus kepada ekosistem gred pengeluaran yang boleh diskalakan, pintar.

Evolusi ini bukan semata-mata tentang menangani cabaran kejuruteraan. Ia adalah tentang membolehkan paradigma baharu perisian di mana ejen bekerjasama merentasi sempadan, memberikan cerapan dan memacu tindakan dalam masa nyata, dengan itu membolehkan kecerdasan menjadi sistem teragih.

Walau bagaimanapun, visi ini memerlukan pembangunan aktif, menekankan keterbukaan, kebolehoperasian dan memanfaatkan pengajaran yang dipelajari daripada revolusi internet sebelumnya.

Oleh itu, apabila membangunkan ejen, adalah penting untuk mempertimbangkan penyepaduannya dalam sistem yang lebih luas. Bolehkah ia berkomunikasi dengan berkesan? Bolehkah ia menyelaraskan dengan ejen lain? Bolehkah ia berkembang dan menyesuaikan diri dengan keadaan yang berubah-ubah?

Masa depan bukan sahaja dikuasakan oleh ejen; ia disambungkan dengan ejen.