الكشف عن بروتوكول Agent2Agent من Google

الكشف عن بروتوكول Agent2Agent من Google: نظرة معمقة على قابلية التشغيل البيني لوكلاء الذكاء الاصطناعي

يتطور مشهد الذكاء الاصطناعي بسرعة، حيث يظهر وكلاء الذكاء الاصطناعي كمكون محوري. يجمع وكيل الذكاء الاصطناعي بشكل أساسي بين البراعة المعرفية لـ نموذج لغوي كبير (LLM) ومجموعة أدوات تمكنه من تنفيذ الأوامر واسترجاع المعلومات وإنجاز المهام بشكل مستقل. يستجيب هؤلاء الوكلاء لطلبات المستخدمين أو يتفاعلون مع وكلاء آخرين. تكمن إمكانات وكلاء الذكاء الاصطناعي في قدرتهم على توسيع نطاق العمليات وأتمتة العمليات المعقدة وتعزيز الكفاءة عبر مختلف وظائف الأعمال، مما يعزز بشكل كبير إنتاجية الفرد.

هناك إجماع على أن الوكيل العالمي ‘مقاس واحد يناسب الجميع’ لا يمكنه التعامل بفعالية مع المهام المتنوعة والمعقدة المتوقعة من وكلاء الذكاء الاصطناعي. يكمن الحل في تدفقات العمل الوكيلة. يتم إنشاؤها بواسطة شبكات من وكلاء الذكاء الاصطناعي المستقلين الذين يمكنهم اتخاذ القرارات وتنفيذ الإجراءات وتنسيق المهام بأقل قدر من الرقابة البشرية.

رؤية Google لقابلية التشغيل البيني للوكيل: بروتوكول Agent2Agent (A2A)

قدمت Google بروتوكول Agent2Agent (A2A) في 9 أبريل 2025. وهو مصمم لتسهيل الاتصال السلس بين وكلاء الذكاء الاصطناعي، مما يسمح لهم بتبادل البيانات بشكل آمن وأتمتة تدفقات عمل الأعمال المعقدة. يتحقق ذلك من خلال التفاعل مع أنظمة المؤسسات ومنصات الطرف الثالث.

بروتوكول A2A هو نتيجة للتعاون بين Google وأكثر من 50 شريكًا في الصناعة، يشتركون جميعًا في رؤية مشتركة لمستقبل التعاون بين وكلاء الذكاء الاصطناعي. والأهم من ذلك، أن هذا التعاون يتجاوز التقنيات المحددة ويستند إلى معايير مفتوحة وآمنة.

المبادئ الأساسية لتصميم A2A

خلال تطوير بروتوكول A2A، استرشدت Google وشركاؤها بعدة مبادئ أساسية:

  • مفتوح وغير تابع لبائع معين: يجب أن يكون بروتوكول A2A مفتوحًا، مما يعني أن مواصفاته متاحة للجمهور. وهذا يضمن أن أي مطور أو مؤسسة يمكنها تنفيذ البروتوكول دون قيود احتكارية. يعني غير تابع لبائع معين أن البروتوكول غير مرتبط بتقنية بائع معين. وهذا يعزز تكافؤ الفرص لجميع المشاركين.
  • طرائق طبيعية للتعاون: يسمح A2A للوكلاء بالتعاون باستخدام طرق الاتصال المتأصلة وغير المنظمة. وهذا يميز الوكلاء عن الأدوات ويميز A2A عن بروتوكول سياق النموذج (MCP).
  • مبني على المعايير الحالية: لتبسيط التكامل مع البنى التحتية لتكنولوجيا المعلومات الحالية، يعتمد البروتوكول على معايير راسخة مثل HTTP وأحداث Server-Sent (SSE) و JSON-RPC.
  • آمن بشكل افتراضي: الأمن هو مصدر قلق بالغ الأهمية. يتضمن A2A آليات مصادقة وتفويض على مستوى المؤسسة لحماية البيانات الحساسة وضمان تفاعلات آمنة.
  • غير مرتبط بطريقة البيانات: لا يقتصر A2A على الاتصال النصي. يمكنه التعامل مع أنواع بيانات مختلفة، بما في ذلك الصور والصوت وتدفقات الفيديو.

وظائف A2A: تمكين تعاون الوكلاء

يوفر A2A مجموعة من الوظائف المدمجة لتبسيط تفاعلات الوكلاء:

  • اكتشاف القدرات: يتيح هذا للوكلاء الإعلان عن قدراتهم. يمكن للعملاء بسهولة تحديد الوكيل الأنسب لمهمة معينة. فكر في الأمر على أنه سوق رقمي حيث يعرض الوكلاء مهاراتهم وخبراتهم.
  • إدارة المهام والحالة: يدور الاتصال بين العميل والوكيل حول تنفيذ المهام. يتم تعريف هذه المهام بواسطة البروتوكول ولها دورة حياة محددة جيدًا. يشار إلى نتيجة المهمة باسم التحف. تضمن إدارة كل من المهام وحالاتها سير عمل موثوقًا به وقابلاً للتتبع.
  • التعاون الآمن: يمكن للوكلاء تبادل الرسائل بشكل آمن لتبادل السياق أو تقديم الردود أو تسليم التحف أو نقل تعليمات المستخدم. وهذا يسهل بيئة تعاونية حيث يمكن للوكلاء العمل معًا بسلاسة.
  • التفاوض على تجربة المستخدم: تتضمن كل رسالة ‘أجزاء’، وهي أجزاء مستقلة من المحتوى، مثل صورة تم إنشاؤها. لكل جزء نوع محتوى محدد، مما يمكّن كلاً من العميل والوكيل البعيد من الاتفاق على التنسيق المطلوب. يشمل هذا الميزة أيضًا التفاوض على قدرات واجهة المستخدم الخاصة بالمستخدم، مثل الإطارات المضمنة والفيديو ونماذج الويب.

تعد ميزات اكتشاف القدرات والتفاوض على تجربة المستخدم مقنعة بشكل خاص لأنها تمهد الطريق لإنشاء أسواق الوكلاء. في هذه الأسواق، يمكن للموردين إدراج وكلائهم، ويمكن للعملاء تحديد الوكيل الأنسب لأداء مهام محددة.

في حين أن هذا المفهوم واعد للغاية وربما ضروري لنمو سوق وكلاء الذكاء الاصطناعي، فإن تحقيق هذه الرؤية يتطلب أكثر من مجرد تحديد بروتوكول تفاعل.

فك تشفير مفاهيم بروتوكول Agent2Agent

يعد فهم المفاهيم الأساسية التي يقوم عليها البروتوكول أمرًا بالغ الأهمية للتنفيذ والاستخدام الفعالين. ستكون هذه المفاهيم مألوفة بالفعل للعديد من مطوري وكلاء الذكاء الاصطناعي:

  • بطاقة الوكيل: هذا ملف بيانات تعريف عام يفصل قدرات الوكيل ومهاراته وعنوان URL لنقطة النهاية ومتطلبات المصادقة. تلعب بطاقة الوكيل دورًا حاسمًا في مرحلة الاكتشاف، مما يمكّن المستخدمين من تحديد الوكيل المناسب وفهم كيفية التفاعل معه.
  • الخادم: وكيل يقوم بتنفيذ طرق بروتوكول A2A، كما هو محدد في مواصفات JSON. بشكل أساسي، الخادم هو الوكيل الذي يقدم خدماته من خلال بروتوكول A2A.
  • العميل: يمكن أن يكون هذا تطبيقًا أو وكيلًا آخر يستهلك خدمات A2A. يبدأ العميل الطلبات ويستخدم القدرات التي يقدمها الخادم.
  • المهمة: الوحدة الأساسية للعمل للوكيل. تبدأ بواسطة العميل ويتم تنفيذها بواسطة الخادم، وتتقدم عبر حالات مختلفة طوال دورة حياتها.
  • الرسالة: تمثل عمليات تبادل الاتصالات بين العميل والوكيل. لكل رسالة دور محدد وتتكون من أجزاء.
  • الجزء: هذه هي وحدة المحتوى الأساسية داخل رسالة أو قطعة أثرية. يمكن أن يكون الجزء نصًا أو ملفًا أو بيانات منظمة. وهذا يسمح بالاتصال المرن لأنواع البيانات المختلفة.
  • التحف: تمثل المخرجات التي تم إنشاؤها بواسطة الوكيل أثناء إكمال المهمة. مثل الرسائل، تحتوي التحف على أجزاء.
  • البث: يدعم البروتوكول البث، مما يسمح للخادم بتحديث العميل بشأن حالة المهام طويلة الأمد في الوقت الفعلي. هذا يعزز تجربة المستخدم من خلال توفير ملاحظات مستمرة.

المشهد الحالي لمشروع Agent2Agent

تم تقديم A2A للجمهور مؤخرًا فقط، وتتوفر مواصفاته الآن على GitHub. حتى الآن، لا توجد خارطة طريق رسمية أو تنفيذ جاهز للإنتاج للبروتوكول. ومع ذلك، تتعاون Google بنشاط مع الشركاء لإطلاق إصدار جاهز للإنتاج في وقت لاحق من عام 2025.

يوفر مستودع A2A GitHub العديد من نماذج التعليمات البرمجية في كل من TypeScript و Python، جنبًا إلى جنب مع تطبيق تجريبي شامل. يعرض هذا التطبيق التفاعل بين الوكلاء الذين تم تطويرهم باستخدام مجموعات تطوير الوكلاء المختلفة (ADK).

في حين أن هذا يوفر أساسًا للتجريب، يجب دمج A2A في النظام البيئي الحالي للأطر والأدوات المستخدمة لنشر تدفقات العمل الوكيلة قبل أن يتم اعتماده في التطبيقات ذات المهام الحرجة.

يشير الدعم من عدد كبير من اللاعبين الرئيسيين (لا سيما، لا توجد أي من الشركات التي تقدم نماذج أساسية) الذين يعملون مع Google في تعريف البروتوكول بقوة إلى أن الأدوات اللازمة ستكون متاحة قريبًا وسيتم دمج A2A في أطر الوكلاء الرائدة.

A2A مقابل بروتوكول سياق النموذج (MCP): فهم التمييز

بروتوكول سياق النموذج (MCP)، الذي طورته Anthropic، يمكّن التطبيقات من توفير سياق لنماذج اللغة الكبيرة. تصف Anthropic MCP بأنه ‘منفذ USB-C لتطبيقات الذكاء الاصطناعي’، مما يوفر طريقة موحدة لتوصيل LLMs بمصادر البيانات والأدوات، تمامًا مثل USB الذي يربط الأجهزة الطرفية المختلفة بالأجهزة.

وفقًا لـ Google، لم يتم تصميم A2A ليحل محل MCP. هناك حد أدنى من التداخل بين البروتوكولين؛ يعالجون مشاكل مختلفة ويعملون على مستويات تجريد مختلفة. يسهل A2A التفاعل بين الوكلاء، بينما يربط MCP نماذج اللغة الكبيرة بالأدوات، والتي بدورها تربطها بالخدمات والبيانات. وبالتالي فإن البروتوكولين متكاملان.

Agent2Agent وبروتوكول سياق النموذج هما قطعتان لنفس اللغز، وكلاهما سيكون مطلوبًا لتحقيق الرؤية المستقبلية لتدفقات العمل الوكيلة والذكاء الاصطناعي المنتشر.