فك تشفير بروتوكولات A2A و MCP في عالم الوكلاء

في الآونة الأخيرة، كشفت جوجل عن بروتوكول مفتوح جديد للوكلاء يسمى Agent2Agent، أو A2A للاختصار. وفي الوقت نفسه، أعلنت Bailian التابعة لـ Alibaba Cloud أيضًا عن دخولها إلى MCP. دعونا نتعمق في ماهية A2A و MCP.

لفهم هذه البروتوكولات، ضع في اعتبارك تشبيه الدبلوماسية بين الدول. تخيل أن كل وكيل ذكاء اصطناعي هو دولة صغيرة لها لغتها وعاداتها الخاصة. هذه ‘الدول’ لديها سفارات تقع داخل نفس المبنى، وتحاول التواصل والتجارة وتبادل المعلومات.

في السيناريو المثالي، ستحافظ هذه الدول على علاقات ودية وتلتزم بمجموعة واضحة من القواعد الدبلوماسية، مما يمكنها من التفاعل بسلاسة وتوقيع الاتفاقيات والتعاون في المشاريع الدولية حول طاولة المؤتمرات.

ومع ذلك، فإن الواقع هو أن كل سفارة تعمل بشكل مستقل ببروتوكولات متباينة. وبالتالي، فإن الشروع في اتفاقية تجارية بسيطة مع ‘الدولة أ’ يتطلب استيفاء عدد كبير من المتطلبات، بما في ذلك الأحكام والشهادات والترجمات والمفاتيح المتخصصة. ويتطلب التعامل مع ‘الدولة ب’ و ‘الدولة ج’ تكرار إجراءات مماثلة عدة مرات. هذا النهج المخصص والمجزأ والمتعدد الجوانب يزيد من تكاليف الاتصال، حيث يتحمل كل تفاعل ‘تعريفة معلومات’ إضافية.

في الماضي، واجه وكلاء الذكاء الاصطناعي مأزقًا مماثلاً عند محاولة التعاون.

على سبيل المثال، قد يكون لديك وكيل يستجيب تلقائيًا لرسائل البريد الإلكتروني وآخر مدمج في تطبيق التقويم للمساعدة في الجدولة. ومع ذلك، تكافح كيانات الذكاء الاصطناعي هذه للتواصل مباشرة، مما يستلزم النسخ واللصق اليدوي للمعلومات أو الاعتماد على واجهات مخصصة.

ونتيجة لذلك، يعمل وكلاء الذكاء الاصطناعي بمعزل عن بعضهم البعض، ويظهرون قابلية تشغيل ضعيفة. هذا التجزؤ يحبط المستخدمين الذين يجب عليهم التنقل بين تطبيقات الذكاء الاصطناعي المتعددة ويحد من إمكانات الذكاء الاصطناعي. المهام المعقدة التي يمكن إنجازها من خلال التعاون بين الوكلاء المتعددين محصورة بشكل مصطنع داخل صوامع فردية.

يعكس هذا الوضع مشهد ما بعد الحرب العالمية الثانية، حيث يعمل كل وكيل ذكاء اصطناعي بشكل مستقل، ويفتقر إلى قواعد موحدة ويواجه حواجز الاتصال. يشبه النظام البيئي الحالي للذكاء الاصطناعي أرضًا قاحلة بعد الحرب، مما يتطلب الالتزام بواجهات وبروتوكولات محددة للوصول إلى البيانات والوظائف. إن غياب المعايير يفرض ‘تعريفات’ إضافية مع كل علاقة تعاونية جديدة، مما يؤدي إلى نظام بيئي للذكاء الاصطناعي مفكك وغير فعال يتميز بالعزلة والمصلحة الذاتية.

يستكشف صناعة الذكاء الاصطناعي إمكانية وضع بروتوكول مقبول عالميًا لتسهيل التفاعل السلس بين الوكلاء والأدوات الخارجية. ظهرت جوجل و Anthropic كشركات رائدة، حيث اقترحت كل منهما حلاً: بروتوكول A2A وبروتوكول MCP.

بروتوكول A2A

بروتوكول A2A، وهو اختصار لـ Agent2Agent، يمكّن وكلاء الذكاء الاصطناعي من التواصل والتعاون مباشرة.

الهدف الأساسي من بروتوكول A2A هو تمكين الوكلاء من أصول وبائعين متنوعين من فهم بعضهم البعض والتعاون مع بعضهم البعض، على غرار جهود منظمة التجارة العالمية للحد من الحواجز التجارية.

من خلال اعتماد A2A، يمكن للوكلاء من مختلف البائعين والأطر الانضمام إلى منطقة تجارة حرة، والتواصل بلغة مشتركة والتعاون بسلاسة لإنجاز مهام معقدة تتجاوز قدرات الوكلاء الأفراد.

لتوضيح كيفية عمل A2A، ضع في اعتبارك التشبيهات التالية:

1. الوكيل = دبلوماسي وطني

يعمل كل وكيل كدبلوماسي يمثل سفارة دولة ما. يهدف بروتوكول A2A إلى وضع قواعد دبلوماسية موحدة وإجراءات اتصال. في السابق، كان الدبلوماسيون من ‘الدولة أ’ يتواصلون حصريًا باللغة الفرنسية، بينما استخدم أولئك من ‘الدولة ب’ النص السيريلي، وطالب ‘الدولة ج’ بالمراسلات عبر رسائل ذهبية قديمة. يضمن بروتوكول A2A أن يتمكن جميع المشاركين من التواصل بلغة متفق عليها مسبقًا، وتقديم المستندات بنفس التنسيق، وتنفيذ النتائج المتفق عليها.

2. بطاقة الوكيل = أوراق الاعتماد الدبلوماسية / بطاقة عمل السفير

ضمن إطار عمل A2A، يُطلب من كل وكيل نشر ‘بطاقة وكيل’، على غرار بطاقة عمل الدبلوماسي، التي تحتوي على تفاصيل مثل اسم الوكيل وإصداره وقدراته واللغات أو التنسيقات المدعومة.

على غرار كيف تحدد بطاقة عمل الدبلوماسي دورهم وانتمائهم، تسرد بطاقة الوكيل مهارات الوكيل وطرق المصادقة وتنسيقات الإدخال / الإخراج. يمكّن هذا الدبلوماسيين الآخرين من تحديد وفهم القدرات بسرعة، مما يقلل من حواجز الاتصال.

3. المهمة = مشروع دبلوماسي ثنائي أو متعدد الأطراف

مفهوم المهمة مركزي في A2A. عندما يعتزم وكيل تفويض مهمة إلى وكيل آخر، فإنه يصدر ‘خطاب نوايا مشروع تعاون’. عند القبول، يسجل الطرفان معرف المهمة لتتبع التقدم وتبادل المعلومات حتى الاكتمال.

من الناحية الدبلوماسية، قد تقترح دولة على أخرى، ‘نود التعاون في بناء خط سكة حديد عالي السرعة عبر الحدود؛ يرجى إرسال فريقك الهندسي.’ يعكس هذا مهمة A2A، حيث يحدد الطرف المبدئي المتطلبات، ويقبل الوكيل البعيد، ويقوم الطرفان بتحديث التقدم بانتظام طوال المشروع.

تمثل الرسائل الاتصالات المتبادلة خلال المراحل الأولية أو المتوسطة من المشروع، على غرار البرقيات الدبلوماسية والملاحظات وتبادلات المبعوثين.

4. إشعارات الدفع = نشرات السفارة الدبلوماسية

في A2A، إذا كانت المهمة مشروعًا طويل الأجل يتطلب وقتًا أطول لإكماله، فيمكن للوكيل البعيد تحديث الطرف المبدئي من خلال إشعارات الدفع، على غرار دولة تقدم تحديثات دورية حول مشروع بنية تحتية طويل الأجل. هذا يعزز قدرات التعاون غير المتزامن.

5. المصادقة والأمن = الامتيازات والبروتوكولات الدبلوماسية

تستخدم A2A استراتيجيات مصادقة على مستوى المؤسسات، وتتطلب من كلا الطرفين المتصلين التحقق من بيانات الاعتماد لمنع انتحال الشخصية أو التنصت الخبيث. توازي هذه الآلية الامتيازات والبروتوكولات الدبلوماسية.

في جوهرها، تعكس A2A ديناميكيات الدبلوماسية الدولية أو التعاون التجاري، مع التركيز على الاتصال والأمن الموحدين.

بروتوكول MCP

بروتوكول MCP، أو بروتوكول سياق النموذج، هو معيار قدمته Anthropic وفتحت مصادره في نوفمبر 2024.

في حين أن A2A تعالج عملية الاتصال بين الدبلوماسيين في مجال الذكاء الاصطناعي، إلا أن هناك تحديًا مستمرًا يظل قائمًا: غياب مصادر معلومات موثوقة. حتى الدبلوماسي أو المسؤول التنفيذي الأكثر فصاحة في مجال الأعمال التجارية غير مجهز جيدًا للعمل بفعالية بدون معلومات دقيقة حول المشهد الدولي وتخصيص الموارد.

يعتمد الدبلوماسيون المعاصرون على أدوات خارجية، مثل أنظمة التأشيرات وأنظمة التسوية الدولية وقواعد بيانات الاستخبارات، لأداء واجباتهم. وبالمثل، يجب أن يتصل الوكيل الذي يتحمل مسؤوليات معقدة بقواعد بيانات وأنظمة مستندات وتطبيقات مؤسسية وحتى أجهزة أجهزة متنوعة.

يمكن تشبيه هذا بإنشاء وكالة استخبارات شاملة للدبلوماسيين ومنحهم حق الوصول إلى الأدوات لتسهيل عملهم.

في السابق، كان على الوكلاء تطوير مكونات إضافية مخصصة والاندماج بعمق مع الأدوات المختلفة، الأمر الذي كان شاقًا ويستغرق وقتًا طويلاً. ومع ذلك، MCP متاح الآن لتبسيط العملية.

توحِّد MCP التفاعلات بين نماذج اللغة الكبيرة ومصادر البيانات والأدوات الخارجية. تشبه Anthropic MCP بمنفذ USB-C لتطبيقات الذكاء الاصطناعي.

تعمل USB-C كواجهة عالمية للأجهزة، وتتعامل مع الشحن ونقل البيانات من خلال منفذ واحد. تهدف MCP إلى إنشاء واجهة عالمية في مجال الذكاء الاصطناعي، مما يمكّن النماذج المختلفة والأنظمة الخارجية من الاتصال باستخدام نفس البروتوكول، بدلاً من تطوير حلول تكامل مخصصة في كل مرة.

يمكن لنماذج الذكاء الاصطناعي التي تتصل بقواعد البيانات أو محركات البحث أو تطبيقات الطرف الثالث التواصل بسلاسة إذا كانت تدعم جميعها MCP.

تستخدم MCP بنية العميل والخادم:

1. خادم MCP = وكالة استخبارات موحدة

يمكن للمؤسسات أو الأفراد تغليف قواعد البيانات وأنظمة الملفات والتقويمات وخدمات الطرف الثالث في خوادم MCP. تلتزم هذه الخوادم ببروتوكول MCP، وتعرض نقاط نهاية وصول منسقة بشكل موحد، مما يمكّن أي وكيل متوافق مع معايير عميل MCP من إرسال الطلبات أو استرداد المعلومات أو تنفيذ العمليات.

2. عميل MCP = معدات طرفية يستخدمها الدبلوماسيون

يحمل دبلوماسي الوكيل معدات طرفية مخصصة، مما يمكنهم من إدخال الأوامر، مثل ‘استرداد بيانات المخزون من النظام المالي’ أو ‘إرسال طلب إلى واجهة برمجة تطبيقات’ أو ‘استرداد مستند PDF’.

بدون MCP، يتطلب التكامل مع الأنظمة المختلفة كتابة أكواد وصول مختلفة، وهو أمر مرهق. ومع ذلك، مع MCP، يمكن للعملاء الذين يدعمون البروتوكول التبديل بسهولة بين خوادم MCP المختلفة، واسترداد المعلومات وتنفيذ العمليات التجارية.

في جوهرها، تسهل MCP التكامل السلس بين وكلاء الذكاء الاصطناعي والموارد الخارجية.

التمييز بين A2A و MCP

لتوضيح التمييز بين A2A و MCP، ضع في اعتبارك قمة دولية افتراضية حيث يجتمع رؤساء الدول (الذين يمثلون وكلاء الذكاء الاصطناعي للشركات) للتعاون في مهمة عبر وطنية، مثل إنتاج تقرير تحليلي اقتصادي عالمي.

بدون بروتوكول عالمي، سيكون مثل هذا الاجتماع مستحيلاً تقريبًا، حيث يتحدث كل ممثل لغة مختلفة. ومع ذلك، مع بروتوكول A2A، يوقع جميع الممثلين على ‘اتفاقية فيينا الدبلوماسية A2A’ قبل الدخول إلى الاجتماع، ويوافقون على التواصل باستخدام تنسيق موحد وتحديد أنفسهم وتوضيح نواياهم والاستشهاد بمعرفات التحدث السابقة عند الرد.

يمكّن هذا ‘الوكيل G’ من إرسال رسالة إلى ‘الوكيل O’ بتنسيق A2A، ويستجيب ‘الوكيل O’ وفقًا لذلك. هذا يمثل المثال الأول للتواصل دون عوائق بين وكلاء الذكاء الاصطناعي من شركات مختلفة.

أثناء المناقشات، يحتاج ممثلو الذكاء الاصطناعي إلى استشارة البيانات أو استخدام أدوات للتحليل. يقترح ‘الوكيل A’ من Anthropic استخدام نظام MCP للحصول على بيانات أو دعم أدوات خارجية.

يتم إعداد ‘غرفة ترجمة فورية MCP’ جنبًا إلى جنب مع قاعة المؤتمرات، ويعمل بها خبراء يمكنهم الرد بلغة موحدة عبر MCP عند تلقي الطلبات.

على سبيل المثال، يحتاج ‘الوكيل Q’ إلى الوصول إلى قاعدة بيانات السحابة الخاصة به لإجراء العمليات الحسابية. بدلاً من إرسال شخص ما إلى الدولة، فإنهم يرسلون طلب MCP للحصول على بيانات من قاعدة البيانات X. يقوم مسؤول قاعدة بيانات MCP بترجمة الطلب واسترداد النتائج والرد على ‘الوكيل Q’ بلغة MCP. العملية برمتها شفافة للوكلاء الآخرين، الذين يفهمون البيانات التي استشهد بها ‘الوكيل Q’ لأن ترجمة MCP بتنسيق معترف به.

مع تقدم كتابة التقرير، يدرك ‘الوكيل G’ و ‘الوكيل A’ أنهم بحاجة إلى دمج مساهماتهم. يتخصص ‘الوكيل G’ في التحليل العددي، بينما يتفوق ‘الوكيل A’ في تلخيص اللغة.

ينقل ‘الوكيل G’ بيانات معدل نمو الناتج المحلي الإجمالي عبر A2A، ويتصل ‘الوكيل A’ بمكون إضافي لجدول بيانات Excel عبر MCP، ويتحقق من اتجاهات البيانات، ويستجيب بفقرة موجزة.

في هذا السيناريو، تسهل A2A التواصل بين الوكلاء، بينما تمكن MCP الوكلاء من الوصول إلى الأدوات والمعلومات الخارجية. معًا، تقوم البروتوكولات بإنشاء اتفاقية اتصال مخصصة لنسخة الذكاء الاصطناعي من الأمم المتحدة. مع وجود هذه البروتوكولات، يمكن لوكلاء الذكاء الاصطناعي التعاون بفعالية، وتشكيل نظام بيئي للذكاء الاصطناعي مترابط.

تشبه A2A خط اتصال مخصص للاتصال الدبلوماسي، وتتناول التواصل المباشر بين الوكلاء. تشبه MCP نظام ترجمة فورية وتبادل موارد متزامن، وتتناول قضية الكيانات الذكية التي تتصل بالمعلومات الخارجية.

يبشر صعود A2A و MCP بتطور صناعة الذكاء الاصطناعي نحو التعاون بدلاً من المنافسة. سيتم نشر عدد لا يحصى من وكلاء الذكاء الاصطناعي مثل مواقع الويب، واكتشاف والتواصل من خلال A2A والوصول إلى الموارد وتبادل المعرفة من خلال MCP.