عصر اتصال الوكلاء الذكيين: MCP و A2A

صعود مفهوم الوكيل

في السنوات الأخيرة، ومع إطلاق مايكروسوفت لخادم GitHub MCP، وإصدار جوجل لبروتوكول الاتصال بين الوكلاء الذكيين A2A، وإطلاق Alipay لخادم MCP، يشهد مجال الوكلاء (Agents) اهتمامًا غير مسبوق من السوق. على الرغم من عدم وجود تعريف موحد للوكيل حتى الآن، إلا أن المكونات الأساسية الثلاثة التي اقترحتها ليليان وينغ، الباحثة السابقة في OpenAI، وهي “التخطيط” و”الذاكرة” و”استخدام الأدوات”، معترف بها على نطاق واسع، وأصبحت عناصر أساسية لفهم الوكيل.

في مجال الذكاء الاصطناعي، مفهوم الوكيل ليس جديدًا، ولكن مع التطور السريع للنماذج اللغوية الكبيرة (LLM)، ظهرت آفاق جديدة لتطبيق الوكيل. يمكن اعتبار الوكيل نظامًا ذكيًا قادرًا على استشعار البيئة والتخطيط المستقل وتنفيذ المهام. جوهر هذا النظام هو القدرة على محاكاة عملية اتخاذ القرار البشري، واستخدام الأدوات والموارد المختلفة لتحقيق الأهداف المحددة.

الوضع الحالي لتطور الوكيل: إمكانات هائلة، ونسبة اختراق محدودة

كتطور لروبوتات الدردشة، يتم دمج معظم تطبيقات الوكيل الحالية في الخدمات المدفوعة للنماذج الكبيرة، ولا تقدم سوى قلة منها مثل Manus وDevin خدمات مدفوعة مستقلة. ومع ذلك، لا تزال هناك العديد من القيود على استخدام الوكلاء الذين يتمتعون بقدرات تخطيط مستقلة مثل Deep Research وManus، وقد لا يكون عدد المستخدمين الذين يمكنهم تجربتها بالفعل كبيرًا، ولا يزال هناك مجال كبير للتحسين قبل ظهور تطبيقات ‘رائجة’.

ومع ذلك، مع التحسين المستمر لقدرات الاستدلال للنماذج الكبيرة، أصبح الوكيل تدريجيًا محور الابتكار في التطبيقات. بدأ المزيد والمزيد من المطورين والباحثين في استكشاف تطبيقات الوكيل في مختلف المجالات، مثل المساعدين الأذكياء، وعمليات الأتمتة، وتحليل البيانات، وما إلى ذلك. يتم الكشف تدريجيًا عن إمكانات الوكيل، ومساحة التطوير المستقبلية واسعة جدًا.

التطبيق واسع النطاق للوكيل وشيك: مدفوع بظروف مواتية متعددة

اختراقات في طرف تدريب النموذج

  • نمو سريع في نافذة السياق: نافذة السياق (Context Window) للنموذج الكبير هي الحد الأقصى لطول النص الذي يمكن للنموذج مراعاته عند معالجة النص. مع التقدم التكنولوجي، تنمو نافذة سياق النموذج بسرعة، مما يعني أن النموذج يمكنه فهم سياق النص الطويل بشكل أفضل، وبالتالي اتخاذ قرارات أكثر دقة.
  • تطبيق متعمق للتعلم المعزز: التعلم المعزز هو طريقة لتدريب الوكيل من خلال المكافآت والعقوبات. في السنوات الأخيرة، تم استخدام التعلم المعزز على نطاق واسع في تدريب الوكيل، مما مكن الوكيل من التكيف بشكل أفضل مع البيئات المعقدة، وتعلم أفضل الاستراتيجيات.
  • نماذج الاستدلال تنضج يومًا بعد يوم: نموذج الاستدلال هو المكون الأساسي للوكيل، وهو مسؤول عن الاستدلال والحكم بناءً على المعلومات المدخلة. مع التعمق في البحث، أصبحت نماذج الاستدلال أكثر نضجًا، ويمكنها دعم تطبيقات الوكيل المختلفة بشكل أفضل.

ازدهار النظام البيئي

  • تطور سريع لبروتوكولات MCP و A2A: MCP (Model Communication Protocol) و A2A (Agent-to-Agent) هما بروتوكولان مهمان لاتصالات الوكيل. إن التطور السريع لهذه البروتوكولات يجعل من السهل على الوكيل استدعاء الأدوات والخدمات المختلفة، وبالتالي تحقيق وظائف أكثر تعقيدًا.
  • استدعاء الوكيل للأدوات أصبح أكثر ملاءمة: مع التقدم التكنولوجي، أصبحت الطريقة التي يستدعي بها الوكيل الأدوات والخدمات الخارجية أكثر ملاءمة. على سبيل المثال، من خلال واجهة برمجة التطبيقات (API)، يمكن للوكيل الوصول بسهولة إلى مصادر البيانات والخدمات عبر الإنترنت المختلفة، وبالتالي توسيع قدراته.

في نوفمبر 2024، أصدرت Anthropic وبرمجت مفتوحة المصدر بروتوكول MCP، بهدف توحيد كيفية توفير البيانات والأدوات الخارجية للسياق للنموذج. سيؤدي هذا الإجراء إلى تعزيز تطوير النظام البيئي للوكيل بشكل كبير، مما يمكن الوكيل من الاستفادة بشكل أفضل من الموارد الخارجية.

MCP و A2A: مفتاح اتصال الوكيل

بروتوكول MCP: ربط الوكيل بالعالم الخارجي

الهدف الرئيسي لبروتوكول MCP هو تحقيق “اتصال بنقرة واحدة” بين الوكيل والبيانات والأدوات الخارجية. من خلال بروتوكول MCP، يمكن للوكيل الوصول بسهولة إلى الموارد الخارجية المختلفة، مثل قواعد البيانات وواجهات برمجة التطبيقات وخدمات الويب، وما إلى ذلك. وهذا يمكّن الوكيل من فهم البيئة بشكل أفضل واتخاذ قرارات أكثر حكمة.

بروتوكول A2A: بناء جسر اتصال بين الوكلاء

الهدف من بروتوكول A2A هو تحقيق الاتصال بين الوكلاء. من خلال بروتوكول A2A، يمكن للوكلاء التعاون مع بعضهم البعض لإكمال المهام المعقدة بشكل مشترك. هذا مهم جدًا لبناء أنظمة ذكية موزعة.

على الرغم من أن هدف بروتوكول A2A هو الاتصال بين الوكلاء، و MCP هو للوكيل مع الأدوات والبيانات الخارجية، إلا أنه في الوضع المعقد ‘يمكن أيضًا تغليف الأدوات كوكلاء’، قد يكون هناك تداخل في الوظائف بين الاثنين، لكن هذه المنافسة تساعد على تقليل تكاليف استدعاء النموذج الكبير للأدوات الخارجية والاتصالات. ستدفع هذه المنافسة التقدم التكنولوجي، وستستفيد في النهاية من النظام البيئي للوكيل بأكمله.

آفاق تطور الوكيل

وكيل شامل: لا حاجة لتدخل بشري

حاليًا، يوجد في السوق عدد كبير من ‘الوكلاء الأذكياء’، ولكن الكثير منهم يعتمدون على منصات مثل Coze وDify، ويتطلبون من البشر كتابة سير العمل مسبقًا. يبدو هؤلاء الوكلاء أشبه بتراكب هندسة المطالبات، وهم وكلاء بدائيون نسبيًا.

أما الوكيل الأكثر تقدمًا فهو ‘شامل’، مما يعني ‘إدخال مهمة إلى الوكيل، ويكمل الوكيل تلقائيًا نتائج المهام التي يحتاجها الإنسان’. على سبيل المثال، يحتاج المستخدم فقط إلى إدخال هدف إلى الوكيل، ويمكن للوكيل التخطيط المستقل وتنفيذ المهمة، وفي النهاية إكمال الهدف. مثل L3/L4/L5 والوكلاء المتقدمين الآخرين أكثر تلبية لاحتياجات الإنسان، وسيكونون اتجاهًا مهمًا لتطوير الوكيل في المستقبل.

الوكيل يساعد الروبوتات والقيادة الذاتية

عند تطبيق تعريف الوكيل على الذكاء التجسيدي، سنجد أن الروبوتات والمركبات التي تهيمن عليها النماذج الكبيرة هي أيضًا وكلاء. خاصة الروبوتات، فإن عنق الزجاجة الحالي لتطوير الروبوتات ليس في ‘كيفية القيام بحركات مادية’ من ‘المخيخ’، ولكن في التفكير في ‘نوع الحركات المادية التي يجب القيام بها’ من ‘الدماغ’، وهذا يقع تمامًا في نطاق الوكيل.

في مجال الروبوتات، يمكن للوكيل مساعدة الروبوتات على فهم البيئة بشكل أفضل واتخاذ قرارات أكثر منطقية. على سبيل المثال، يمكن للوكيل تخطيط مسار حركة الروبوت المستقل وتنفيذ المهام المختلفة وفقًا للأشياء والأشخاص في البيئة.

في مجال القيادة الذاتية، يمكن للوكيل مساعدة المركبات على استشعار البيئة المحيطة بشكل أفضل واتخاذ قرارات قيادة أكثر أمانًا. على سبيل المثال، يمكن للوكيل تعديل سرعة واتجاه السيارة بشكل مستقل وفقًا لإشارات المرور والمركبات والمشاة الآخرين، وبالتالي تجنب وقوع الحوادث المرورية.

اتصال الوكيل وشبكة الذكاء الاصطناعي الأصلية

في المستقبل، ربما يجب أن يكون جميع الوكلاء قادرين على التواصل مع بعضهم البعض، ويمكنهم التنظيم الذاتي والتفاوض الذاتي، وبناء شبكة تعاون أكثر فعالية من حيث التكلفة وأكثر كفاءة من الإنترنت الحالي. يقوم مجتمع المطورين الصيني أيضًا ببناء بروتوكولات مثل ANP، بهدف أن تصبح بروتوكول HTTP في عصر الإنترنت للوكيل. وفيما يتعلق بمصادقة هوية الوكيل، يمكن الاستعانة بتقنيات مثل DID.

  • اتصال الوكيل: يمكن لاتصال الوكلاء تحقيق مشاركة الموارد والتعاون، وبالتالي تحسين كفاءة النظام بأكمله. على سبيل المثال، يمكن للوكلاء المختلفين مشاركة البيانات والأدوات والخدمات لإكمال المهام المعقدة بشكل مشترك.
  • شبكة الذكاء الاصطناعي الأصلية: شبكة الذكاء الاصطناعي الأصلية هي شبكة مصممة خصيصًا لتطبيقات الذكاء الاصطناعي. يمكن لهذه الشبكة توفير عرض نطاق ترددي أعلى ووقت استجابة أقل وأمان أقوى، وبالتالي دعم تطبيقات الوكيل المختلفة بشكل أفضل.
  • تقنية DID: DID (المعرف اللامركزي) هي تقنية مصادقة هوية لامركزية. من خلال تقنية DID، يمكن للوكيل أن يكون له هويته الخاصة، وبالتالي تحقيق اتصال أكثر أمانًا وموثوقية.

سيجلب تطوير تكنولوجيا الوكيل تغييرات هائلة، ولن يكون الإنترنت المستقبلي مجرد شبكة بسيطة لنقل المعلومات، بل سيكون شبكة تعاون مليئة بالذكاء.