في المشهد التكنولوجي سريع التطور اليوم، برزت نماذج اللغة الكبيرة (LLMs) كأدوات قوية لمعالجة اللغة الطبيعية. ومع ذلك، فإن اعتمادها على بيانات التدريب الثابتة يحد من قدرتها على التكيف مع سيناريوهات العالم الحقيقي. مع تزايد طلب الصناعات على حلول الذكاء الاصطناعي القادرة على اتخاذ قرارات مستنيرة، أصبح دمج الأدوات وواجهات برمجة التطبيقات الخارجية أمرًا بالغ الأهمية. إن الدقة التي يتم بها استخدام هذه الأدوات أمر بالغ الأهمية لتعزيز قدرات صنع القرار والكفاءة التشغيلية للوكلاء المستقلين، مما يمهد الطريق في النهاية لتطوير مهام سير عمل الوكلاء المتطورة.
تتعمق هذه المقالة في الجوانب التقنية لاستدعاء الأدوات باستخدام نماذج Amazon Nova من خلال Amazon Bedrock. علاوة على ذلك، فإنه يستكشف طرقًا مختلفة لتخصيص هذه النماذج لتحقيق دقة أكبر في استخدام الأدوات.
توسيع قدرات LLM باستخدام الأدوات
أظهرت LLMs كفاءة ملحوظة في مجموعة واسعة من مهام اللغة الطبيعية. ومع ذلك، يتم إطلاق إمكاناتها الحقيقية من خلال التكامل السلس مع الأدوات الخارجية مثل واجهات برمجة التطبيقات وأطر الحوسبة. تمكن هذه الأدوات LLMs من الوصول إلى البيانات في الوقت الفعلي وإجراء حسابات خاصة بالمجال واسترجاع معلومات دقيقة، وبالتالي تعزيز موثوقيتها وتعدد استخداماتها.
ضع في اعتبارك تكامل واجهة برمجة تطبيقات الطقس، والتي تمكن LLMs من تقديم توقعات جوية دقيقة وحديثة. وبالمثل، يمكن لواجهة برمجة تطبيقات Wikipedia تزويد LLMs بالقدرة على الوصول إلى مستودع واسع من المعلومات، مما يسمح لها بالرد على الاستعلامات المعقدة بدقة أكبر. في السياقات العلمية، يمكن لأدوات مثل الآلات الحاسبة والمحركات الرمزية أن تساعد LLMs على التغلب على الأخطاء العددية، مما يجعلها أكثر موثوقية للحسابات المعقدة.
من خلال التكامل السلس مع هذه الأدوات، تتطور LLMs إلى أنظمة قوية وواعية بالمجال قادرة على التعامل مع المهام الديناميكية والمتخصصة ذات الفائدة الواقعية.
نماذج Amazon Nova و Amazon Bedrock
تم تصميم نماذج Amazon Nova، التي تم تقديمها في AWS re:Invent في ديسمبر 2024، لتقديم قيمة استثنائية من حيث السعر والأداء. تقدم هذه النماذج أداءً حديثًا في معايير فهم النصوص الرئيسية مع الحفاظ على فعالية التكلفة. تتكون السلسلة من ثلاثة أنواع:
- Micro: نموذج نصي فقط مُحسّن للاستخدام على الحافة، مما يوفر أداءً فائق الكفاءة.
- Lite: نموذج متعدد الوسائط يحقق التوازن بين التنوع والأداء.
- Pro: نموذج متعدد الوسائط عالي الأداء مصمم لمعالجة المهام المعقدة.
يمكن استخدام نماذج Amazon Nova لمجموعة واسعة من المهام، بما في ذلك الإنشاء وتطوير مهام سير عمل الوكلاء. تمتلك هذه النماذج القدرة على التفاعل مع الأدوات أو الخدمات الخارجية من خلال عملية تعرف باسم استدعاء الأدوات. يمكن الوصول إلى هذه الوظيفة من خلال وحدة تحكم Amazon Bedrock وواجهات برمجة التطبيقات مثل Converse و Invoke.
بالإضافة إلى استخدام النماذج المدربة مسبقًا، يتمتع المطورون بخيار الضبط الدقيق لهذه النماذج باستخدام بيانات متعددة الوسائط (Pro و Lite) أو بيانات نصية (Pro و Lite و Micro). يمكّن هذا المرونة المطورين من تحقيق المستويات المطلوبة من الدقة والكمون والفعالية من حيث التكلفة. علاوة على ذلك، يمكن للمطورين الاستفادة من وحدة تحكم Amazon Bedrock وواجهات برمجة التطبيقات لإجراء ضبط دقيق مخصص للخدمة الذاتية وتقطير النماذج الأكبر إلى نماذج أصغر.
نظرة عامة على الحل
يتضمن الحل إعداد مجموعة بيانات مخصصة مصممة خصيصًا لاستخدام الأدوات. تُستخدم مجموعة البيانات هذه بعد ذلك لتقييم أداء نماذج Amazon Nova من خلال Amazon Bedrock، وذلك باستخدام واجهات برمجة تطبيقات Converse و Invoke. بعد ذلك، يتم ضبط نموذجي AmazonNova Micro و Amazon Nova Lite بدقة باستخدام مجموعة البيانات المُعدة عبر Amazon Bedrock. عند الانتهاء من عملية الضبط الدقيق، يتم تقييم هذه النماذج المخصصة من خلال الإنتاجية المخصصة.
الأدوات
يشمل استخدام الأدوات في LLMs عمليتين أساسيتين: اختيار الأداة واستخراج أو إنشاء الوسيطة. على سبيل المثال، ضع في اعتبارك أداة مصممة لاسترداد معلومات الطقس لموقع معين. عند تقديم استعلام مثل، ‘ما هو الطقس في لندن الآن؟’، تقوم LLM بتقييم أدواتها المتاحة لتحديد ما إذا كانت هناك أداة مناسبة موجودة. إذا تم تحديد أداة مناسبة، فسيقوم النموذج بتحديدها واستخراج الوسيطات الضرورية - في هذه الحالة، ‘لندن’ - لإنشاء استدعاء الأداة.
يتم تحديد كل أداة بدقة بمواصفات رسمية تحدد وظائفها المقصودة والوسيطات الإلزامية والاختيارية وأنواع البيانات المرتبطة بها. تضمن هذه التعريفات الدقيقة، المشار إليها باسم tool config، تنفيذ استدعاءات الأدوات بشكل صحيح وأن تحليل الوسيطات يتماشى مع المتطلبات التشغيلية للأداة. التزامًا بهذا المطلب، تحدد مجموعة البيانات المستخدمة في هذا المثال ثماني أدوات متميزة، لكل منها وسيطات وتكوينات خاصة بها، وكلها منظمة بتنسيق JSON. الأدوات الثماني المحددة هي كما يلي:
- weather_api_call: أداة مخصصة مصممة لاسترداد معلومات الطقس.
- stat_pull: أداة مخصصة لتحديد الإحصائيات.
- text_to_sql: أداة مخصصة لتحويل النص إلى استعلامات SQL.
- terminal: أداة لتنفيذ البرامج النصية داخل بيئة طرفية.
- wikipedia: أداة واجهة برمجة تطبيقات Wikipedia للبحث في صفحات Wikipedia.
- duckduckgo_results_json: أداة بحث عبر الإنترنت تستخدم DuckDuckGo لإجراء عمليات البحث.
- youtube_search: أداة بحث في واجهة برمجة تطبيقات YouTube للبحث في قوائم الفيديو.
- pubmed_search: أداة بحث PubMed للبحث في ملخصات PubMed.
مجموعة البيانات
مجموعة البيانات المستخدمة في هذا الحل هي مجموعة بيانات اصطناعية لاستدعاء الأدوات، تم إنشاؤها بمساعدة نموذج أساسي (FM) من Amazon Bedrock وتم التحقق من صحتها وتعديلها يدويًا لاحقًا. تم تطوير مجموعة البيانات هذه لمجموعة الأدوات الثماني التي تمت مناقشتها سابقًا، بهدف إنشاء مجموعة متنوعة من الأسئلة واستدعاءات الأدوات التي تمكن نموذجًا آخر من التعلم من هذه الأمثلة والتعميم على استدعاءات الأدوات غير المرئية.
تم تنظيم كل إدخال في مجموعة البيانات ككائن JSON، يحتوي على أزواج قيم مفاتيح تحدد السؤال (استعلام مستخدم باللغة الطبيعية للنموذج)، وأداة الحقيقة الأساسية المطلوبة للإجابة على استعلام المستخدم، ووسيطاته (قاموس يحتوي على المعلمات المطلوبة لتنفيذ الأداة)، وقيود إضافية مثل order_matters: boolean
، مما يشير إلى ما إذا كان ترتيب الوسيطات أمرًا بالغ الأهمية، و arg_pattern: optional
، وهو تعبير نمطي (regex) للتحقق من صحة الوسيطة أو تنسيقها. تُستخدم تسميات الحقيقة الأساسية هذه للإشراف على تدريب نماذج Amazon Nova المدربة مسبقًا، وتكييفها لاستخدام الأدوات. هذه العملية، المعروفة باسم supervised fine-tuning، يتم استكشافها بشكل أكبر في الأقسام التالية.
تتكون مجموعة التدريب من 560 سؤالًا، بينما تحتوي مجموعة الاختبار على 120 سؤالًا. تم تنظيم مجموعة الاختبار لتضمين 15 سؤالًا لكل فئة أداة، ليصبح المجموع 120 سؤالًا.
إعداد مجموعة البيانات لـ Amazon Nova
لاستخدام مجموعة البيانات هذه بفعالية مع نماذج Amazon Nova، من الضروري تنسيق البيانات وفقًا لقالب دردشة معين. يتضمن استدعاء الأداة الأصلية طبقة ترجمة تقوم بتنسيق المدخلات بالتنسيق المناسب قبل تمريرها إلى النموذج. في هذا الحل، يتم اعتماد نهج استخدام الأدوات DIY، وذلك باستخدام قالب موجه مخصص. على وجه التحديد، يجب إضافة مطالبة النظام ورسالة المستخدم المضمنة في تكوين الأداة وتسميات الحقيقة الأساسية كرسالة مساعد.
تحميل مجموعة البيانات إلى Amazon S3
هذه الخطوة ضرورية لتمكين Amazon Bedrock من الوصول إلى بيانات التدريب أثناء عملية الضبط الدقيق. يمكن تحميل مجموعة البيانات إما من خلال وحدة تحكم Amazon Simple Storage Service (Amazon S3) أو برمجيًا.
استدعاء الأدوات باستخدام النماذج الأساسية من خلال واجهة برمجة تطبيقات Amazon Bedrock
مع إنشاء مجموعة بيانات استخدام الأدوات وتنسيقها على النحو المطلوب، يمكن استخدامها لاختبار نماذج Amazon Nova. يمكن استخدام واجهات برمجة تطبيقات Converse و Invoke لاستخدام الأدوات في Amazon Bedrock. تتيح واجهة برمجة تطبيقات Converse محادثات ديناميكية واعية بالسياق، مما يسمح للنماذج بالانخراط في حوارات متعددة الأدوار، بينما تتيح واجهة برمجة تطبيقات Invoke للمستخدمين استدعاء النماذج الأساسية والتفاعل معها داخل Amazon Bedrock.
لاستخدام واجهة برمجة تطبيقات Converse، يتم إرسال الرسائل ومطالبة النظام (إن وجدت) وتكوين الأداة مباشرة إلى واجهة برمجة التطبيقات.
لتحليل الأداة والوسيطات من استجابة LLM، ضع في اعتبارك السؤال: ‘مرحبًا، ما هي درجة الحرارة في باريس الآن؟’. سيتم تحليل الإخراج لتحديد الأداة والوسيطات اللازمة للإجابة على السؤال.
ضبط نماذج Amazon Nova بدقة لتحسين استخدام الأدوات
يعد الضبط الدقيق خطوة حاسمة في تكييف نماذج اللغة المدربة مسبقًا مثل Amazon Nova لمهام محددة. من خلال تدريب النموذج على مجموعة بيانات مصممة خصيصًا للتطبيق المطلوب، يمكن للنموذج أن يتعلم أداء المهمة بدقة وكفاءة أكبر. في سياق استخدام الأدوات، يمكن للضبط الدقيق أن يحسن بشكل كبير قدرة النموذج على تحديد الأداة المناسبة واستخراج الوسيطات الصحيحة.
تتضمن عملية الضبط الدقيق تعديل المعلمات الداخلية للنموذج لتقليل الفرق بين تنبؤاته وتسميات الحقيقة الأساسية في مجموعة بيانات التدريب. يتحقق ذلك عادةً من خلال عملية تكرارية، حيث يتعرض النموذج بشكل متكرر لبيانات التدريب ويتم تعديل معلماته بناءً على الأخطاء المرصودة.
إعداد مجموعة بيانات الضبط الدقيق
يجب تنسيق مجموعة بيانات الضبط الدقيق بعناية لتعكس أنواع الأسئلة واستدعاءات الأدوات التي من المتوقع أن يتعامل معها النموذج في سيناريوهات العالم الحقيقي. يجب أن تتضمن مجموعة البيانات مجموعة متنوعة من الأمثلة، تغطي فئات الأدوات المختلفة وأنماط الوسيطات.
يجب أن يتكون كل مثال في مجموعة البيانات من سؤال والأداة المقابلة التي سيتم استدعاؤها والوسيطات المطلوبة لتنفيذ الأداة. يجب تنسيق الوسيطات بطريقة منظمة، وعادةً ما تكون ككائن JSON.
عملية الضبط الدقيق
يمكن إجراء عملية الضبط الدقيق باستخدام وحدة تحكم Amazon Bedrock أو واجهات برمجة التطبيقات. تتضمن العملية تحديد النموذج المراد ضبطه بدقة ومجموعة بيانات الضبط الدقيق ومعلمات التدريب المطلوبة.
تتحكم معلمات التدريب في جوانب مختلفة من عملية الضبط الدقيق، مثل معدل التعلم وحجم الدفعة وعدد الحقب. يحدد معدل التعلم حجم تعديلات المعلمات التي يتم إجراؤها خلال كل تكرار. يحدد حجم الدفعة عدد الأمثلة التي تتم معالجتها في كل تكرار. يحدد عدد الحقب عدد المرات التي يتعرض فيها النموذج لمجموعة بيانات التدريب بأكملها.
تقييم النموذج المضبوط بدقة
بعد اكتمال عملية الضبط الدقيق، من الضروري تقييم أداء النموذج المضبوط بدقة. يمكن القيام بذلك عن طريق اختبار النموذج على مجموعة بيانات اختبار منفصلة لم يتم استخدامها أثناء عملية الضبط الدقيق.
يجب أن تكون مجموعة بيانات الاختبار ممثلة لأنواع الأسئلة واستدعاءات الأدوات التي من المتوقع أن يتعامل معها النموذج في سيناريوهات العالم الحقيقي. يمكن تقييم أداء النموذج عن طريق قياس المقاييس مثل الدقة والدقة والاسترجاع ودرجة F1.
فوائد تخصيص نماذج Amazon Nova لاستخدام الأدوات
يوفر تخصيص نماذج Amazon Nova لاستخدام الأدوات عدة فوائد:
- تحسين الدقة: يمكن أن يؤدي ضبط النموذج بدقة على مجموعة بيانات خاصة بالمهمة إلى تحسين دقة اختيار الأدوات واستخراج الوسيطات بشكل كبير.
- زيادة الكفاءة: يمكن للنماذج المضبوطة بدقة غالبًا أداء مهام استخدام الأدوات بكفاءة أكبر من النماذج المدربة مسبقًا.
- تعزيز القدرة على التكيف: يسمح الضبط الدقيق للنموذج بالتكيفمع مجالات وحالات استخدام محددة.
- تقليل التكاليف: في بعض الحالات، يمكن أن يقلل الضبط الدقيق من الموارد الحسابية المطلوبة لأداء مهام استخدام الأدوات.
خاتمة
يعد تخصيص نماذج Amazon Nova لاستخدام الأدوات تقنية قيمة لتعزيز أداء وقابلية LLMs للتكيف. من خلال ضبط النموذج بدقة على مجموعة بيانات خاصة بالمهمة، يمكن للمطورين تحسين دقة وكفاءة وقابلية تطبيقات استخدام الأدوات للتكيف بشكل كبير. مع تزايد طلب الصناعات على حلول الذكاء الاصطناعي القادرة على اتخاذ قرارات مستنيرة، سيصبح تخصيص LLMs لاستخدام الأدوات أكثر أهمية.