إنفيديا تكشف عن Llama Nemotron Nano 4B

نظرة عامة على Llama Nemotron Nano 4B من NVIDIA

كشفت NVIDIA عن Llama Nemotron Nano 4B، وهو نموذج استنتاج مفتوح المصدر مبتكر مصمم لتقديم أداء وكفاءة استثنائيين عبر مجموعة واسعة من المهام الصعبة. وتشمل هذه المهام الحسابات العلمية المعقدة، وتحديات البرمجة المعقدة، والرياضيات الرمزية، واستدعاء الوظائف المتطورة، واتباع التعليمات الدقيقة. والجدير بالذكر أنه يحقق ذلك مع الحفاظ على حجمه الصغير بما يكفي للنشر السلس على الأجهزة الطرفية. بفضل 4 مليارات معلمة فقط، فإنه يتفوق على النماذج المفتوحة المماثلة التي تصل إلى 8 مليارات معلمة في كل من الدقة والإنتاجية، ويحقق زيادة في الأداء تصل إلى 50٪، وفقًا لمعايير NVIDIA الداخلية.

يتم وضع هذا النموذج بشكل استراتيجي كحجر الزاوية لنشر وكلاء الذكاء الاصطناعي المستندين إلى اللغة في البيئات ذات الموارد المحدودة. من خلال إعطاء الأولوية لكفاءة الاستدلال، يعالج Llama Nemotron Nano 4B بشكل مباشر الحاجة المتزايدة إلى نماذج مضغوطة قادرة على التعامل مع مهام الاستدلال المختلط واتباع التعليمات، والانتقال إلى ما وراء حدود البنية التحتية السحابية التقليدية.

بنية النموذج ومنهجية التدريب

تم بناء Nemotron Nano 4B على أساس بنية Llama 3.1 ويتشارك سلالة مشتركة مع نماذج "Minitron" السابقة من NVIDIA. تتميز بنيتها بتصميم محول كثيف للقراءة فقط. تم تحسين النموذج بدقة للتفوق في أعباء العمل كثيفة الاستدلال مع الحفاظ على عدد معلمات مبسط.

تتضمن عملية ما بعد التدريب للنموذج الضبط الدقيق متعدد المراحل تحت الإشراف على مجموعات بيانات منسقة بعناية تغطي مجموعة واسعة من المجالات، بما في ذلك الرياضيات والبرمجة ومهام الاستدلال واستدعاء الوظائف. بالإضافة إلى التعلم الخاضع للإشراف التقليدي، يخضع Nemotron Nano 4B لتحسين التعلم المعزز باستخدام تقنية تُعرف باسم تحسين التفضيل المدرك للمكافأة (RPO). تم تصميم هذه الطريقة المتقدمة لتعزيز فعالية النموذج في التطبيقات المستندة إلى الدردشة وتطبيقات متابعة التعليمات.

يساعد هذا المزيج الاستراتيجي من ضبط التعليمات ونمذجة المكافآت على مواءمة مخرجات النموذج بشكل أوثق مع نوايا المستخدم، خاصة في سيناريوهات الاستدلال المعقدة والمتعددة الأدوار. يؤكد نهج التدريب الخاص بـ NVIDIA التزامها بتكييف النماذج الأصغر مع سيناريوهات الاستخدام العملي التي تطلبت تاريخيًا أحجام معلمات أكبر بكثير. وهذا يجعل الذكاء الاصطناعي المتطور أكثر سهولة وقابلية للنشر في بيئات متنوعة.

تقييم الأداء والمعايير

على الرغم من حجمه الصغير، يُظهر Nemotron Nano 4B أداءً ملحوظًا عبر مهام الاستدلال ذات الدور الواحد والمتعدد الأدوار. تفيد NVIDIA بأنه يوفر زيادة كبيرة بنسبة 50٪ في معدل نقل الاستدلال مقارنة بالنماذج المفتوحة الوزن المماثلة في نطاق 8 مليارات معلمة. تُترجم هذه الكفاءة المتزايدة إلى معالجة أسرع وأوقات استجابة أسرع، وهو أمر بالغ الأهمية للتطبيقات في الوقت الفعلي. علاوة على ذلك، يدعم النموذج نافذة سياق تصل إلى 128000 رمز، مما يجعله مناسبًا تمامًا للمهام التي تتضمن مستندات واسعة النطاق، أو استدعاءات الوظائف المتداخلة، أو سلاسل الاستدلال المعقدة متعددة القفزات. تتيح نافذة السياق الممتدة هذه للنموذج الاحتفاظ بمزيد من المعلومات ومعالجتها، مما يؤدي إلى نتائج أكثر دقة ودقة.

في حين أن NVIDIA لم تقدم جداول معيارية شاملة في وثائق Hugging Face، تشير النتائج الأولية إلى أن النموذج يتفوق على البدائل المفتوحة الأخرى في المعايير التي تقييم الدقة في الرياضيات وتوليد التعليمات البرمجية واستدعاء الوظائف. يسلط هذا الأداء المتفوق في المجالات الرئيسية الضوء على إمكانات النموذج كأداة متعددة الاستخدامات للمطورين الذين يتعاملون مع مجموعة متنوعة من المشكلات المعقدة. تعمل ميزة الإنتاجية الخاصة به على زيادة ترسيخ مكانته كخيار افتراضي قابل للتطبيق للمطورين الذين يبحثون عن مسارات استدلال فعالة لأعباء العمل المعقدة باعتدال.

إمكانيات النشر الجاهزة للحافة

إحدى الخصائص المميزة لـ Nemotron Nano 4B هي تركيزه على النشر السلس للحافة. خضع النموذج لاختبارات وتحسينات صارمة لضمان التشغيل الفعال على منصات NVIDIA Jetson ووحدات معالجة الرسومات NVIDIA RTX. يتيح هذا التحسين إمكانات الاستدلال في الوقت الفعلي على الأجهزة المضمنة منخفضة الطاقة، مما يمهد الطريق للتطبيقات في الروبوتات ووكلاء الحافة المستقلين ومحطات عمل المطورين المحليين. تلغي القدرة على إجراء مهام استدلال معقدة مباشرة على الأجهزة الطرفية الحاجة إلى اتصال دائم بالخوادم السحابية، مما يقلل من زمن الوصول ويحسن الاستجابة.

بالنسبة للمؤسسات والفرق البحثية التي تعطي الأولوية للخصوصية والتحكم في النشر، فإن القدرة على تشغيل نماذج استدلال متقدمة محليًا - دون الاعتماد على واجهات برمجة تطبيقات الاستدلال السحابية - توفر وفورات كبيرة في التكاليف ومرونة محسنة. تقلل المعالجة المحلية من خطر خروقات البيانات وتضمن الامتثال للوائح الخصوصية الصارمة. علاوة على ذلك، فإنه يمكّن المؤسسات من تصميم سلوك النموذج وأدائه ليناسب احتياجاتهم الخاصة دون الاعتماد على خدمات الطرف الثالث.

الترخيص وإمكانية الوصول

يتم إصدار النموذج بموجب ترخيص NVIDIA Open Model، مما يمنح حقوق استخدام تجاري واسعة النطاق. يمكن الوصول إليه بسهولة من خلال Hugging Face، وهي منصة بارزة لمشاركة نماذج الذكاء الاصطناعي واكتشافها، على huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-4B-v1.1. تتوفر جميع أوزان النموذج ذات الصلة وملفات التكوين وعناصر الترميز علنًا، مما يعزز الشفافية والتعاون داخل مجتمع الذكاء الاصطناعي. يتماشى هيكل الترخيص مع استراتيجية NVIDIA الشاملة المتمثلة في تنمية أنظمة بيئية مطورين قوية حول نماذجها المفتوحة. من خلال تزويد المطورين بإمكانية الوصول إلى الأدوات والموارد القوية، تهدف NVIDIA إلى تسريع الابتكار ودفع اعتماد الذكاء الاصطناعي في مختلف الصناعات.

الغوص بشكل أعمق: استكشاف الفروق الدقيقة في Nemotron Nano 4B

لتقدير قدرات Llama Nemotron Nano 4B من NVIDIA حقًا، من الضروري الخوض في الجوانب التقنية المحددة التي تميزه. يتضمن ذلك فحصًا أكثر تفصيلاً لبنية النموذج وعملية التدريب وتداعيات تصميمه المحسن للحافة.

المزايا المعمارية: لماذا تتفوق محولات فك التشفير فقط

إن اختيار بنية محول فك التشفير فقط ليس عرضيًا. هذا التصميم مناسب بشكل خاص لمهام التوليد، حيث يتوقع النموذج الرمز المميز التالي في التسلسل. في سياق الاستدلال، يُترجم ذلك إلى القدرة على إنشاء حجج متماسكة ومنطقية، مما يجعله مثاليًا لمهام مثل الإجابة على الأسئلة وتلخيص النص والمشاركة في الحوار.

تتمتع محولات فك التشفير فقط بعدة مزايا رئيسية:

  • الاستدلال الفعال: فهي تسمح بالاستدلال الفعال عن طريق معالجة تسلسل الإدخال مرة واحدة فقط، وإنشاء الرموز المميزة واحدًا تلو الآخر. وهذا أمر بالغ الأهمية للتطبيقات في الوقت الفعلي حيث يكون زمن الوصول المنخفض أمرًا بالغ الأهمية.
  • قابلية التوسع: يمكن توسيع نطاق نماذج فك التشفير فقط بسهولة نسبيًا، مما يسمح بإنشاء نماذج أكبر بسعة متزايدة.
  • المرونة: يمكن ضبطها بدقة لمجموعة واسعة من المهام، مما يجعلها متعددة الاستخدامات للغاية.

يشير جانب "الكثيف" في البنية إلى أن جميع المعلمات تُستخدم أثناء الحساب. غالبًا ما يؤدي ذلك إلى أداء أفضل مقارنة بالنماذج المتفرقة، خاصةً عندما يكون حجم النموذج محدودًا.

نظام التدريب: الضبط الدقيق الخاضع للإشراف والتعلم المعزز

تعتبر عملية ما بعد التدريب بنفس القدر من الأهمية مثل البنية الأساسية. يخضع Nemotron Nano 4B لعملية ضبط دقيق متعددة المراحل تحت الإشراف، مستفيدًا من مجموعات بيانات منسقة بعناية تغطي مجموعة واسعة من المجالات. يعتبر اختيار مجموعات البيانات هذه أمرًا بالغ الأهمية، لأنه يؤثر بشكل مباشر على قدرة النموذج على التعميم إلى مهام جديدة.

  • الرياضيات: يتم تدريب النموذج على مجموعات بيانات تحتوي على مسائل وحلول رياضية، مما يمكنه من إجراء العمليات الحسابية والجبر وحساب التفاضل والتكامل.
  • *البرمجة: تعرض مجموعات بيانات البرمجة النموذج لمختلف لغات البرمجة وأنماط البرمجة، مما يسمح له بإنشاء مقتطفات التعليمات البرمجية وتصحيح الأخطاء وفهم مفاهيم البرامج.
  • مهام الاستدلال: تتحدى مجموعات البيانات هذه النموذج لحل الألغاز المنطقية وتحليل الحجج واستخلاص الاستنتاجات.
  • استدعاء الوظائف: تعلم مجموعات بيانات استدعاء الوظائف النموذج كيفية التفاعل مع واجهات برمجة التطبيقات والأدوات الخارجية، مما يوسع قدراته إلى ما وراء إنشاء النص.

يعد استخدام تحسين التفضيل المدرك للمكافأة (RPO) جانبًا مثيرًا للاهتمام بشكل خاص في عملية التدريب. تتيح تقنية التعلم المعزز هذه للنموذج التعلم من تعليقات المستخدمين، مما يحسن قدرته على إنشاء مخرجات تتوافق مع تفضيلات المستخدم. يعمل RPO من خلال تدريب نموذج مكافأة يتوقع جودة مخرجات معينة. ثم يتم استخدام نموذج المكافأة هذا لتوجيه تدريب نموذج اللغة، وتشجيعه على إنشاء مخرجات تعتبر ذات جودة عالية. هذه التقنية مفيدة بشكل خاص لتحسين أداء النموذج في البيئات المستندة إلى الدردشة وبيئات متابعة التعليمات، حيث رضا المستخدم له أهمية قصوى.

ميزة الحافة: الآثار المترتبة على التطبيقات الواقعية

ربما يكون التركيز على نشر الحافة هو أهم ما يميز Nemotron Nano 4B. تعمل الحوسبة الطرفية على تقريب قوة المعالجة من مصدر البيانات، مما يتيح اتخاذ قرارات في الوقت الفعلي وتقليل الاعتماد على البنية التحتية السحابية. هذا له آثار عميقة على مجموعة واسعة من التطبيقات.

  • الروبوتات: يمكن للروبوتات المجهزة بـ Nemotron Nano 4B معال