لاما من ميتا: أكثر من مجرد نموذج لغوي

تطور Llama: تحدي الوضع الراهن

عندما ظهرت Llama لأول مرة، تحدت هيمنة نماذج اللغات الكبيرة (LLMs) مغلقة المصدر من عمالقة التكنولوجيا. اتبعت Meta AI استراتيجية ركزت على نماذج أصغر وأكثر عمومية. كانت الفكرة الأساسية هي أن هذه النماذج الأصغر، التي تم تدريبها على عدد هائل من الرموز المميزة (tokens)، ستكون أسهل وأكثر فعالية من حيث التكلفة لإعادة تدريبها وضبطها للمهام المتخصصة. تناقض هذا النهج بشكل حاد مع الاتجاه السائد المتمثل في بناء نماذج أكبر وأكثر استهلاكًا للموارد.

ومع ذلك، فإن طبيعة Llama ‘مفتوحة المصدر’ هي موضوع نقاش. يتضمن ترخيص Meta Llama قيودًا محددة على الاستخدام التجاري والاستخدام المقبول. في حين أن هذه القيود يمكن القول إنها مبررة، إلا أنها تتعارض مع تعريف Open Source Initiative الصارم للمصدر المفتوح. وقد أدى ذلك إلى مناقشات مستمرة حول ما إذا كانت Llama مؤهلة حقًا كمصدر مفتوح.

التنقل في التحديات القانونية: مخاوف حقوق النشر

لم يخلُ تطوير Llama من العقبات القانونية. في عام 2023، واجهت Meta دعويين قضائيتين جماعيتين من مؤلفين زعموا أن كتبهم المحمية بحقوق الطبع والنشر قد استخدمت دون إذن لتدريب Llama. تسلط هذه الدعاوى القضائية الضوء على قضايا حقوق النشر المعقدة المحيطة ببيانات التدريب المستخدمة لنماذج اللغات الكبيرة. حتى الآن، لم تكن المحاكم متعاطفة بشكل كبير مع مطالبات المؤلفين.

توسيع القدرات: عائلة نماذج Llama المتنامية

منذ أواخر عام 2023، وسعت Meta AI بشكل كبير عائلة Llama. لم تعد النماذج تقتصر على التفاعلات القائمة على النصوص. يشتمل نظام Llama البيئي الحالي على نماذج متعددة الوسائط قادرة على معالجة كل من المدخلات النصية والمرئية، بالإضافة إلى نماذج مصممة لتفسير التعليمات البرمجية وتكامل الأدوات. علاوة على ذلك، قدمت Meta مكونات أمان، تُعرف باسم Llama Guard، لتحديد وتخفيف المخاطر والهجمات المحتملة، وهي مصممة لتكون جزءًا من إطار عمل شامل يسمى ‘Llama Stack’.

فيما يلي نظرة أعمق على بعض النماذج الرئيسية في عائلة Llama (مكثفة من بطاقات نماذج Meta AI):

Llama Guard 1: حماية التفاعلات

Llama Guard 1 هو نموذج 7 مليارات معلمة يعتمد على Llama 2. وهو بمثابة حماية للإدخال والإخراج، ويصنف المحتوى في كل من مطالبات المستخدم (تصنيف المطالبة) واستجابات LLM (تصنيف الاستجابة). يساعد هذا النموذج على ضمان تفاعلات أكثر أمانًا ومسؤولية مع الأنظمة القائمة على Llama.

يستخدم Llama Guard تصنيفًا من ستة مستويات لتصنيف الأضرار المحتملة:

  • العنف والكراهية: المحتوى الذي يروج للعنف أو الكراهية تجاه الأفراد أو الجماعات.
  • المحتوى الجنسي: المواد الجنسية الصريحة أو المحتوى الذي يستغل الأطفال أو يسيء إليهم أو يعرضهم للخطر.
  • الأسلحة النارية والأسلحة غير المشروعة: المحتوى المتعلق بالبيع غير المشروع للأسلحة النارية والأسلحة الأخرى أو استخدامها أو تعديلها.
  • المواد الخاضعة للرقابة أو الخاضعة للرقابة: المحتوى الذي يروج للاستخدام غير المشروع أو بيع المخدرات أو الكحول أو التبغ.
  • الانتحار وإيذاء النفس: المحتوى الذي يشجع على الانتحار أو إيذاء النفس أو يقدم تعليمات لهما.
  • التخطيط الإجرامي: المحتوى الذي يسهل أو يخطط لأنشطة غير قانونية.

Code Llama 70B: ثلاثي من براعة الترميز

يمثل Code Llama 70B توسعًا كبيرًا في قدرات الترميز في Llama. يتوفر هذا النموذج في ثلاثة متغيرات متميزة:

  • Code Llama: النموذج الأساسي المصمم لتوليف وفهم التعليمات البرمجية بشكل عام. يمكنه إنشاء التعليمات البرمجية وشرح وظائف التعليمات البرمجية والمساعدة في تصحيح الأخطاء.
  • Code Llama – Python: إصدار متخصص مصمم لبرمجة Python. تم تحسين هذا النموذج لإنشاء وفهم كود Python، مما يجعله أداة قيمة لمطوري Python.
  • Code Llama – Instruct: متغير يركز على اتباع التعليمات وضمان نشر أكثر أمانًا. هذا النموذج مفيد بشكل خاص لإنشاء تعليمات برمجية تلتزم بإرشادات وبروتوكولات أمان محددة.

تتوفر جميع المتغيرات الثلاثة بأحجام مختلفة: 7 مليارات، و 13 مليار، و 34 مليار، و 70 مليار معلمة. تم تصميم Code Llama ومتغيراته للاستخدام التجاري والبحثي، في المقام الأول في اللغة الإنجليزية ولغات البرمجة ذات الصلة. هناك أدلة كثيرة تشير إلى أن Code Llama يمتلك قدرات ترميز قوية.

Llama Guard 2: تصنيف أمان محسّن

يعتمد Llama Guard 2 على أساس سابقه، حيث يقدم إمكانات محسّنة لتصنيف الأمان. تم تدريب هذا النموذج الذي يبلغ 8 مليارات معلمة، استنادًا إلى Llama 3، للتنبؤ بتصنيفات الأمان عبر 11 فئة، بما يتماشى مع تصنيف MLCommons للمخاطر.

تشمل فئات المخاطر التي يغطيها Llama Guard 2 ما يلي:

  • S1: الجرائم العنيفة: المحتوى المتعلق بأعمال إجرامية عنيفة.
  • S2: الجرائم غير العنيفة: المحتوى المتعلق بجرائم غير عنيفة.
  • S3: الجرائم المتعلقة بالجنس: المحتوى الذي يتضمن جرائم جنسية.
  • S4: استغلال الأطفال جنسيًا: المحتوى الذي يستغل الأطفال أو يسيء إليهم أو يعرضهم للخطر جنسيًا.
  • S5: المشورة المتخصصة: نصيحة غير مؤهلة أو مضللة في مجالات متخصصة (مثل الطبية والقانونية والمالية).
  • S6: الخصوصية: المحتوى الذي ينتهك الخصوصية أو يكشف عن معلومات شخصية دون موافقة.
  • S7: الملكية الفكرية: المحتوى الذي ينتهك حقوق الملكية الفكرية.
  • S8: الأسلحة العشوائية: المحتوى المتعلق بالأسلحة التي تسبب ضررًا واسع النطاق وعشوائيًا.
  • S9: الكراهية: المحتوى الذي يعبر عن الكراهية أو التحيز تجاه الأفراد أو الجماعات.
  • S10: الانتحار وإيذاء النفس: المحتوى الذي يروج للانتحار أو إيذاء النفس أو يقدم تعليمات لهما.
  • S11: المحتوى الجنسي: المواد الجنسية الصريحة.

Meta Llama 3: تعدد الاستخدامات في الحوار

يتم تقديم Meta Llama 3 بحجمين، 8 مليارات و 70 مليار معلمة، مع متغيرات مُدرَّبة مسبقًا ومُعدَّلة بالتعليمات. تم تحسين النماذج المُعدَّلة بالتعليمات خصيصًا للتطبيقات القائمة على الحوار، مما يجعلها مناسبة لروبوتات الدردشة وأنظمة الذكاء الاصطناعي للمحادثة.

Prompt Guard: الدفاع ضد المدخلات الضارة

Prompt Guard هو نموذج مصنف مصمم لاكتشاف المطالبات الضارة، بما في ذلك عمليات كسر الحماية (محاولات لتجاوز قيود الأمان) وحقن المطالبات (محاولات لمعالجة مخرجات النموذج من خلال مدخلات مُصممة). توصي Meta AI بضبط Prompt Guard بدقة باستخدام بيانات خاصة بالتطبيق لتحقيق الأداء الأمثل.

على عكس Llama Guard، لا يتطلب Prompt Guard بنية مطالبة محددة. إنه يعمل على إدخال سلسلة، ويصنفها على أنها آمنة أو غير آمنة (على مستويين مختلفين من الخطورة). إنه نموذج BERT يُخرج التصنيفات حصريًا.

Llama Guard 3: أمان متعدد الوسائط ومتعدد اللغات

يتوفر Llama Guard 3 في ثلاثة إصدارات: Llama Guard 3 1B و Llama Guard 3 8B و Llama Guard 3 11B-Vision. أول نموذجين هما نماذج نصية فقط، بينما يشتمل الثالث على إمكانات فهم الرؤية لنموذج Llama 3.2 11B-Vision. جميع الإصدارات متعددة اللغات (للمطالبات النصية فقط) وتلتزم بفئات المخاطر التي حددها اتحاد MLCommons.

يمكن أيضًا استخدام Llama Guard 3 8B للفئة S14، إساءة استخدام مترجم التعليمات البرمجية. من المهم ملاحظة أن نموذج Llama Guard 3 1B غير مُحسَّن لهذه الفئة المحددة.

فئات المخاطر، التي تتوسع في تلك الخاصة بـ Llama Guard 2 هي:

  • S1: الجرائم العنيفة
  • S2: الجرائم غير العنيفة
  • S3: الجرائم المتعلقة بالجنس
  • S4: استغلال الأطفال جنسيًا
  • S5: التشهير
  • S6: المشورة المتخصصة
  • S7: الخصوصية
  • S8: الملكية الفكرية
  • S9: الأسلحة العشوائية
  • S10: الكراهية
  • S11: الانتحار وإيذاء النفس
  • S12: المحتوى الجنسي
  • S13: الانتخابات
  • S14: إساءة استخدام مترجم التعليمات البرمجية

Meta Llama 3.1: نماذج توليدية متعددة اللغات

تشتمل مجموعة Meta Llama 3.1 على نماذج لغوية كبيرة متعددة اللغات، بما في ذلك نماذج توليدية مُدرَّبة مسبقًا ومُعدَّلة بالتعليمات بأحجام 8 مليارات و 70 مليار و 405 مليار معلمة (إدخال نصي، إخراج نصي).

اللغات المدعومة تشمل: الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلاندية.

Meta Llama 3.2: قدرات حوار محسّنة

تتميز مجموعة Llama 3.2 بنماذج لغوية كبيرة متعددة اللغات، تشمل نماذج توليدية مُدرَّبة مسبقًا ومُعدَّلة بالتعليمات بأحجام 1 مليار و 3 مليارات معلمة (إدخال نصي، إخراج نصي). تتوفر أيضًا إصدارات مُكمَّمة من هذه النماذج. تم تحسين نماذج Llama 3.2 النصية فقط المُعدَّلة بالتعليمات للحوار متعدد اللغات، وهي تتفوق في مهام مثل الاسترجاع الوكيل والتلخيص. نماذج 1B و 3B هي مشتقات أصغر وأقل قوة من Llama 3.1.

اللغات المدعومة رسميًا هي: الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلاندية. ومع ذلك، تم تدريب Llama 3.2 على مجموعة واسعة من اللغات تتجاوز هذه الثمانية.

Llama 3.2-Vision: استدلال وفهم الصور

تقدم مجموعة Llama 3.2-Vision نماذج لغوية كبيرة متعددة الوسائط. هذه النماذج مُدرَّبة مسبقًا ومُعدَّلة بالتعليمات لاستدلال الصور، وهي متوفرة بأحجام 11 مليار و 90 مليار معلمة (إدخال نصي وصوري، إخراج نصي). تم تحسين النماذج المُعدَّلة بالتعليمات للتعرف البصري واستدلال الصور والتعليقات التوضيحية والإجابة على الأسئلة العامة حول الصور.

بالنسبة للمهام النصية فقط، فإن اللغات المدعومة رسميًا هي الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلاندية. تم تدريب Llama 3.2 على مجموعة أوسع من اللغات، ولكن بالنسبة لتطبيقات الصورة + النص، فإن اللغة الإنجليزية هي اللغة الوحيدة المدعومة.

Meta Llama 3.3: نموذج 70B قوي

نموذج اللغة الكبيرة متعدد اللغات Meta Llama 3.3 هو نموذج توليدي مُدرَّب مسبقًا ومُعدَّل بالتعليمات مع 70 مليار معلمة (إدخال نصي، إخراج نصي).

اللغات المدعومة: الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلاندية.

من الضروري أن نفهم أن نماذج اللغات الكبيرة، بما في ذلك Llama 3.2، غير مخصصة للنشر المعزول. يجب دمجها في نظام ذكاء اصطناعي شامل مع حواجز حماية مناسبة. يُتوقع من المطورين تنفيذ ضمانات النظام، خاصة عند بناء أنظمة وكيل.

تتضمن Llama 3.3 ونماذج Llama 3.2 النصية فقط و Llama 3.1 دعمًا مدمجًا للأدوات التالية:

  • Brave Search: استدعاء أداة لإجراء عمليات بحث على الويب.
  • Wolfram Alpha: استدعاء أداة لتنفيذ عمليات حسابية رياضية معقدة.
  • Code Interpreter: استدعاء أداة يمكّن النموذج من إخراج كود Python.

ملاحظة: نماذج رؤية Llama 3.2 لا تدعم استدعاء الأدوات باستخدام مدخلات نص + صورة.

Llama Stack: إطار عمل موحد

يمكن أن يكون العدد الهائل لنماذج Llama مربكًا. لتبسيط عملية الاختيار والتكامل، تقدم Meta Llama Stack. يركز هذا الإطار على نماذج Llama ولكنه يوفر أيضًا محولات للقدرات ذات الصلة، مثل قواعد بيانات المتجهات لتوليد الاسترجاع المعزز (RAG).

يدعم Llama Stack حاليًا حزم SDK في Python و Swift و Node و Kotlin. يقدم توزيعات مختلفة، بما في ذلك:

  • التوزيع المحلي (باستخدام Ollama): للتطوير والاختبار المحليين.
  • التوزيعات على الجهاز (iOS و Android): لنشر نماذج Llama على الأجهزة المحمولة.
  • توزيعات لوحدات معالجة الرسومات (GPUs): للاستفادة من قوة وحدات معالجة الرسومات لمعالجة أسرع.
  • التوزيعات المستضافة عن بُعد (Together and Fireworks): للوصول إلى نماذج Llama من خلال الخدمات المستندة إلى السحابة.

المفهوم الأساسي وراء Llama Stack هو تمكين المطورين من بناء التطبيقات محليًا ثم الانتقال بسهولة إلى بيئة الإنتاج. حتى أنه يوفر Llama Stack Playground تفاعليًا للتطوير المحلي مقابل Llama Stack بعيد.

تشغيل نماذج Llama: خيارات نشر متعددة الاستخدامات

يمكن نشر نماذج Llama على مجموعة متنوعة من الأنظمة الأساسية، بما في ذلك Linux و Windows و macOS والسحابة. يمكن تشغيل نماذج Llama المُكمَّمة، مثل Llama 3.2 و Llama 3.2-Vision، بفعالية على الأجهزة الحديثة، حتى على أجهزة الكمبيوتر المحمولة مثل M4 Pro MacBook Pro باستخدام أدوات مثل Ollama.

توفر Meta أدلة إرشادية شاملة لنشر واستخدام نماذج Llama. بالإضافة إلى ذلك، تتوفر أدلة تكامل لأطر العمل الشائعة مثل LangChain و LlamaIndex.

باختصار، تجاوزت Llama كونها مجرد نموذج لغوي بسيط، فهي الآن إطار عمل AI متعدد الوسائط كامل مع ميزات أمان، وتوليد التعليمات البرمجية، ودعم للعديد من اللغات. يسمح نظام Meta بنشره في أماكن عديدة، لكن القضايا القانونية المتعلقة ببيانات التدريب، والخلافات حول ما إذا كانت Llama مفتوحة المصدر، مستمرة.