إطلاق Reka Flash 3: نموذج 21B مفتوح المصدر

التحديات العملية في مشهد الذكاء الاصطناعي اليوم

أدى التطور السريع للذكاء الاصطناعي إلى ظهور العديد من الفرص، ولكنه قدم أيضًا للمطورين والمؤسسات عقبات كبيرة. واحدة من أكثر القضايا إلحاحًا هي الطلب الحسابي العالي المرتبط بالعديد من نماذج الذكاء الاصطناعي الحديثة. غالبًا ما يتطلب تدريب هذه النماذج ونشرها قوة معالجة كبيرة، مما يجعل من الصعب على الكيانات الصغيرة أو تلك التي لديها موارد محدودة الاستفادة الكاملة من فوائد الذكاء الاصطناعي.

علاوة على ذلك، يمكن أن تؤثر مشكلات زمن الوصول بشكل كبير على تجربة المستخدم، خاصة في التطبيقات في الوقت الفعلي. يمكن أن يؤدي التأخير في أوقات الاستجابة إلى جعل نظام الذكاء الاصطناعي غير عملي، حتى لو كان يمتلك قدرات رائعة. هذا صحيح بشكل خاص للتطبيقات التي تتطلب ردود فعل فورية، مثل روبوتات الدردشة أو الأدوات التفاعلية.

يكمن تحدٍ آخر في التوفر المحدود لنماذج مفتوحة المصدر قابلة للتكيف حقًا. في حين أن العديد من الخيارات مفتوحة المصدر موجودة، إلا أنها قد لا تقدم دائمًا المرونة اللازمة لمعالجة حالات استخدام محددة أو التكيف مع المتطلبات المتطورة. يمكن أن يقيد هذا الابتكار ويجبر المطورين على الاعتماد على حلول مملوكة، والتي قد تأتي مع مجموعة خاصة بها من القيود والتكاليف.

تعتمد العديد من حلول الذكاء الاصطناعي الحالية بشكل كبير على بنى تحتية سحابية باهظة الثمن. في حين أن الحوسبة السحابية توفر قابلية التوسع والراحة، إلا أنها يمكن أن تكون أيضًا عبئًا ماليًا كبيرًا، خاصة بالنسبة للمؤسسات الصغيرة أو المطورين الفرديين. يمكن أن تكون تكلفة الوصول إلى موارد الحوسبة القوية عائقًا أمام الدخول، مما يمنع الكثيرين من استكشاف وتنفيذ حلول الذكاء الاصطناعي.

علاوة على ذلك، هناك فجوة ملحوظة في السوق للنماذج التي تتسم بالكفاءة والمرونة الكافية للتطبيقات على الأجهزة. العديد من النماذج الحالية كبيرة جدًا وتستهلك الكثير من الموارد بحيث لا يمكن نشرها على الأجهزة ذات قوة المعالجة والذاكرة المحدودة، مثل الهواتف الذكية أو الأنظمة المضمنة. يحد هذا من إمكانية دمج الذكاء الاصطناعي في مجموعة واسعة من الأجهزة والتطبيقات اليومية.

يعد التصدي لهذه التحديات أمرًا بالغ الأهمية لجعل الذكاء الاصطناعي أكثر سهولة في الوصول إليه وقابلية للتخصيص. هناك حاجة متزايدة إلى حلول يمكن تكييفها مع التطبيقات المتنوعة دون الحاجة إلى موارد باهظة. سيمكن هذا المزيد من المطورين والمؤسسات من تسخير قوة الذكاء الاصطناعي وإنشاء حلول مبتكرة تلبي احتياجاتهم الخاصة.

تقديم Reka Flash 3: نهج جديد لنمذجة الذكاء الاصطناعي

يمثل Reka Flash 3 من Reka AI خطوة مهمة إلى الأمام في معالجة التحديات الموضحة أعلاه. تم تصميم نموذج الاستدلال هذا الذي يبلغ 21 مليار معلمة بدقة من الألف إلى الياء، مع التركيز على العملية والتنوع. إنه مصمم ليكون أداة أساسية لمجموعة واسعة من التطبيقات، تشمل:

  • المحادثة العامة: الانخراط في حوارات طبيعية ومتماسكة.
  • دعم الترميز: مساعدة المطورين في إنشاء التعليمات البرمجية وتصحيح الأخطاء.
  • اتباع التعليمات: تفسير وتنفيذ تعليمات المستخدم بدقة.
  • استدعاء الوظائف: التكامل بسلاسة مع الأدوات وواجهات برمجة التطبيقات الخارجية.

تضمن تطوير Reka Flash 3 عملية تدريب منسقة بعناية. استفادت هذه العملية من مجموعة من:

  • مجموعات البيانات المتاحة للجمهور: استخدام البيانات المتاحة بسهولة لتوفير قاعدة معرفية واسعة.
  • مجموعات البيانات الاصطناعية: إنشاء بيانات اصطناعية لتعزيز قدرات محددة ومعالجة فجوات البيانات.

يضمن هذا النهج المختلط أن النموذج متكامل وقادر على التعامل مع مجموعة متنوعة من المهام. تم تحقيق مزيد من التحسين من خلال:

  • ضبط دقيق للتعليمات: تحسين قدرة النموذج على فهم التعليمات والاستجابة لها.
  • التعلم المعزز باستخدام طرق REINFORCE Leave One-Out (RLOO): تحسين أداء النموذج من خلال التغذية الراجعة التكرارية والتحسين.

يهدف نظام التدريب المتعمد والمتعدد الأوجه هذا إلى تحقيق توازن أمثل بين القدرة والكفاءة. الهدف هو وضع Reka Flash 3 كخيار عملي ومعقول ضمن مشهد نماذج الذكاء الاصطناعي المتاحة.

الميزات التقنية وكفاءة Reka Flash 3

من الناحية الفنية، يتميز Reka Flash 3 بالعديد من الميزات التي تساهم في تنوعه وكفاءة موارده. تم تصميم هذه الميزات لجعل النموذج قويًا وعمليًا لمجموعة واسعة من سيناريوهات النشر.

إحدى الميزات البارزة هي قدرته على التعامل مع طول سياق يصل إلى 32000 رمز. هذه ميزة كبيرة، لأنها تسمح للنموذج بمعالجة وفهم المستندات الطويلة والمهام المعقدة دون أن يطغى عليها. هذه القدرة مفيدة بشكل خاص للتطبيقات التي تتضمن:

  • تحليل مجموعات النصوص الكبيرة: استخلاص الرؤى من مجموعات البيانات الشاملة.
  • إنشاء ملخصات شاملة: تكثيف المعلومات المطولة في ملخصات موجزة.
  • المشاركة في حوارات مطولة: الحفاظ على السياق والتماسك على مدى المحادثات الطويلة.

ميزة أخرى مبتكرة هي دمج آلية ‘فرض الميزانية’. يتم تنفيذ هذه الآلية من خلال علامات <reasoning> مخصصة، والتي تسمح للمستخدمين بالتحكم الصريح في عملية استدلال النموذج. على وجه التحديد، يمكن للمستخدمين:

  • تحديد عدد خطوات الاستدلال: تقييد الجهد الحسابي للنموذج.
  • ضمان أداء ثابت: منع الاستهلاك المفرط للموارد.
  • تحسين أوقات الاستجابة: تحقيق نتائج أسرع عن طريق الحد من عمق الاستدلال.

توفر هذه الميزة مستوى قيمًا من التحكم في سلوك النموذج، مما يجعله مناسبًا بشكل خاص للتطبيقات التي تكون فيها قيود الموارد أو الأداء في الوقت الفعلي أمرًا بالغ الأهمية.

علاوة على ذلك، تم تصميم Reka Flash 3 مع وضع النشر على الجهاز في الاعتبار. هذا اعتبار حاسم، لأنه يوسع التطبيقات المحتملة للنموذج خارج البيئات القائمة على السحابة. حجم النموذج وكفاءته يجعلان من الممكن تشغيله على الأجهزة ذات قوة المعالجة والذاكرة المحدودة.

  • الحجم الكامل الدقة (fp16): 39 جيجابايت
  • حجم التكميم 4 بت: 11 جيجابايت

هذا الحجم الصغير، خاصة مع التكميم، يسمح بعمليات نشر محلية أكثر سلاسة واستجابة مقارنة بالنماذج الأكبر والأكثر استهلاكًا للموارد. يفتح هذا إمكانيات لدمج الذكاء الاصطناعي في:

  • تطبيقات الهاتف المحمول: تحسين تجارب المستخدم على الهواتف الذكية والأجهزة اللوحية.
  • الأنظمة المضمنة: تمكين الوظائف الذكية في الأجهزة محدودة الموارد.
  • التطبيقات غير المتصلة بالإنترنت: توفير إمكانات الذكاء الاصطناعي حتى بدون اتصال بالإنترنت.

التقييم والأداء: منظور عملي

تتأكد عملية Reka Flash 3 بشكل أكبر من خلال مقاييس التقييم وبيانات الأداء الخاصة به. في حين أن النموذج لا يسعى لتحقيق درجات قياسية في كل معيار، إلا أنه يظهر مستوى قويًا من الكفاءة عبر مجموعة من المهام.

على سبيل المثال، يحقق النموذج درجة MMLU-Pro تبلغ 65.0. في حين أن هذه قد لا تكون أعلى درجة في هذا المجال، فمن المهم مراعاة السياق. تم تصميم Reka Flash 3 للاستخدام للأغراض العامة، وتشير هذه النتيجة إلى مستوى محترم من الفهم عبر مجموعة واسعة من الموضوعات. علاوة على ذلك، يمكن تحسين أداء النموذج بشكل كبير عند إقرانه بمصادر معرفة تكميلية، مثل بحث الويب. يسلط هذا الضوء على قدرته على الاستفادة من المعلومات الخارجية لتحسين دقته وقدراته الاستدلالية.

القدرات متعددة اللغات للنموذج جديرة بالملاحظة أيضًا. يحقق درجة COMET تبلغ 83.2 في WMT’23، وهو معيار مستخدم على نطاق واسع للترجمة الآلية. يشير هذا إلى مستوى معقول من الكفاءة في التعامل مع المدخلات غير الإنجليزية، على الرغم من تركيز النموذج الأساسي على اللغة الإنجليزية. توسع هذه القدرة من إمكانية تطبيق النموذج على جمهور عالمي وسياقات لغوية متنوعة.

عند مقارنة Reka Flash 3 بنظرائه، مثل Qwen-32B، يصبح عدد معلماته الفعال واضحًا. يحقق أداءً تنافسيًا بحجم نموذج أصغر بكثير. تترجم هذه الكفاءة إلى:

  • متطلبات حسابية أقل: خفض حاجز الدخول للمطورين والمؤسسات.
  • سرعات استدلال أسرع: تمكين أوقات استجابة أسرع في التطبيقات في الوقت الفعلي.
  • استهلاك أقل للطاقة: جعله خيارًا أكثر صداقة للبيئة.

تسلط هذه العوامل الضوء على إمكانات النموذج لمجموعة واسعة من التطبيقات في العالم الحقيقي، دون اللجوء إلى مطالبات مبالغ فيها أو متطلبات موارد غير مستدامة.

Reka Flash 3: حل ذكاء اصطناعي متوازن ويمكن الوصول إليه

يمثل Reka Flash 3 نهجًا مدروسًا وعمليًا لتطوير نماذج الذكاء الاصطناعي. إنه يعطي الأولوية للتوازن بين الأداء والكفاءة، مما ينتج عنه نموذج قوي ولكنه قابل للتكيف. إن قدراته في الدردشة العامة والترميز ومهام التعليمات، جنبًا إلى جنب مع تصميمه المدمج وميزاته المبتكرة، تجعله خيارًا عمليًا لسيناريوهات النشر المختلفة.

تمكّن نافذة السياق التي تبلغ 32000 رمز النموذج من التعامل مع المدخلات المعقدة والطويلة، بينما توفر آلية فرض الميزانية للمستخدمين تحكمًا دقيقًا في عملية الاستدلال الخاصة به. هذه الميزات، جنبًا إلى جنب مع ملاءمتها لعمليات النشر على الأجهزة والتطبيقات ذات زمن الوصول المنخفض، تضع Reka Flash 3 كأداة قيمة للباحثين والمطورين الذين يبحثون عن حل ذكاء اصطناعي قادر ويمكن إدارته. إنه يوفر أساسًا واعدًا يتماشى مع الاحتياجات العملية دون تعقيد غير ضروري أو متطلبات موارد مفرطة.