منصة Nvidia NeMo: ثورة في بناء وكلاء الذكاء الاصطناعي
أعلنت Nvidia رسميًا عن إطلاق منصة NeMo، وهي عبارة عن مجموعة شاملة من الخدمات المصغرة (Microservices) المصممة لتبسيط وتسهيل عملية تطوير أنظمة وكلاء الذكاء الاصطناعي (AI Agent) المتقدمة. تم الإعلان عن هذه المنصة يوم الأربعاء الموافق 23 أبريل، وهي تدعم مجموعة متنوعة من نماذج اللغة الكبيرة (LLMs) وتستفيد من آلية مبتكرة تُعرف باسم ‘دولاب البيانات’ (Data Flywheel). يتيح هذا النهج المبتكر لوكلاء الذكاء الاصطناعي التعلم المستمر من التجارب الواقعية، مما يعزز أداءهم وقدرتهم على التكيف مع مختلف السيناريوهات.
المكونات الأساسية لمنصة NeMo
تُعتبر منصة NeMo نظامًا بيئيًا متكاملاً من الخدمات المصغرة المترابطة، حيث تم تصميم كل خدمة لمعالجة جوانب محددة من تطوير وكلاء الذكاء الاصطناعي. تعمل هذه المكونات بتناغم لتزويد المطورين بمجموعة أدوات قوية لإنشاء حلول ذكاء اصطناعي متطورة.
مُخصص NeMo: تسريع عملية الضبط الدقيق لنماذج اللغة الكبيرة
يُعتبر مُخصص NeMo (NeMo Customizer) مكونًا رئيسيًا مصممًا لتسريع عملية الضبط الدقيق (Fine-Tuning) لنماذج اللغة الكبيرة. تعمل هذه الخدمة المصغرة على تبسيط عملية تخصيص نماذج اللغة الكبيرة لمهام أو مجموعات بيانات محددة، مما يُمكّن المطورين من تحقيق الأداء الأمثل بأقل جهد ممكن. من خلال تبسيط عملية الضبط الدقيق، يقلل مُخصص NeMo من الوقت والموارد المطلوبة لتكييف نماذج اللغة الكبيرة مع مختلف التطبيقات.
كيف يعمل مُخصص NeMo؟
يعتمد مُخصص NeMo على مجموعة من الخوارزميات المتقدمة وتقنيات التعلم الآلي لضبط نماذج اللغة الكبيرة تلقائيًا. يمكن للمطورين ببساطة تحميل مجموعة بيانات التدريب الخاصة بهم وتحديد المهمة التي يرغبون في تحسين النموذج عليها. سيتولى مُخصص NeMo بعد ذلك عملية الضبط الدقيق، مع مراعاة القيود والموارد المتاحة.
فوائد استخدام مُخصص NeMo:
- تسريع عملية التطوير: يقلل مُخصص NeMo بشكل كبير من الوقت والجهد اللازمين لضبط نماذج اللغة الكبيرة، مما يسمح للمطورين بإطلاق منتجاتهم وخدماتهم بشكل أسرع.
- تحسين الأداء: يُمكّن مُخصص NeMo المطورين من تحقيق أداء أفضل لنماذج اللغة الكبيرة الخاصة بهم من خلال تخصيصها لمهام ومجموعات بيانات محددة.
- تقليل التكاليف: من خلال أتمتة عملية الضبط الدقيق، يقلل مُخصص NeMo من التكاليف المرتبطة بتطوير وصيانة نماذج اللغة الكبيرة.
مُقيّم NeMo: تبسيط تقييم نماذج الذكاء الاصطناعي وسير العمل
يوفر مُقيّم NeMo (NeMo Evaluator) طريقة مبسطة لتقييم نماذج الذكاء الاصطناعي وسير العمل بناءً على معايير مخصصة وخاصة بالصناعة. تتيح هذه الخدمة المصغرة للمطورين تقييم أداء وكلاء الذكاء الاصطناعي الخاص بهم بسرعة، وتحديد مجالات التحسين، والتأكد من أن حلولهم تلبي المعايير المطلوبة. باستخدام خمسة استدعاءات API فقط، يمكن للمطورين الحصول على رؤى قيمة حول فعالية نماذج الذكاء الاصطناعي الخاصة بهم.
ما هي أنواع التقييمات التي يمكن إجراؤها باستخدام مُقيّم NeMo؟
- تقييم الدقة: يقيّم مُقيّم NeMo دقة نماذج الذكاء الاصطناعي في مهام مختلفة، مثل تصنيف الصور، والتعرف على الكلام، وترجمة اللغات.
- تقييم الكفاءة: يقيّم مُقيّم NeMo كفاءة نماذج الذكاء الاصطناعي من حيث استخدام الموارد، مثل الذاكرة ووحدة المعالجة المركزية.
- تقييم الموثوقية: يقيّم مُقيّم NeMo موثوقية نماذج الذكاء الاصطناعي في بيئات مختلفة، مثل الظروف المتغيرة أو البيانات غير الكاملة.
فوائد استخدام مُقيّم NeMo:
- تقييم سريع ودقيق: يوفر مُقيّم NeMo تقييمات سريعة ودقيقة لنماذج الذكاء الاصطناعي، مما يسمح للمطورين بتحديد المشكلات المحتملة في وقت مبكر من عملية التطوير.
- تحسين الجودة: يساعد مُقيّم NeMo المطورين على تحسين جودة نماذج الذكاء الاصطناعي الخاصة بهم من خلال تحديد مجالات التحسين وتقديم توصيات للتغييرات.
- ضمان الامتثال: يساعد مُقيّم NeMo المطورين على ضمان امتثال نماذج الذكاء الاصطناعي الخاصة بهم للمعايير واللوائح الصناعية.
حواجز NeMo: تعزيز الامتثال والحماية
تم تصميم حواجز NeMo (NeMo Guardrails) لتعزيز الامتثال والحماية لأنظمة الذكاء الاصطناعي دون التأثير بشكل كبير على الأداء. تضمن هذه الخدمة المصغرة التزام وكلاء الذكاء الاصطناعي بالمبادئ التوجيهية الأخلاقية والمتطلبات التنظيمية، مما يقلل من خطر العواقب غير المقصودة. من خلال إضافة نصف ثانية فقط من الكمون، يمكن لحواجز NeMo تحسين حماية الامتثال بنسبة تصل إلى 1.4 مرة.
كيف تعمل حواجز NeMo؟
تعتمد حواجز NeMo على مجموعة من القواعد والسياسات التي تحدد السلوك المقبول لوكلاء الذكاء الاصطناعي. يمكن للمطورين تخصيص هذه القواعد والسياسات لتلبية الاحتياجات الخاصة بتطبيقاتهم. عندما يتفاعل وكيل الذكاء الاصطناعي مع المستخدمين أو البيئة، تقوم حواجز NeMo بمراقبة سلوكه والتأكد من أنه يلتزم بالقواعد والسياسات المحددة.
فوائد استخدام حواجز NeMo:
- تحسين الامتثال: تضمن حواجز NeMo امتثال وكلاء الذكاء الاصطناعي للمعايير واللوائح الأخلاقية والتنظيمية، مما يقلل من خطر المساءلة القانونية.
- تعزيز الحماية: تحمي حواجز NeMo المستخدمين من العواقب غير المقصودة أو الضارة المحتملة لأنظمة الذكاء الاصطناعي.
- بناء الثقة: تساعد حواجز NeMo في بناء الثقة في أنظمة الذكاء الاصطناعي من خلال ضمان أنها تعمل بطريقة مسؤولة وأخلاقية.
مُسترجع NeMo: تسهيل استرجاع المعرفة
يساعد مُسترجع NeMo (NeMo Retriever) وكلاء الذكاء الاصطناعي في الوصول إلى المعلومات الدقيقة واسترجاعها من قواعد البيانات. تُمكّن هذه الخدمة المصغرة وكلاء الذكاء الاصطناعي من تحديد الموقع الصحيح للمعرفة بسرعة، مما يحسن قدرتهم على الإجابة على الأسئلة وحل المشكلات واتخاذ قرارات مستنيرة. من خلال تبسيط عملية استرجاع المعرفة، يعزز مُسترجع NeMo الفعالية الكلية لوكلاء الذكاء الاصطناعي.
كيف يعمل مُسترجع NeMo؟
يعتمد مُسترجع NeMo على مجموعة من تقنيات فهرسة البحث المتقدمة لتمكين وكلاء الذكاء الاصطناعي من العثور على المعلومات ذات الصلة بسرعة في قواعد البيانات الكبيرة. يمكن للمطورين توصيل مُسترجع NeMo بقواعد البيانات الخاصة بهم وتحديد أنواع المعلومات التي يرغبون في استرجاعها. عندما يحتاج وكيل الذكاء الاصطناعي إلى معلومات، فإنه يرسل طلبًا إلى مُسترجع NeMo، الذي يقوم بعد ذلك بالبحث في قواعد البيانات وإرجاع النتائج الأكثر صلة.
فوائد استخدام مُسترجع NeMo:
- استرجاع سريع ودقيق: يوفر مُسترجع NeMo استرجاعًا سريعًا ودقيقًا للمعلومات من قواعد البيانات، مما يسمح لوكلاء الذكاء الاصطناعي باتخاذ قرارات مستنيرة بسرعة.
- تحسين الأداء: يحسن مُسترجع NeMo أداء وكلاء الذكاء الاصطناعي من خلال تزويدهم بالمعلومات التي يحتاجون إليها لحل المشكلات واتخاذ القرارات.
- زيادة الكفاءة: يزيد مُسترجع NeMo من كفاءة وكلاء الذكاء الاصطناعي من خلال تبسيط عملية استرجاع المعرفة.
مُنسق NeMo: تدريب نماذج الذكاء الاصطناعي التوليدية عالية الدقة
تم تصميم مُنسق NeMo (NeMo Curator) لتدريب نماذج الذكاء الاصطناعي التوليدية عالية الدقة. توفر هذه الخدمة المصغرة للمطورين الأدوات والموارد اللازمة لإنشاء وكلاء ذكاء اصطناعي يمكنهم إنشاء نصوص وصور وأنواع أخرى من المحتوى واقعية ومتماسكة. من خلال تحسين عملية التدريب، يُمكّن مُنسق NeMo تطوير حلول الذكاء الاصطناعي التوليدية المتطورة.
ما هي أنواع نماذج الذكاء الاصطناعي التوليدية التي يمكن تدريبها باستخدام مُنسق NeMo؟
- نماذج توليد النصوص: يمكن استخدام مُنسق NeMo لتدريب نماذج يمكنها إنشاء نصوص واقعية ومتماسكة، مثل المقالات ورسائل البريد الإلكتروني والشعر.
- نماذج توليد الصور: يمكن استخدام مُنسق NeMo لتدريب نماذج يمكنها إنشاء صور واقعية، مثل صور الأشخاص والحيوانات والمناظر الطبيعية.
- نماذج توليد الصوت: يمكن استخدام مُنسق NeMo لتدريب نماذج يمكنها إنشاء صوت واقعي، مثل الكلام والموسيقى.
فوائد استخدام مُنسق NeMo:
- نماذج عالية الدقة: يُمكّن مُنسق NeMo المطورين من تدريب نماذج ذكاء اصطناعي توليدية عالية الدقة يمكنها إنشاء محتوى واقعي ومتماسك.
- تحسين الأداء: يحسن مُنسق NeMo أداء نماذج الذكاء الاصطناعي التوليدية من خلال تحسين عملية التدريب.
- تقليل التكاليف: يقلل مُنسق NeMo من التكاليف المرتبطة بتدريب نماذج الذكاء الاصطناعي التوليدية من خلال أتمتة عملية التدريب.
آلية دولاب البيانات
يُعتبر دولاب البيانات (Data Flywheel) مفهومًا مركزيًا في منصة NeMo، وهو مصمم لتمكين التعلم المستمر وتحسين نماذج الذكاء الاصطناعي. تخلق هذه الآلية حلقة تغذية راجعة إيجابية حيث يتعلم وكلاء الذكاء الاصطناعي من تفاعلاتهم مع البيئة، ليصبحوا أكثر ذكاءً وفعالية بمرور الوقت.
حلقة التغذية الراجعة الإيجابية
يعمل دولاب البيانات من خلال دورة مستمرة من التفاعل وجمع البيانات والتقييم والتحسين. أثناء تفاعل وكلاء الذكاء الاصطناعي مع المستخدمين والبيئة، فإنهم يولدون كميات هائلة من البيانات، بما في ذلك سجلات الحوار وأنماط الاستخدام. تتم بعد ذلك معالجة هذه البيانات بواسطة مُنسق NeMo لتحديد الرؤى والأنماط ذات الصلة. يقوم مُقيّم NeMo بتقييم أداء وكيل الذكاء الاصطناعي، وتحديد المجالات التي يتفوق فيها والمجالات التي يحتاج إلى تحسينها. أخيرًا، يقوم مُخصص NeMo بضبط النموذج بناءً على هذا التقييم، مما يعزز دقته وفعاليته.
مثال على كيفية عمل دولاب البيانات:
لنفترض أن وكيل ذكاء اصطناعي يُستخدم للإجابة على أسئلة العملاء حول منتج معين. أثناء تفاعل الوكيل مع العملاء، فإنه يجمع بيانات حول الأسئلة التي يطرحونها والإجابات التي يقدمها. تتم بعد ذلك معالجة هذه البيانات بواسطة مُنسق NeMo لتحديد الأسئلة الشائعة التي لا يجيب عليها الوكيل بشكل كافٍ. يقوم مُقيّم NeMo بتقييم أداء الوكيل، وتحديد المجالات التي يحتاج فيها إلى تحسين. أخيرًا، يقوم مُخصص NeMo بضبط النموذج بناءً على هذا التقييم، مما يحسن قدرته على الإجابة على أسئلة العملاء بدقة.
الحد الأدنى من التدخل البشري وأقصى قدر من الاستقلالية
تم تصميم دولاب البيانات للعمل بأقل تدخل بشري وأقصى قدر من الاستقلالية. يتيح ذلك لوكلاء الذكاء الاصطناعي التعلم والتحسين باستمرار دون الحاجة إلى إشراف مستمر. من خلال أتمتة عملية التعلم، يقلل دولاب البيانات العبء على المطورين ويمكّن وكلاء الذكاء الاصطناعي من التكيف مع الظروف المتغيرة واحتياجات المستخدمين.
فوائد الاستقلالية:
- تقليل التكاليف: من خلال أتمتة عملية التعلم، يقلل دولاب البيانات من التكاليف المرتبطة بتطوير وصيانة نماذج الذكاء الاصطناعي.
- تسريع عملية التطوير: يتيح دولاب البيانات للمطورين إطلاق منتجاتهم وخدماتهم بشكل أسرع من خلال تقليل الوقت والجهد اللازمين لتدريب نماذج الذكاء الاصطناعي.
- تحسين الأداء: يمكّن دولاب البيانات وكلاء الذكاء الاصطناعي من تحقيق أداء أفضل من خلال التعلم المستمر من تفاعلاتهم مع البيئة.
التكامل والنشر
تم تصميم منصة NeMo بحيث يمكن دمجها ونشرها بسهولة عبر مختلف البنى التحتية للحوسبة، بما في ذلك البيئات المحلية والسحابية. تتيح هذه المرونة للمؤسسات الاستفادة من المنصة بالطريقة التي تناسب احتياجاتها ومواردها على أفضل وجه.
منصة برامج Nvidia AI Enterprise
يتم نشر منصة NeMo على منصة برامج Nvidia AI Enterprise، التي توفر مجموعة شاملة من الأدوات والموارد لتطوير ونشر تطبيقات الذكاء الاصطناعي. تعمل هذه المنصة على تبسيط عملية إدارة وتوسيع نطاق حلول الذكاء الاصطناعي، مما يُمكّن المؤسسات من التركيز على الابتكار وقيمة الأعمال.
ميزات منصة Nvidia AI Enterprise:
- دعم واسع النطاق للأجهزة: تدعم منصة Nvidia AI Enterprise مجموعة واسعة من أجهزة Nvidia، بما في ذلك وحدات معالجة الرسومات ووحدات المعالجة المركزية.
- أدوات تطوير شاملة: توفر منصة Nvidia AI Enterprise مجموعة شاملة من أدوات التطوير، بما في ذلك أدوات التدريب والاستدلال والنشر.
- دعم المؤسسات: توفر منصة Nvidia AI Enterprise دعمًا على مستوى المؤسسات، بما في ذلك التحديثات الأمنية وإصلاحات الأخطاء والدعم الفني.
التنفيذ على البنية التحتية للحوسبة المتسارعة
يمكن تنفيذ NeMo على أي بنية تحتية للحوسبة المتسارعة، مما يسمح للمؤسسات بالاستفادة من قوة وحدات معالجة الرسومات والأجهزة المتخصصة الأخرى لتحسين أداء وكلاء الذكاء الاصطناعي الخاص بهم. يضمن ذلك قدرة وكلاء الذكاء الاصطناعي على التعامل مع المهام المعقدة ومجموعات البيانات الكبيرة بسهولة.
فوائد استخدام البنية التحتية للحوسبة المتسارعة:
- أداء أسرع: توفر البنية التحتية للحوسبة المتسارعة أداء أسرع لتطبيقات الذكاء الاصطناعي، مما يسمح لوكلاء الذكاء الاصطناعي بالتعامل مع المهام المعقدة ومجموعات البيانات الكبيرة بسهولة.
- زيادة الكفاءة: تزيد البنية التحتية للحوسبة المتسارعة من كفاءة تطبيقات الذكاء الاصطناعي من خلال تقليل الوقت والموارد اللازمة لإكمال المهام.
- تقليل التكاليف: تقلل البنية التحتية للحوسبة المتسارعة من التكاليف المرتبطة بتطوير وتشغيل تطبيقات الذكاء الاصطناعي.
تطبيقات واقعية
تم تصميم منصة NeMo لدعم مجموعة واسعة من التطبيقات عبر مختلف الصناعات. قد تقوم المؤسسات الكبيرة ببناء مئات من وكلاء الذكاء الاصطناعي بوظائف مختلفة، مثل الكشف الآلي عن الاحتيال، ومساعدي التسوق، والصيانة التنبؤية للآلات، ومراجعة المستندات.
تنفيذ AT&T
دخلت AT&T في شراكة مع Arize و Quantiphi للاستفادة من NeMo في تطوير وكيل ذكاء اصطناعي متقدم قادر على معالجة ما يقرب من 10000 مستند معرفة مؤسسية يتم تحديثها أسبوعيًا. من خلال الجمع بين مُخصص NeMo ومُقيّم NeMo، قامت AT&T بضبط Mistral 7B لتحقيق خدمة عملاء مخصصة ومنع الاحتيال وتحسين أداء الشبكة. أدى هذا التنفيذ إلى زيادة بنسبة 40٪ في دقة استجابة الذكاء الاصطناعي بشكل عام.
تفاصيل حول شراكة AT&T مع Arize و Quantiphi:
- Arize: توفر Arize منصة لمراقبة وتقييم أداء نماذج الذكاء الاصطناعي.
- Quantiphi: توفر Quantiphi خدمات استشارية وتنفيذية للذكاء الاصطناعي.
فوائد استخدام NeMo في AT&T:
- تحسين خدمة العملاء: يمكن لوكيل الذكاء الاصطناعي الإجابة على أسئلة العملاء بسرعة ودقة، مما يحسن تجربة العملاء.
- منع الاحتيال: يمكن لوكيل الذكاء الاصطناعي اكتشاف الأنشطة الاحتيالية المحتملة ومنعها، مما يحمي AT&T وعملائها.
- تحسين أداء الشبكة: يمكن لوكيل الذكاء الاصطناعي تحليل بيانات الشبكة وتحديد مجالات التحسين، مما يحسن أداء الشبكة.
دعم وتكامل النموذج مفتوح المصدر
تدعم خدمات NeMo المصغرة مجموعة متنوعة من النماذج مفتوحة المصدر الشائعة، بما في ذلك Llama و Microsoft Phi و Google Gemma و Mistral و Llama Nemotron Ultra. يتيح ذلك للمطورين الاستفادة من أفضل نماذج الذكاء الاصطناعي المتاحة وتخصيصها لتلبية احتياجاتهم الخاصة.
تكامل Meta
قامت Meta بدمج NeMo عن طريق إضافة موصلات إلى Llamastack. يتيح هذا التكامل للمطورين دمج إمكانيات NeMo بسلاسة في سير عمل الذكاء الاصطناعي الحالي لديهم.
تكامل موفر برامج الذكاء الاصطناعي
قامت شركات توفير برامج الذكاء الاصطناعي مثل Cloudera و Datadog و Dataiku و DataRobot و DataStax و SuperAnnotate و Weights & Biases بدمج NeMo في منصاتهم. هذا التكامل الواسع النطاق يجعل Ne