التحدي الحقيقي: بناء تطبيقات الذكاء الاصطناعي المؤسسية

التحدي الحقيقي: بناء تطبيقات الذكاء الاصطناعي المؤسسية

بينما تُصب موارد لا حصر لها في تدريب نماذج اللغة الكبيرة (LLMs) كل عام، لا تزال هناك عقبة كبيرة: دمج هذه النماذج بشكل فعال في تطبيقات عملية ومفيدة.

وهم الضبط الدقيق

يعتبر الضبط الدقيق وتوليد الاسترجاع المعزز (RAG) بشكل عام طريقتين راسختين لتعزيز معرفة وقدرات نماذج الذكاء الاصطناعي المدربة مسبقًا. ومع ذلك، يشير الرئيس التنفيذي لشركة Aleph Alpha، جوناس أندروليس، إلى أن الواقع أكثر تعقيدًا.

“قبل عام، كان هناك اعتقاد واسع النطاق بأن الضبط الدقيق كان حلاً سحريًا. إذا لم يعمل نظام الذكاء الاصطناعي كما هو مطلوب، فإن الإجابة كانت ببساطة الضبط الدقيق. الأمر ليس بهذه البساطة”، أوضح.

في حين أن الضبط الدقيق يمكن أن يعدل أسلوب النموذج أو سلوكه، إلا أنه ليس النهج الأكثر فعالية لتعليم معلومات جديدة. إن توقع أن الضبط الدقيق وحده يمكن أن يحل جميع مشكلات تطبيق الذكاء الاصطناعي هو مفهوم خاطئ.

RAG: نهج بديل

يقدم RAG بديلاً من خلال العمل كأمين مكتبة يسترجع المعلومات من أرشيف خارجي. يسمح هذا النهج بتحديثات وتغييرات للمعلومات داخل قاعدة البيانات دون إعادة تدريب النموذج أو ضبطه بدقة. بالإضافة إلى ذلك، يمكن الاستشهاد بالنتائج التي تم إنشاؤها ومراجعتها للتأكد من دقتها.

“يجب دائمًا توثيق المعرفة المحددة وعدم تخزينها داخل معلمات LLM”، أكد أندروليس.

في حين أن RAG يوفر العديد من الفوائد، إلا أن نجاحه يتوقف على التوثيق المناسب للعمليات والإجراءات والمعرفة المؤسسية الرئيسية بتنسيق يمكن للنموذج فهمه. لسوء الحظ، هذا ليس هو الحال في كثير من الأحيان.

حتى عندما يكون التوثيق موجودًا، قد تواجه المؤسسات مشكلات إذا كانت المستندات أو العمليات تعتمد على بيانات خارج التوزيع - بيانات تختلف اختلافًا كبيرًا عن البيانات المستخدمة لتدريب النموذج الأساسي. على سبيل المثال، سيواجه النموذج المدرب فقط على مجموعات البيانات الإنجليزية صعوبة في التعامل مع الوثائق الألمانية، خاصةً إذا كانت تحتوي على صيغ علمية. في كثير من الحالات، قد يكون النموذج غير قادر على تفسير البيانات على الإطلاق.

لذلك، يقترح أندروليس أن الجمع بين الضبط الدقيق و RAG ضروري عادةً لتحقيق نتائج ذات مغزى. يستفيد هذا النهج الهجين من نقاط القوة في كلتا الطريقتين للتغلب على القيود الفردية.

سد الفجوة

تهدف Aleph Alpha إلى تمييز نفسها باعتبارها DeepMind أوروبية من خلال معالجة التحديات التي تمنع المؤسسات والدول من تطوير الذكاء الاصطناعي السيادي الخاص بها.

يشير الذكاء الاصطناعي السيادي إلى النماذج المدربة أو المضبوطة بدقة باستخدام مجموعات البيانات الداخلية للأمة على أجهزة مبنية أو منتشرة داخل حدودها. يضمن هذا النهج خصوصية البيانات وأمانها والتحكم فيها، وهي أمور بالغة الأهمية للعديد من المنظمات والحكومات.

“نسعى جاهدين لنكون نظام التشغيل، الأساس للمؤسسات والحكومات لبناء استراتيجية الذكاء الاصطناعي السيادية الخاصة بها”، صرح أندروليس. “نهدف إلى الابتكار حيثما كان ذلك ضروريًا، مع الاستفادة أيضًا من المصادر المفتوحة وأحدث التقنيات حيثما أمكن ذلك.”

في حين أن هذا يتضمن أحيانًا تدريب النماذج، مثل Pharia-1-LLM من Aleph، يؤكد أندروليس أنهم لا يحاولون تكرار النماذج الحالية مثل Llama أو DeepSeek. ينصب تركيزهم على إنشاء حلول فريدة تعالج تحديات محددة.

“أوجه دائمًا أبحاثنا للتركيز على أشياء مختلفة ذات مغزى، وليس مجرد نسخ ما يفعله الجميع، لأن هذا موجود بالفعل”، قال أندروليس. “لسنا بحاجة إلى بناء Llama أو DeepSeek آخر لأنهما موجودان بالفعل.”

بدلاً من ذلك، تركز Aleph Alpha على بناء أطر عمل تعمل على تبسيط وتسريع اعتماد هذه التقنيات. مثال حديث على ذلك هو بنية التدريب الجديدة الخالية من الرموز المميزة، أو “T-Free”، والتي تهدف إلى ضبط النماذج بدقة والتي يمكنها فهم البيانات خارج التوزيع بشكل أكثر كفاءة.

غالبًا ما تتطلب الأساليب التقليدية القائمة على الرموز المميزة كميات كبيرة من البيانات خارج التوزيع لضبط النموذج بدقة بشكل فعال. هذا مكلف من الناحية الحسابية ويفترض أن البيانات الكافية متاحة.

تتجاوز بنية T-Free من Aleph Alpha هذه المشكلة عن طريق إزالة الرمز المميز. أظهرت الاختبارات المبكرة على Pharia LLM الخاص بهم باللغة الفنلندية انخفاضًا بنسبة 70 بالمائة في تكلفة التدريب والبصمة الكربونية مقارنةً بالأساليب القائمة على الرموز المميزة. هذا النهج المبتكر يجعل الضبط الدقيق أكثر سهولة واستدامة.

طورت Aleph Alpha أيضًا أدوات لمعالجة الثغرات في المعرفة الموثقة التي يمكن أن تؤدي إلى استنتاجات غير دقيقة أو غير مفيدة.

على سبيل المثال، إذا كان عقدان ذوا صلة بمسألة امتثال يتعارضان مع بعضهما البعض، “يمكن للنظام أن يقترب من الإنسان ويقول،” لقد وجدت تناقضًا … هل يمكنك تقديم ملاحظات حول ما إذا كان هذا صراعًا فعليًا؟ “” أوضح أندروليس.

يمكن إعادة المعلومات التي تم جمعها من خلال هذا الإطار، المسمى Pharia Catch، إلى قاعدة معارف التطبيق أو استخدامها لضبط النماذج الأكثر فعالية بدقة. تعمل حلقة الملاحظات هذه على تحسين دقة وموثوقية نظام الذكاء الاصطناعي بمرور الوقت.

وفقًا لأندروليس، جذبت هذه الأدوات شركاء مثل PwC و Deloitte و Capgemini و Supra، الذين يعملون مع العملاء النهائيين لتنفيذ تقنية Aleph Alpha. توضح هذه الشراكات قيمة وعملية حلول Aleph Alpha في التطبيقات الواقعية.

عامل الأجهزة

البرامج والبيانات ليست التحديات الوحيدة التي تواجه متبني الذكاء الاصطناعي السيادي. الأجهزة هي اعتبار حاسم آخر.

قد يكون لدى المؤسسات والدول المختلفة متطلبات محددة للتشغيل على أجهزة مطورة محليًا أو قد تملي ببساطة مكان تشغيل أحمال العمل. يمكن أن تؤثر هذه القيود بشكل كبير على اختيار الأجهزة والبنية التحتية.

هذا يعني أنه يجب على أندروليس وفريقه دعم مجموعة واسعة من خيارات الأجهزة. جذبت Aleph Alpha مجموعة انتقائية من شركاء الأجهزة، بما في ذلك AMD و Graphcore و Cerebras.

في الشهر الماضي، أعلنت Aleph Alpha عن شراكة مع AMD لاستخدام مسرعات سلسلة MI300 الخاصة بها. سيتعاون هذا التعاون مع أجهزة AMD المتقدمة لتسريع تدريب الذكاء الاصطناعي والاستدلال.

كما سلط أندروليس الضوء على التعاون مع Graphcore، التي استحوذت عليها Softbank، و Cerebras، التي تُستخدم مسرعات CS-3 ذات مقياس الرقاقة لتدريب نماذج الذكاء الاصطناعي للقوات المسلحة الألمانية. توضح هذه الشراكات التزام Aleph Alpha بالعمل مع مجموعة متنوعة من مزودي الأجهزة لتلبية الاحتياجات المحددة لعملائها.

على الرغم من هذه التعاونات، يصر أندروليس على أن هدف Aleph Alpha ليس أن تصبح خدمة مُدارة أو مزود خدمة سحابية. “لن نصبح أبدًا مزود خدمة سحابية”، صرح. “أريد أن يكون عملائي أحرارًا وبدون أن يكونوا محبوسين.” هذا الالتزام بحرية العملاء ومرونتهم يميز Aleph Alpha عن العديد من شركات الذكاء الاصطناعي الأخرى.

الطريق إلى الأمام: زيادة التعقيد

بالنظر إلى المستقبل، يتوقع أندروليس أن بناء تطبيقات الذكاء الاصطناعي سيصبح أكثر تعقيدًا مع تحول الصناعة من روبوتات الدردشة إلى أنظمة الذكاء الاصطناعي الوكيلة القادرة على حل المشكلات بشكل أكثر تطوراً.

اكتسب الذكاء الاصطناعي الوكيلي اهتمامًا كبيرًا على مدار العام الماضي، حيث وعد منشئو النماذج ومطورو البرامج وبائعي الأجهزة بأنظمة يمكنها إكمال العمليات متعددة الخطوات بشكل غير متزامن. تشمل الأمثلة المبكرة Operator من OpenAI وواجهة برمجة تطبيقات استخدام الكمبيوتر من Anthropic. تمثل أنظمة الذكاء الاصطناعي الوكيلة هذه تقدمًا كبيرًا في قدرات الذكاء الاصطناعي.

“في العام الماضي، ركزنا بشكل أساسي على المهام المباشرة مثل تلخيص المستندات أو المساعدة في الكتابة”، قال. “الآن، أصبح الأمر أكثر إثارة مع الأشياء التي، للوهلة الأولى، لا تبدو حتى أنها مشاكل genAI، حيث لا تكون تجربة المستخدم عبارة عن روبوت محادثة.” يمثل هذا التحول نحو تطبيقات الذكاء الاصطناعي الأكثر تعقيدًا وتكاملاً تحديات وفرصًا جديدة للصناعة.

التحديات الرئيسية في بناء تطبيقات الذكاء الاصطناعي المؤسسية:

  • سد الفجوة بين تدريب النموذج وتكامل التطبيق: يظل ترجمة قدرات LLMs بشكل فعال إلى تطبيقات عملية عقبة كبيرة.
  • التغلب على قيود الضبط الدقيق: غالبًا ما يكون الضبط الدقيق وحده غير كافٍ لتعليم نماذج الذكاء الاصطناعي معلومات جديدة أو تكييفها مع مهام محددة.
  • ضمان جودة البيانات وإمكانية الوصول إليها: يعتمد RAG على بيانات موثقة جيدًا ويمكن الوصول إليها بسهولة، وهو ما غالبًا ما يكون مفقودًا في العديد من المؤسسات.
  • التعامل مع البيانات خارج التوزيع: يجب أن تكون نماذج الذكاء الاصطناعي قادرة على التعامل مع البيانات التي تختلف عن البيانات التي تم تدريبها عليها، الأمر الذي يتطلب تقنيات متخصصة.
  • معالجة قيود الأجهزة: لدى المؤسسات والدول المختلفة متطلبات أجهزة مختلفة يجب أخذها في الاعتبار.
  • الحفاظ على خصوصية البيانات وأمانها: يتطلب الذكاء الاصطناعي السيادي ضمان معالجة البيانات وتخزينها بشكل آمن داخل حدود الدولة.
  • تطوير أنظمة الذكاء الاصطناعي الوكيلة: يعد بناء تطبيقات الذكاء الاصطناعي التي يمكنها أداء عمليات معقدة متعددة الخطوات بشكل غير متزامن مجالًا صعبًا ولكنه واعد للبحث.

الفرص الرئيسية في بناء تطبيقات الذكاء الاصطناعي المؤسسية:

  • تطوير حلول ذكاء اصطناعي مبتكرة: تخلق التحديات في بناء تطبيقات الذكاء الاصطناعي المؤسسية فرصًا لتطوير حلول مبتكرة تعالج احتياجات محددة.
  • الاستفادة من تقنيات المصادر المفتوحة: يمكن أن تساعد تقنيات المصادر المفتوحة في تقليل التكاليف وتسريع تطوير تطبيقات الذكاء الاصطناعي.
  • التعاون مع شركاء الأجهزة: يمكن أن يساعد التعاون مع شركاء الأجهزة في ضمان تحسين تطبيقات الذكاء الاصطناعي لمنصات أجهزة معينة.
  • بناء قدرات الذكاء الاصطناعي السيادية: يمكن أن يوفر الذكاء الاصطناعي السيادي للدول والمؤسسات تحكمًا أكبر في بياناتها والبنية التحتية للذكاء الاصطناعي.
  • تحويل الصناعات بالذكاء الاصطناعي: يتمتع الذكاء الاصطناعي بالقدرة على تحويل الصناعات عن طريق أتمتة المهام وتحسين اتخاذ القرارات وإنشاء منتجات وخدمات جديدة.

مستقبل تطبيقات الذكاء الاصطناعي المؤسسية:

من المرجح أن يتميز مستقبل تطبيقات الذكاء الاصطناعي المؤسسية بما يلي:

  • زيادة التعقيد: ستصبح تطبيقات الذكاء الاصطناعي أكثر تعقيدًا وتكاملاً، مما يتطلب خبرة وأدوات متخصصة.
  • تركيز أكبر على جودة البيانات: ستصبح جودة البيانات ذات أهمية متزايدة حيث تعتمد تطبيقات الذكاء الاصطناعي على بيانات دقيقة وموثوقة.
  • مزيد من التركيز على الأمن والخصوصية: سيكون الأمن والخصوصية أمرًا بالغ الأهمية حيث تتعامل تطبيقات الذكاء الاصطناعي مع البيانات الحساسة.
  • اعتماد أوسع للذكاء الاصطناعي الوكيلي: ستصبح أنظمة الذكاء الاصطناعي الوكيلة أكثر انتشارًا حيث تسعى المؤسسات إلى أتمتة المهام المعقدة.
  • الابتكار المستمر: سيستمر مجال الذكاء الاصطناعي في التطور بسرعة، مما يؤدي إلى اختراقات وفرص جديدة.

من خلال معالجة التحديات واحتضان الفرص، يمكن للمؤسسات تسخير قوة الذكاء الاصطناعي لتحويل أعمالها وخلق مستقبل أفضل.