شركات الذكاء الاصطناعي تلجأ إلى 'التقطير'

صعود التقطير: ميزة تنافسية

تتبنى الشركات الكبرى في مجال الذكاء الاصطناعي، مثل OpenAI و Microsoft و Meta، تقنية التقطير بنشاط لإنشاء نماذج ذكاء اصطناعي أقل تكلفة. اكتسبت هذه الطريقة زخمًا كبيرًا بعد أن استخدمتها الشركة الصينية DeepSeek لتطوير نماذج ذكاء اصطناعي أصغر حجمًا ولكنها قوية بشكل مثير للإعجاب. أثار ظهور مثل هذه النماذج الفعالة الدهشة في Silicon Valley، مع مخاوف بشأن قدرة المنطقة على الحفاظ على مكانتها القيادية في سباق الذكاء الاصطناعي. كان رد فعل الأسواق المالية سريعًا، حيث تم محو مليارات الدولارات من القيمة السوقية لشركات التكنولوجيا الأمريكية البارزة.

كيف يعمل التقطير: ديناميكية المعلم والطالب

يكمن سحر التقطير في نهج ‘المعلم والطالب’. يتم استخدام نموذج ذكاء اصطناعي كبير ومعقد، يُطلق عليه اسم ‘المعلم’، لإنشاء البيانات. تُستخدم هذه البيانات، بدورها، لتدريب نموذج ‘طالب’ أصغر. تسمح هذه العملية العبقرية للشركات بالاحتفاظ بجزء كبير من أداء أنظمة الذكاء الاصطناعي الأكثر تقدمًا مع تقليل التكاليف ومتطلبات الحوسبة بشكل كبير.

كما قال Olivier Godement، رئيس قسم المنتجات في منصة OpenAI، بشكل مناسب: ‘التقطير سحري تمامًا. فهو يتيح لنا أخذ نموذج كبير جدًا وذكي وإنشاء نسخة أصغر وأرخص وأسرع محسّنة لمهام محددة.’

عامل التكلفة: إضفاء الطابع الديمقراطي على الوصول إلى الذكاء الاصطناعي

يتطلب تدريب نماذج الذكاء الاصطناعي الضخمة، مثل GPT-4 من OpenAI، و Gemini من Google، و Llama من Meta، قوة حوسبة هائلة، وغالبًا ما يتكبد تكاليف تصل إلى مئات الملايين من الدولارات. ومع ذلك، يعمل التقطير كقوة ديمقراطية، حيث يوفر للشركات والمطورين إمكانية الوصول إلى قدرات الذكاء الاصطناعي بجزء بسيط من التكلفة. تفتح هذه القدرة على تحمل التكاليف إمكانيات لتشغيل نماذج الذكاء الاصطناعي بكفاءة على الأجهزة اليومية مثل الهواتف الذكية وأجهزة الكمبيوتر المحمولة.

Phi من Microsoft وجدل DeepSeek

كانت Microsoft، وهي داعم رئيسي لـ OpenAI، سريعة في الاستفادة من التقطير، مستفيدة من GPT-4 لإنشاء خط خاص بها من نماذج الذكاء الاصطناعي المدمجة، والمعروفة باسم Phi. ومع ذلك، تتصاعد الحبكة مع الاتهامات الموجهة ضد DeepSeek. تزعم OpenAI أن DeepSeek قامت بتقطير نماذجها الخاصة لتدريب نظام ذكاء اصطناعي منافس - وهو انتهاك واضح لشروط خدمة OpenAI. التزمت DeepSeek الصمت بشأن هذه المسألة.

مقايضات التقطير: الحجم مقابل القدرة

في حين أن التقطير ينتج نماذج ذكاء اصطناعي فعالة، إلا أنه لا يخلو من التنازلات. كما يشيرAhmed Awadallah من Microsoft Research: ‘إذا جعلت النماذج أصغر، فإنك تقلل حتماً من قدرتها.’ تتألق النماذج المقطرة في أداء مهام محددة، مثل تلخيص رسائل البريد الإلكتروني، لكنها تفتقر إلى الوظائف الواسعة والشاملة لنظيراتها الأكبر.

تفضيل الأعمال: جاذبية الكفاءة

على الرغم من القيود، تتجه العديد من الشركات نحو النماذج المقطرة. غالبًا ما تكون قدراتها كافية لمهام مثل روبوتات الدردشة لخدمة العملاء وتطبيقات الهاتف المحمول. يؤكد David Cox، نائب رئيس نماذج الذكاء الاصطناعي في IBM Research، على الجانب العملي، قائلاً: ‘في أي وقت يمكنك فيه تقليل التكاليف مع الحفاظ على الأداء، يكون ذلك منطقيًا.’

تحدي نموذج الأعمال: سيف ذو حدين

يشكل صعود التقطير تحديًا فريدًا لنماذج الأعمال الخاصة بشركات الذكاء الاصطناعي الكبرى. هذه النماذج الأصغر حجمًا أقل تكلفة في التطوير والتشغيل، مما يترجم إلى تدفقات إيرادات أقل لشركات مثل OpenAI. في حين أن OpenAI تفرض رسومًا أقل على النماذج المقطرة، مما يعكس متطلباتها الحسابية المنخفضة، تؤكد الشركة أن نماذج الذكاء الاصطناعي الكبيرة ستظل ضرورية للتطبيقات عالية المخاطر حيث تكون الدقة والموثوقية أمرًا بالغ الأهمية.

تدابير OpenAI الوقائية: حراسة جواهر التاج

تتخذ OpenAI بنشاط خطوات لمنع تقطير نماذجها الكبيرة من قبل المنافسين. تراقب الشركة بدقة أنماط الاستخدام ولديها سلطة إلغاء الوصول إذا اشتبهت في أن المستخدم يستخرج كميات كبيرة من البيانات لأغراض التقطير. وبحسب ما ورد تم اتخاذ هذا الإجراء الوقائي ضد الحسابات المرتبطة بـ DeepSeek.

الجدل حول المصدر المفتوح: التقطير كعامل تمكين

أثار التقطير أيضًا مناقشات حول تطوير الذكاء الاصطناعي مفتوح المصدر. بينما تسعى OpenAI وشركات أخرى جاهدة لحماية نماذجها الخاصة، تبنى Yann LeCun، كبير علماء الذكاء الاصطناعي في Meta، التقطير كجزء لا يتجزأ من فلسفة المصدر المفتوح. يدافع LeCun عن الطبيعة التعاونية للمصدر المفتوح، قائلاً: ‘هذه هي الفكرة الكاملة للمصدر المفتوح - أنت تستفيد من تقدم الآخرين.’

استدامة ميزة المحرك الأول: مشهد متغير

تثير التطورات السريعة التي يسهلها التقطير تساؤلات حول استدامة مزايا المحرك الأول على المدى الطويل في مجال الذكاء الاصطناعي. على الرغم من ضخ المليارات في تطوير نماذج متطورة، تجد شركات الذكاء الاصطناعي الرائدة نفسها الآن في مواجهة منافسين يمكنهم تكرار اختراقاتهم في غضون أشهر. كما يلاحظ Cox من IBM بشكل مناسب: ‘في عالم يتحرك فيه كل شيء بسرعة كبيرة، يمكنك إنفاق الكثير من المال للقيام بذلك بالطريقة الصعبة، فقط لكي يلحق بك المجال من خلفك مباشرة.’

التعمق أكثر في الجوانب التقنية للتقطير

لتقدير تأثير التقطير حقًا، يجدر استكشاف الجوانب التقنية الأساسية بمزيد من التفصيل.

نقل المعرفة: المبدأ الأساسي

في جوهره، التقطير هو شكل من أشكال نقل المعرفة. يمتلك نموذج ‘المعلم’ الأكبر، بعد أن تم تدريبه على مجموعات بيانات ضخمة، ثروة من المعرفة والفهم. الهدف من التقطير هو نقل هذه المعرفة إلى نموذج ‘الطالب’ الأصغر في شكل مضغوط.

الأهداف اللينة: ما وراء التسميات الصلبة

يعتمد التعلم الآلي التقليدي على ‘التسميات الصلبة’ - تصنيفات نهائية مثل ‘قطة’ أو ‘كلب’. ومع ذلك، غالبًا ما يستخدم التقطير ‘أهدافًا لينة’. هذه هي توزيعات الاحتمالات التي تم إنشاؤها بواسطة نموذج المعلم، مما يوفر تمثيلًا أكثر ثراءً للمعرفة. على سبيل المثال، بدلاً من مجرد تصنيف صورة على أنها ‘قطة’، قد يعين نموذج المعلم احتمالات مثل 90٪ قطة، و 5٪ كلب، و 5٪ أخرى. تساعد هذه المعلومات الدقيقة نموذج الطالب على التعلم بشكل أكثر فعالية.

معامل درجة الحرارة: ضبط النعومة

المعلمة الرئيسية في التقطير هي ‘درجة الحرارة’. تتحكم هذه القيمة في ‘نعومة’ توزيعات الاحتمالات التي تم إنشاؤها بواسطة نموذج المعلم. تنتج درجة الحرارة الأعلى توزيعًا أكثر ليونة، مع التأكيد على العلاقات بين الفئات المختلفة. يمكن أن يكون هذا مفيدًا بشكل خاص عندما يكون نموذج الطالب أصغر بكثير من نموذج المعلم.

طرق مختلفة للتقطير

هناك طرق مختلفة للتقطير، ولكل منها فروقها الدقيقة:

  • التقطير القائم على الاستجابة: هذا هو النهج الأكثر شيوعًا، حيث يتم تدريب نموذج الطالب على محاكاة احتمالات الإخراج (الأهداف اللينة) لنموذج المعلم.
  • التقطير القائم على الميزات: هنا، يتم تدريب نموذج الطالب لمطابقة تمثيلات الميزات الوسيطة لنموذج المعلم. يمكن أن يكون هذا مفيدًا عندما يكون لنموذج المعلم بنية معقدة.
  • التقطير القائم على العلاقة: يركز هذا النهج على نقل العلاقات بين عينات البيانات المختلفة، كما تم التقاطها بواسطة نموذج المعلم.

مستقبل التقطير: التطور المستمر

التقطير ليس تقنية ثابتة؛ إنه يتطور باستمرار. يبحث الباحثون بنشاط عن طرق جديدة لتحسين كفاءة وفعالية نقل المعرفة. تشمل بعض مجالات البحث النشط ما يلي:

  • التقطير متعدد المعلمين: استخدام نماذج معلمين متعددة لتدريب نموذج طالب واحد، مما قد يؤدي إلى التقاط نطاق أوسع من المعرفة.
  • التقطير عبر الإنترنت: تدريب نماذج المعلم والطالب في وقت واحد، مما يسمح بعملية تعلم أكثر ديناميكية وتكيفًا.
  • التقطير الذاتي: استخدام نموذج واحد لتقطير المعرفة من نفسه، مما قد يؤدي إلى تحسين الأداء دون الحاجة إلى نموذج معلم منفصل.

الآثار الأوسع للتقطير

يمتد تأثير التقطير إلى ما هو أبعد من مجال تطوير نماذج الذكاء الاصطناعي. له آثار على:

  • الحوسبة الطرفية: يتيح التقطير نشر نماذج ذكاء اصطناعي قوية على الأجهزة محدودة الموارد، مما يمهد الطريق لتطبيقات حوسبة طرفية أكثر ذكاءً.
  • التعلم الموحد: يمكن استخدام التقطير لتحسين كفاءة التعلم الموحد، حيث يتم تدريب النماذج على بيانات لامركزية دون مشاركة البيانات الأولية نفسها.
  • قابلية تفسير الذكاء الاصطناعي: يمكن أن تكون النماذج المقطرة، كونها أصغر وأبسط، أسهل في التفسير والفهم، مما قد يساعد في السعي للحصول على ذكاء اصطناعي أكثر قابلية للتفسير.

في جوهره، التقطير ليس مجرد خدعة تقنية؛ إنه تحول نموذجي يعيد تشكيل مشهد الذكاء الاصطناعي، مما يجعله أكثر سهولة وكفاءة وقابلية للتكيف. إنه دليل على براعة باحثي الذكاء الاصطناعي ونذير بمستقبل يتم فيه توزيع قوة الذكاء الاصطناعي بشكل أكثر ديمقراطية.