الطفرة الحاسوبية وراء نماذج الاستدلال
أعلنت OpenAI علنًا أن o3 تم تدريبه باستخدام عشرة أضعاف الموارد الحاسوبية المخصصة للاستدلال مقارنة بـ o1 - وهي زيادة كبيرة تحققت في أربعة أشهر فقط. يوضح مخطط من إنتاج OpenAI بوضوح العلاقة الوثيقة بين القدرة الحاسوبية والأداء على معيار AIME الرياضي. تفترض Epoch AI أن هذه الأرقام تتعلق تحديدًا بالمرحلة الثانية من التدريب، أي التدريب على الاستدلال، وليس عملية تدريب النموذج الكاملة.
لوضع هذه الأرقام في نصابها الصحيح، فحصت Epoch AI نماذج مماثلة. على سبيل المثال، ورد أن DeepSeek-R1، الذي تم تدريبه بحوالي 6e23 FLOP (عمليات الفاصلة العائمة في الثانية) بتكلفة تقدر بمليون دولار، حقق نتائج قياسية مماثلة لـ o1.
كما ساهم عمالقة التكنولوجيا Nvidia و Microsoft في تطوير نماذج الاستدلال، وتوفير بيانات تدريب متاحة للجمهور. استخدمت Llama-Nemotron Ultra 253B من Nvidia ما يقرب من 140000 ساعة GPU H100، أي ما يعادل حوالي 1e23 FLOP، لمرحلة التدريب على الاستدلال. استخدم Phi-4-reasoning من Microsoft قدرة حاسوبية أقل، أقل من 1e20 FLOP. أحد العوامل الحاسمة التي تميز هذه النماذج هو اعتمادها الشديد على بيانات التدريب الاصطناعية التي تم إنشاؤها بواسطة أنظمة الذكاء الاصطناعي الأخرى. تؤكد Epoch AI أن هذا الاعتماد يجعل المقارنات المباشرة مع نماذج مثل o3 أكثر صعوبة بسبب الاختلافات المتأصلة بين البيانات الحقيقية والاصطناعية وتأثيرها على تعلم النموذج والتعميم.
تحديد "التدريب على الاستدلال": منطقة غامضة
هناك طبقة أخرى من التعقيد تنبع من عدم وجود تعريف مقبول عالميًا لـ "التدريب على الاستدلال". بالإضافة إلى التعلم المعزز، تشتمل بعض النماذج على تقنيات مثل الضبط الدقيق الخاضع للإشراف. الغموض المحيط بالمكونات المضمنة في تقديرات الحوسبة يقدم تناقضات، مما يجعل من الصعب مقارنة الموارد بدقة عبر النماذج المختلفة.
حتى الآن، تستهلك نماذج الاستدلال طاقة حاسوبية أقل بكثير من عمليات تدريب الذكاء الاصطناعي الأكثر شمولاً، مثل Grok 3، الذي يتجاوز 1e26 FLOP. تعمل مراحل التدريب على الاستدلال المعاصرة عادةً بين 1e23 و 1e24 FLOP، مما يترك مجالًا كبيرًا للتوسع المحتمل - أو هكذا يبدو للوهلة الأولى.
يشترك داريو أمودي، الرئيس التنفيذي لشركة Anthropic، في منظور مماثل. يفترض أن استثمار مليون دولار في التدريب على الاستدلال يمكن أن يحقق تقدمًا كبيرًا. ومع ذلك، تستكشف الشركات بنشاط طرقًا لزيادة ميزانية مرحلة التدريب الثانوية هذه إلى مئات الملايين من الدولارات وما بعدها، مما يشير إلى مستقبل تتحول فيه اقتصاديات التدريب بشكل كبير.
إذا استمر الاتجاه الحالي المتمثل في زيادات تقريبًا عشرة أضعاف في القدرة الحاسوبية كل ثلاثة إلى خمسة أشهر، فقد يلحق التدريب على الاستدلال بالقدرة الحاسوبية للتدريب الكلي للنماذج الرائدة في وقت مبكر من العام المقبل. ومع ذلك، يتوقع جوش يو أن النمو سيتباطأ في النهاية إلى زيادة تبلغ حوالي 4 أضعاف سنويًا، بما يتماشى مع اتجاهات الصناعة الأوسع. من المرجح أن يكون هذا التباطؤ مدفوعًا بمجموعة من العوامل، بما في ذلك تناقص العائدات على الاستثمار في التدريب، وزيادة تكلفة موارد الحوسبة، وقيود بيانات التدريب المتاحة.
ما وراء الحوسبة: الاختناقات في الأفق
تؤكد Epoch AI أن القدرة الحاسوبية ليست العامل المحدد الوحيد. يتطلب التدريب على الاستدلال كميات كبيرة من المهام عالية الجودة والصعبة. الحصول على هذه البيانات أمر صعب؛ إنشاؤها بشكل مصطنع هو الأصعب. المشكلة في البيانات الاصطناعية ليست فقط الأصالة؛ يجادل الكثيرون بأن الجودة رديئة. بالإضافة إلى ذلك، تظل فعالية هذا النهج خارج المجالات المنظمة للغاية مثل الرياضيات وبرمجة الكمبيوتر غير مؤكدة. ومع ذلك، تشير مشاريع مثل "Deep Research" في ChatGPT، التي تستخدم نسخة مخصصة من o3، إلى إمكانية تطبيق أوسع.
تشكل المهام الشاقة من وراء الكواليس، مثل اختيار المهام المناسبة، وتصميم وظائف المكافأة، وتطوير استراتيجيات التدريب، تحديات أيضًا. هذه التكاليف التنموية، التي غالبًا ما يتم استبعادها من تقديرات الحوسبة، تساهم بشكل كبير في التكلفة الإجمالية للتدريب على الاستدلال.
على الرغم من هذه التحديات، يظل OpenAI والمطورون الآخرون متفائلين. كما تشير Epoch AI، فإن منحنيات القياس لـ التدريب على الاستدلال تشبه حاليًا التقدم الخطي اللوغاريتمي الكلاسيكي الذي لوحظ في التدريب المسبق. علاوة على ذلك، يوضح o3 مكاسب كبيرة ليس فقط في الرياضيات ولكن أيضًا في مهام البرامج القائمة على الوكلاء، مما يشير إلى الإمكانات المتنوعة لهذا النهج الجديد.
يتوقف مستقبل هذا التقدم على قابلية التوسع في التدريب على الاستدلال - تقنيًا واقتصاديًا ومن حيث المحتوى. تستكشف النقاط التالية عدة عوامل رئيسية ستحدد مستقبل هذه النماذج:
- القابلية للتوسع التقني: تشير إلى القدرة على زيادة الموارد الحاسوبية المستخدمة في التدريب دون مواجهة عقبات تقنية لا يمكن التغلب عليها. يتضمن ذلك التطورات في الأجهزة والبرامج والخوارزميات لاستخدام مجموعات البيانات الأكبر وبنية الحوسبة الأكثر قوة بكفاءة. مع نمو النماذج في الحجم والتعقيد، تصبح القابلية للتوسع التقني ذات أهمية متزايدة لتحقيق تقدم مستمر. ستحتاج البنية التحتية إلى التطور لمواكبة الحجم الهائل للنماذج.
- القابلية للتوسع الاقتصادي: تستلزم جدوى زيادة الموارد الحاسوبية في حدود قيود الميزانية المعقولة. إذا كانت تكلفة التدريب تتناسب خطيًا أو أسيًا مع حجم النموذج، فقد يصبح باهظ التكلفة بشكل مانع لمتابعة المزيد من المكاسب. على هذا النحو، قد يكون التدريب الأرخص والأكثر كفاءة ضروريًا. تعد الابتكارات في الأجهزة وتقنيات التحسين التي تقلل التكلفة لكل FLOP أمرًا بالغ الأهمية للقابلية للتوسع الاقتصادي. كان الاتجاه هو التركيز على نماذج أكبر من أي وقت مضى ولكن بميزانية محدودة، ستتحول الحوافز إلى تدريب النماذج الأكثر كفاءة.
- القابلية للتوسع في المحتوى: تسلط الضوء على توفر بيانات تدريب عالية الجودة يمكن أن تدفع بشكل فعال المكاسب في القدرة على الاستدلال. مع ازدياد تطور النماذج، هناك حاجة إلى مجموعات بيانات أكثر صعوبة وتنوعًا لتحديها ومنع الزائد في التجهيز. يتوفر عدد محدود من مجموعات البيانات هذه، خاصة في المجالات التي تتطلب استدلالًا معقدًا. يمكن أن تساعد تقنيات إنشاء البيانات الاصطناعية في تخفيف هذا الاختناق، ولكن يجب تصميمها بعناية لتجنب التحيزات أو عدم الدقة التي يمكن أن تقلل من أداء النموذج.
مستقبل الحوسبة
من السهل على الأشخاص العاديين أن يعتقدوا أننا على طريق الحوسبة اللانهائية. ومع ذلك، في الواقع، الأمر محدود، وفي المستقبل، قد يصبح هذا الحد أكثر وضوحًا. في هذا القسم، سوف نستكشف بعض الطرق التي قد تتطور بها الحوسبة في المستقبل وكيف ستؤثر هذه التغييرات على صناعة LLM.
الحوسبة الكمومية
تمثل الحوسبة الكمومية تحولًا نموذجيًا في الحوسبة، حيث تستفيد من مبادئ ميكانيكا الكم لحل المشكلات التي يصعب على أجهزة الكمبيوتر الكلاسيكية حلها. على الرغم من أنها لا تزال في مراحلها الأولى، إلا أن الحوسبة الكمومية تحمل إمكانات هائلة لتسريع أحمال عمل الذكاء الاصطناعي، بما في ذلك تدريب نماذج الاستدلال. يمكن لخوارزميات الكم مثل التلدين الكمي ومتغيرات حل المعادلات الكمومية (VQEs) تحسين معلمات النموذج بكفاءة أكبر من طرق التحسين الكلاسيكية، مما يقلل الموارد الحاسوبية المطلوبة للتدريب. على سبيل المثال، يمكن لخوارزميات التعلم الآلي الكمي تحسين تحسين الشبكات العصبية المعقدة، مما يؤدي إلى أوقات تدريب أسرع وأداء أفضل للنموذج.
ومع ذلك، لا تزال هناك تحديات كبيرة في توسيع نطاق أجهزة الكمبيوتر الكمومية وتطوير خوارزميات كمومية قوية. لا تزال التكنولوجيا تجريبية إلى حد كبير، ولا تتوفر حتى الآن أجهزة كمبيوتر كمومية عملية مع عدد كافٍ من الكيوبتات (البتات الكمومية) وأوقات الترابط بسهولة. علاوة على ذلك، يتطلب تطوير خوارزميات كمومية مصممة خصيصًا لمهام الذكاء الاصطناعي المحددة خبرة متخصصة وهو مجال بحث مستمر. لا يزال التبني على نطاق واسع للحوسبة الكمومية في الذكاء الاصطناعي على بعد عدة سنوات ومن المرجح أن يكون عمليًا بمجرد توفر أجهزة الكمبيوتر الكمومية.
الحوسبة العصبية الشكل
تحاكي الحوسبة العصبية الشكل بنية ووظيفة الدماغ البشري لإجراء الحسابات. على عكس أجهزة الكمبيوتر التقليدية التي تعتمد على المنطق الثنائي والمعالجة التسلسلية، تستخدم الرقائق العصبية الشكل الخلايا العصبية الاصطناعية والمشابك لمعالجة المعلومات بطريقة متوازية وفعالة من حيث الطاقة. هذه البنية مناسبة تمامًا لمهام الذكاء الاصطناعي التي تتضمن التعرف على الأنماط والتعلم والتكيف، مثل تدريب نماذج الاستدلال. يمكن للرقائق العصبية الشكل أن تقلل استهلاك الطاقة ووقت الاستجابة المرتبطين بتدريب نماذج الذكاء الاصطناعي الكبيرة، مما يجعلها أكثر جدوى من الناحية الاقتصادية ومستدامة بيئيًا.
تعد Loihi من Intel و TrueNorth من IBM أمثلة على الرقائق العصبية الشكل التي أظهرت نتائج واعدة في تطبيقات الذكاء الاصطناعي. هذه الرقائق قادرة على أداء مهام الذكاء الاصطناعي المعقدة باستهلاك أقل للطاقة بشكل ملحوظ مقارنة بوحدات المعالجة المركزية ووحدات معالجة الرسومات التقليدية. ومع ذلك، لا تزال الحوسبة العصبية الشكل مجالًا جديدًا نسبيًا، ولا تزال هناك تحديات في تطوير أدوات برمجة قوية وتحسين الخوارزميات للهندسة المعمارية العصبية الشكل. علاوة على ذلك، فإن التوفر المحدود للأجهزة العصبية الشكل وعدم وجود خبرة واسعة في الحوسبة العصبية الشكل قد أعاق اعتماد هذه التكنولوجيا في تطبيقات الذكاء الاصطناعي السائدة.
الحوسبة التناظرية
تستخدم الحوسبة التناظرية كميات فيزيائية مستمرة، مثل الجهد أو التيار، لتمثيل ومعالجة المعلومات، بدلاً من الإشارات الرقمية المنفصلة. يمكن لأجهزة الكمبيوتر التناظرية إجراء عمليات رياضية معينة، مثل المعادلات التفاضلية والجبر الخطي، بشكل أسرع وأكثر كفاءة من أجهزة الكمبيوتر الرقمية، خاصة في المهام التي قد تكون مفيدة للاستدلال. يمكن أن تكون الحوسبة التناظرية مفيدة لتدريب النماذج أو لتشغيل الاستدلال عند الحاجة.
ومع ذلك، تواجه الحوسبة التناظرية تحديات في الدقة وقابلية التوسع والبرمجة. الدوائر التناظرية عرضة للضوضاء والانحراف، مما قد يقلل من دقة العمليات الحسابية. يعد توسيع نطاق أجهزة الكمبيوتر التناظرية للتعامل مع نماذج الذكاء الاصطناعي الكبيرة والمعقدة أيضًا تحديًا تقنيًا. علاوة على ذلك، تتطلب برمجة أجهزة الكمبيوتر التناظرية عادةً خبرة متخصصة وهي أكثر صعوبة من برمجة أجهزة الكمبيوتر الرقمية. على الرغم من هذه التحديات، هناك اهتمام متزايد بالحوسبة التناظرية كبديل محتمل للحوسبة الرقمية لتطبيقات الذكاء الاصطناعي المحددة، خاصة تلك التي تتطلب سرعة عالية وكفاءة في استخدام الطاقة.
الحوسبة الموزعة
تتضمن الحوسبة الموزعة توزيع أحمال عمل الذكاء الاصطناعي عبر أجهزة أو أجهزة متعددة متصلة بشبكة. يسمح هذا النهج للمؤسسات بالاستفادة من القدرة الحاسوبية الجماعية لعدد كبير من الموارد لتسريع تدريب الذكاء الاصطناعي والاستدلال. تعد الحوسبة الموزعة ضرورية لتدريب نماذج اللغة الكبيرة (LLMs) ونماذج الذكاء الاصطناعي المعقدة الأخرى التي تتطلب مجموعات بيانات ضخمة وموارد حاسوبية.
توفر أطر العمل مثل TensorFlow و PyTorch و Apache Spark أدوات وواجهات برمجة تطبيقات لتوزيع أحمال عمل الذكاء الاصطناعي عبر مجموعات من الأجهزة. تسمح هذه الأطر للمؤسسات بتوسيع نطاق قدرات الذكاء الاصطناعي الخاصة بها عن طريق إضافة المزيد من الموارد الحاسوبية حسب الحاجة. ومع ذلك، تقدم الحوسبة الموزعة تحديات في إدارة البيانات، والنفقات العامة للاتصالات، والمزامنة. يعد توزيع البيانات بكفاءة عبر أجهزة متعددة وتقليل التأخير في الاتصالات أمرًا بالغ الأهمية لزيادة أداء أنظمة الذكاء الاصطناعي الموزعة. بالإضافة إلى ذلك، يعد التأكد من مزامنة وتنسيق الأجهزة أو الأجهزة المختلفة بشكل صحيح أمرًا ضروريًا لتحقيق نتائج دقيقة وموثوقة.
خاتمة
إن مسار نماذج الاستدلال متشابك بلا شك مع توفر وقابلية توسيع الموارد الحاسوبية. في حين أن الوتيرة الحالية للتقدم المدفوعة بزيادة الحوسبة مثيرة للإعجاب، إلا أن هناك عدة عوامل، بما في ذلك ندرة بيانات التدريب عالية الجودة، وزيادة تكلفة الحوسبة، وظهور نماذج حوسبة بديلة، تشير إلى أن عصر توسيع نطاق الحوسبة الجامح قد يقترب من حدوده. من المحتمل أن يعتمد مستقبل نماذج الاستدلال على قدرتنا على التغلب على هذه القيود واستكشاف مناهج جديدة لتعزيز قدرات الذكاء الاصطناعي. بكل هذه المعلومات، يمكننا أن نفترض أن الزيادة في قدرات نموذج الاستدلال قد تبدأ قريبًا في التباطؤ بسبب أحد القيود العديدة التي تمت مناقشتها.