وتيرة الابتكار المتواصلة في مجال الذكاء الاصطناعي تضمن أن الرضا عن النفس ليس خيارًا أبدًا. فبينما تبدو المنهجيات الراسخة وكأنها قد ترسخت، تظهر تطورات جديدة لتحدي الوضع الراهن. وصل مثال رئيسي على ذلك في أوائل عام 2025، عندما أصدر DeepSeek، وهو مختبر ذكاء اصطناعي صيني أقل شهرة، نموذجًا لم يلفت الأنظار فحسب، بل أرسل هزات ملموسة عبر الأسواق المالية. تبع الإعلان بسرعة انخفاض مذهل بنسبة 17% في سعر سهم Nvidia، مما أدى إلى تراجع أسهم الشركات الأخرى المرتبطة بالنظام البيئي المتنامي لمراكز بيانات الذكاء الاصطناعي. سرعان ما عزا معلقو السوق رد الفعل الحاد هذا إلى البراعة التي أظهرتها DeepSeek في إنشاء نماذج ذكاء اصطناعي عالية الجودة دون الميزانيات الضخمة المرتبطة عادةً بمختبرات الأبحاث الأمريكية الرائدة. أثار هذا الحدث على الفور نقاشًا حادًا بشأن البنية التحتية المستقبلية واقتصاديات الذكاء الاصطناعي.
لفهم الاضطراب المحتمل الذي يبشر به وصول DeepSeek بشكل كامل، من الضروري وضعه في سياق أوسع: القيود المتطورة التي تواجه مسار تطوير الذكاء الاصطناعي. أحد العوامل المهمة التي تؤثر على مسار الصناعة هو الندرة المتزايدة لبيانات التدريب الجديدة عالية الجودة. لقد استوعبت الجهات الفاعلة الرئيسية في مجال الذكاء الاصطناعي، حتى الآن، مساحات شاسعة من بيانات الإنترنت المتاحة للجمهور لتدريب نماذجها التأسيسية. وبالتالي، بدأ ينبوع المعلومات التي يسهل الوصول إليها في الجفاف، مما يجعل تحقيق قفزات كبيرة أخرى في أداء النموذج من خلال طرق التدريب المسبق التقليدية أمرًا صعبًا ومكلفًا بشكل متزايد. تجبر هذه العقبة الناشئة على محور استراتيجي. يستكشف مطورو النماذج بشكل متزايد إمكانات “الحوسبة في وقت الاختبار” (TTC). يؤكد هذا النهج على تعزيز قدرات التفكير المنطقي للنموذج أثناء مرحلة الاستدلال - مما يسمح للنموذج بشكل أساسي بتخصيص المزيد من الجهد الحسابي “للتفكير” وتحسين استجابته عند تقديم استعلام، بدلاً من الاعتماد فقط على معرفته المدربة مسبقًا. هناك اعتقاد متزايد داخل مجتمع البحث بأن TTC يمكن أن يفتح نموذجًا جديدًا للتوسع، ومن المحتمل أن يعكس مكاسب الأداء الهائلة التي تم تحقيقها سابقًا من خلال توسيع نطاق بيانات ومعلمات التدريب المسبق. قد يمثل هذا التركيز على المعالجة في وقت الاستدلال الحدود التالية للتقدم التحويلي في الذكاء الاصطناعي.
تشير هذه الأحداث الأخيرة إلى تحولين أساسيين يجريان في مشهد الذكاء الاصطناعي. أولاً، أصبح من الواضح أن المنظمات التي تعمل بموارد مالية أصغر نسبيًا، أو على الأقل أقل إعلانًا عنها، يمكنها الآن تطوير ونشر نماذج تنافس أحدث ما توصلت إليه التكنولوجيا. يبدو أن الملعب، الذي سيطر عليه تقليديًا عدد قليل من الشركات العملاقة ذات التمويل الضخم، يتجه نحو التكافؤ. ثانيًا، يتحول التركيز الاستراتيجي بشكل حاسم نحو تحسين الحوسبة عند نقطة الاستدلال (TTC) باعتبارها المحرك الأساسي لتقدم الذكاء الاصطناعي في المستقبل. دعونا نتعمق أكثر في هذين الاتجاهين المحوريين ونستكشف تداعياتهما المحتملة على المنافسة وديناميكيات السوق والقطاعات المختلفة داخل النظام البيئي الأوسع للذكاء الاصطناعي.
إعادة تشكيل مشهد الأجهزة
يحمل إعادة التوجيه الاستراتيجي نحو الحوسبة في وقت الاختبار (TTC) آثارًا عميقة على الأجهزة التي تدعم ثورة الذكاء الاصطناعي، مما قد يعيد تشكيل متطلبات وحدات معالجة الرسومات (GPUs) والسيليكون المتخصص والبنية التحتية للحوسبة بشكل عام. نعتقد أن هذا التحول يمكن أن يتجلى بعدة طرق رئيسية:
الانتقال من مراكز التدريب المخصصة إلى قوة الاستدلال الديناميكية: قد يتحول تركيز الصناعة تدريجيًا بعيدًا عن بناء مجموعات GPU متجانسة أكبر من أي وقت مضى ومخصصة حصريًا لمهمة التدريب المسبق للنماذج التي تتطلب حوسبة مكثفة. بدلاً من ذلك، قد تعيد شركات الذكاء الاصطناعي تخصيص الاستثمار بشكل استراتيجي نحو تعزيز قدراتها الاستدلالية. هذا لا يعني بالضرورة عددًا أقل من وحدات معالجة الرسومات بشكل عام، بل نهجًا مختلفًا لنشرها وإدارتها. يتطلب دعم الطلبات المتزايدة لـ TTC بنية تحتية قوية للاستدلال قادرة على التعامل مع أعباء العمل الديناميكية التي غالبًا ما تكون غير متوقعة. في حين أنه لا شك في أن أعدادًا كبيرة من وحدات معالجة الرسومات ستظل ضرورية للاستدلال، فإن الطبيعة الأساسية لهذه المهام تختلف اختلافًا كبيرًا عن التدريب. غالبًا ما يتضمن التدريب مهام معالجة دفعات كبيرة يمكن التنبؤ بها وتعمل على مدى فترات طويلة. يميل الاستدلال، خاصة المعزز بـ TTC، إلى أن يكون أكثر “تقلبًا وحساسية لزمن الاستجابة”، ويتميز بأنماط طلب متقلبة بناءً على تفاعلات المستخدم في الوقت الفعلي. يقدم هذا عدم القدرة على التنبؤ المتأصل تعقيدات جديدة في تخطيط السعة وإدارة الموارد، مما يتطلب حلولًا أكثر مرونة وقابلية للتوسع من إعدادات التدريب التقليدية الموجهة نحو الدُفعات.
صعود مسرعات الاستدلال المتخصصة: مع تحول عنق الزجاجة في الأداء بشكل متزايد نحو الاستدلال، نتوقع زيادة في الطلب على الأجهزة المحسنة خصيصًا لهذه المهمة. يخلق التركيز على الحوسبة منخفضة الكمون وعالية الإنتاجية أثناء مرحلة الاستدلال أرضًا خصبة للبنى البديلة التي تتجاوز وحدة معالجة الرسومات للأغراض العامة. يمكن أن نشهد زيادة كبيرة في اعتماد الدوائر المتكاملة الخاصة بالتطبيقات (ASICs) المصممة بدقة لأعباء عمل الاستدلال، إلى جانب أنواع المسرعات الجديدة الأخرى. غالبًا ما تعد هذه الرقائق المتخصصة بأداء أفضل لكل واط أو زمن استجابة أقل لعمليات استدلال محددة مقارنة بوحدات معالجة الرسومات الأكثر تنوعًا. إذا أصبحت القدرة على تنفيذ مهام التفكير المعقدة بكفاءة في وقت الاستدلال (TTC) عامل تمييز تنافسي أكثر أهمية من سعة التدريب الخام، فقد تتآكل الهيمنة الحالية لوحدات معالجة الرسومات للأغراض العامة - التي تُقدر لمرونتها عبر كل من التدريب والاستدلال. يمكن لهذا المشهد المتطور أن يفيد بشكل كبير الشركات التي تطور وتصنع سيليكون الاستدلال المتخصص، مما قد يقتطع حصة سوقية كبيرة.
المنصات السحابية: ساحة المعركة الجديدة للجودة والكفاءة
يقف مقدمو الخدمات السحابية فائقة النطاق (مثل AWS و Azure و GCP) وخدمات الحوسبة السحابية الأخرى عند نقطة التقاء هذا التحول. من المرجح أن يؤدي التحول نحو TTC وانتشار نماذج التفكير القوية إلى إعادة تشكيل توقعات العملاء وديناميكيات المنافسة في السوق السحابية:
جودة الخدمة (QoS) كميزة تنافسية محددة: يكمن التحدي المستمر الذي يعيق تبني الشركات على نطاق أوسع لنماذج الذكاء الاصطناعي المتطورة، بخلاف المخاوف الكامنة بشأن الدقة والموثوقية، في الأداء غير المتوقع غالبًا لواجهات برمجة تطبيقات الاستدلال. غالبًا ما تواجه الشركات التي تعتمد على واجهات برمجة التطبيقات هذه مشكلات محبطة مثل أوقات الاستجابة المتغيرة للغاية (الكمون)، وتقييد معدل الاستخدام غير المتوقع الذي يخنق استخدامها، وصعوبات إدارة طلبات المستخدمين المتزامنة بكفاءة، والنفقات التشغيلية للتكيف مع التغييرات المتكررة لنقاط نهاية API من قبل مزودي النماذج. تهدد المتطلبات الحسابية المتزايدة المرتبطة بتقنيات TTC المتطورة بتفاقم نقاط الضعف الحالية هذه. في هذه البيئة، ستمتلك المنصة السحابية التي لا يمكنها فقط توفير الوصول إلى نماذج قوية ولكن أيضًا ضمانات جودة الخدمة (QoS) القوية - مما يضمن زمن استجابة منخفضًا ثابتًا، وإنتاجية يمكن التنبؤ بها، ووقت تشغيل موثوقًا به، وقابلية توسع سلسة - ميزة تنافسية مقنعة. ستنجذب الشركات التي تسعى إلى نشر تطبيقات الذكاء الاصطناعي ذات المهام الحرجة نحو مقدمي الخدمات الذين يمكنهم تقديم أداء يمكن الاعتماد عليه في ظل ظروف العالم الحقيقي الصعبة.
مفارقة الكفاءة: هل تقود إلى زيادة استهلاك السحابة؟ قد يبدو الأمر غير بديهي، لكن ظهور طرق أكثر كفاءة من الناحية الحسابية لكل من التدريب، وبشكل حاسم، استدلال نماذج اللغة الكبيرة (LLMs) قد لا يؤدي إلى انخفاض في الطلب الإجمالي على أجهزة الذكاء الاصطناعي والموارد السحابية. بدلاً من ذلك، يمكن أن نشهد ظاهرة مماثلة لمفارقة جيفونز (Jevons Paradox). يفترض هذا المبدأ الاقتصادي، الذي لوحظ تاريخيًا، أن الزيادات في كفاءة الموارد غالبًا ما تؤدي إلى معدل استهلاك إجمالي أعلى، حيث تشجع التكلفة المنخفضة أو سهولة الاستخدام الأكبر على تبني أوسع وتطبيقات جديدة. في سياق الذكاء الاصطناعي، يمكن لنماذج الاستدلال عالية الكفاءة، التي قد يتم تمكينها من خلال اختراقات TTC التي ابتكرتها مختبرات مثل DeepSeek، أن تخفض بشكل كبير التكلفة لكل استعلام أو لكل مهمة. يمكن لهذه القدرة على تحمل التكاليف، بدورها، أن تحفز مجموعة أوسع بكثير من المطورين والمؤسسات على دمج قدرات التفكير المتطورة في منتجاتهم وسير عملهم. قد يكون التأثير الصافي زيادة كبيرة في الطلب الكلي على حوسبة الذكاء الاصطناعي القائمة على السحابة، والتي تشمل كلاً من تنفيذ نماذج الاستدلال الفعالة هذه على نطاق واسع والحاجة المستمرة لتدريب نماذج أصغر وأكثر تخصصًا مصممة لمهام أو مجالاتمحددة. وبالتالي، قد تؤدي التطورات الأخيرة، بشكل متناقض، إلى تغذية الإنفاق السحابي الإجمالي على الذكاء الاصطناعي بدلاً من إضعافه.
النماذج التأسيسية: خندق متغير
الساحة التنافسية لمقدمي النماذج التأسيسية - وهي مساحة تهيمن عليها حاليًا أسماء مثل OpenAI و Anthropic و Cohere و Google و Meta، وانضم إليها الآن لاعبون ناشئون مثل DeepSeek و Mistral - تستعد أيضًا لتغيير كبير:
- إعادة التفكير في قابلية الدفاع عن التدريب المسبق: اعتمدت الميزة التنافسية التقليدية، أو “الخندق”، التي تتمتع بها مختبرات الذكاء الاصطناعي الرائدة بشكل كبير على قدرتها على جمع مجموعات بيانات ضخمة ونشر موارد حسابية هائلة للتدريب المسبق لنماذج أكبر من أي وقت مضى. ومع ذلك، إذا تمكن اللاعبون المزعزعون مثل DeepSeek من تحقيق أداء مماثل أو حتى على مستوى الحدود بشكل واضح مع نفقات أقل بكثير، فقد تتضاءل القيمة الاستراتيجية لنماذج التدريب المسبق المملوكة كعامل تمييز وحيد. قد تصبح القدرة على تدريب نماذج ضخمة أقل ميزة فريدة إذا سمحت التقنيات المبتكرة في بنية النموذج أو منهجيات التدريب أو، بشكل حاسم، تحسين الحوسبة في وقت الاختبار (TTC) للآخرين بالوصول إلى مستويات أداء مماثلة بكفاءة أكبر. يجب أن نتوقع استمرار الابتكار السريع في تعزيز قدرات نموذج المحولات من خلال TTC، وكما يوضح ظهور DeepSeek، يمكن أن تنشأ هذه الاختراقات من خارج الدائرة الراسخة لعمالقة الصناعة. يشير هذا إلى إضفاء الطابع الديمقراطي المحتمل على تطوير الذكاء الاصطناعي المتطور، مما يعزز نظامًا بيئيًا أكثر تنوعًا وتنافسية.
تبني الذكاء الاصطناعي في المؤسسات وطبقة التطبيقات
تمتد تداعيات هذه التحولات إلى مشهد برامج المؤسسات والتبني الأوسع للذكاء الاصطناعي داخل الشركات، لا سيما فيما يتعلق بطبقة تطبيقات البرمجيات كخدمة (SaaS):
التغلب على عقبات الأمن والخصوصية: إن الأصول الجيوسياسية للوافدين الجدد مثل DeepSeek تقدم حتماً تعقيدات، لا سيما فيما يتعلق بأمن البيانات والخصوصية. نظرًا لمقر DeepSeek في الصين، فمن المرجح أن تواجه عروضها، وخاصة خدمات API المباشرة وتطبيقات الدردشة الآلية، تدقيقًا مكثفًا من العملاء المحتملين من المؤسسات في أمريكا الشمالية وأوروبا والدول الغربية الأخرى. تشير التقارير بالفعل إلى أن العديد من المنظمات تحظر بشكل استباقي الوصول إلى خدمات DeepSeek كإجراء احترازي. حتى عندما يتم استضافة نماذج DeepSeek بواسطة مزودي خدمات سحابية من جهات خارجية داخل مراكز البيانات الغربية، فإن المخاوف المستمرة بشأن حوكمة البيانات، والتأثير المحتمل للدولة، والالتزام بلوائح الخصوصية الصارمة (مثل GDPR أو CCPA) يمكن أن تعيق التبني الواسع النطاق في المؤسسات. علاوة على ذلك، يبحث الباحثون بنشاط ويسلطون الضوء على نقاط الضعف المحتملة المتعلقة بـ ‘jailbreaking’ (تجاوز ضوابط السلامة)، والتحيزات المتأصلة في مخرجات النموذج، وتوليد محتوى يحتمل أن يكون ضارًا أو غير لائق. في حين أن التجارب والتقييم داخل فرق البحث والتطوير في المؤسسات قد تحدث بسبب القدرات التقنية للنماذج، يبدو من غير المحتمل أن يتخلى المشترون من الشركات بسرعة عن مقدمي الخدمات الراسخين والموثوقين مثل OpenAI أو Anthropic بناءً على عروض DeepSeek الحالية فقط، نظرًا لاعتبارات الثقة والأمن الهامة هذه.
التخصص الرأسي يجد أرضية أكثر صلابة: تاريخيًا، ركز المطورون الذين يبنون تطبيقات مدعومة بالذكاء الاصطناعي لصناعات أو وظائف تجارية محددة (التطبيقات الرأسية) بشكل أساسي على إنشاء مسارات عمل متطورة حول النماذج التأسيسية الحالية للأغراض العامة. كانت التقنيات مثل التوليد المعزز بالاسترجاع (RAG) لإدخال المعرفة الخاصة بالمجال، والتوجيه الذكي للنماذج لاختيار أفضل LLM لمهمة معينة، واستدعاء الوظائف لدمج الأدوات الخارجية، وتنفيذ حواجز حماية قوية لضمان مخرجات آمنة وذات صلة، محورية في تكييف هذه النماذج القوية ولكن المعممة للاحتياجات المتخصصة. وقد حققت هذه الأساليب نجاحًا كبيرًا. ومع ذلك، فقد ظل قلق مستمر يلقي بظلاله على طبقة التطبيقات: الخوف من أن قفزة مفاجئة وكبيرة في قدرات النماذج التأسيسية الأساسية يمكن أن تجعل على الفور هذه الابتكارات الخاصة بالتطبيقات والمصممة بعناية بالية - وهو سيناريو أطلق عليه سام ألتمان من OpenAI اسم “steamrolling” الشهير.
ومع ذلك، إذا كان مسار تقدم الذكاء الاصطناعي يتحول بالفعل، مع توقع تحقيق أكبر المكاسب الآن من تحسين الحوسبة في وقت الاختبار بدلاً من التحسينات الهائلة في التدريب المسبق، فإن التهديد الوجودي لقيمة طبقة التطبيقات يتضاءل. في مشهد تُشتق فيه التطورات بشكل متزايد من تحسينات TTC، تنفتح طرق جديدة للشركات المتخصصة في مجالات محددة. يمكن للابتكارات التي تركز على خوارزميات ما بعد التدريب الخاصة بالمجال - مثل تطوير تقنيات التلقين المنظمة المحسنة للمصطلحات الخاصة بصناعة معينة، أو إنشاء استراتيجيات تفكير واعية بزمن الاستجابة للتطبيقات في الوقت الفعلي، أو تصميم طرق أخذ عينات عالية الكفاءة مصممة لأنواع معينة من البيانات - أن تحقق مزايا أداء كبيرة داخل الأسواق الرأسية المستهدفة.
هذه الإمكانية للتحسين الخاص بالمجال ذات صلة بشكل خاص بالجيل الجديد من النماذج التي تركز على التفكير، مثل GPT-4o من OpenAI أو سلسلة R من DeepSeek، والتي، على الرغم من قوتها، غالبًا ما تظهر زمن استجابة ملحوظ، وتستغرق أحيانًا عدة ثوانٍ لإنشاء استجابة. في التطبيقات التي تتطلب تفاعلًا شبه فوري (مثل روبوتات خدمة العملاء، وأدوات تحليل البيانات التفاعلية)، يمثل تقليل زمن الاستجابة هذا وتحسين جودة وملاءمة مخرجات الاستدلال في سياق مجال معين في نفس الوقت عامل تمييز تنافسي كبير. وبالتالي، قد تجد شركات طبقة التطبيقات التي تمتلك خبرة رأسية عميقة نفسها تلعب دورًا حاسمًا بشكل متزايد، ليس فقط في بناء مسارات العمل، ولكن في تحسين كفاءة الاستدلال بنشاط وضبط سلوك النموذج لمجالها المحدد. يصبحون شركاء لا غنى عنهم في ترجمة قوة الذكاء الاصطناعي الخام إلى قيمة تجارية ملموسة.
يعد ظهور DeepSeek بمثابة توضيح قوي لاتجاه أوسع: تراجع الاعتماد على الحجم الهائل في التدريب المسبق باعتباره المسار الحصري لجودة النموذج الفائقة. بدلاً من ذلك، يؤكد نجاحها الأهمية المتصاعدة لتحسين الحوسبة أثناء مرحلة الاستدلال - عصر الحوسبة في وقت الاختبار (TTC). في حين أن الاستيعاب المباشر لنماذج DeepSeek المحددة داخل برامج المؤسسات الغربية قد يظل مقيدًا بالتدقيق الأمني والجيوسياسي المستمر، فإن تأثيرها غير المباشر أصبح واضحًا بالفعل. لا شك أن التقنيات والإمكانيات التي أظهروها تحفز جهود البحث والهندسة داخل مختبرات الذكاء الاصطناعي الراسخة، مما يجبرهم على دمج استراتيجيات تحسين TTC مماثلة لتكملة مزاياهم الحالية في الحجم والموارد. يبدو أن هذا الضغط التنافسي، كما هو متوقع، مهيأ لخفض التكلفة الفعلية لاستدلال النماذج المتطورة، والذي، تماشيًا مع مفارقة جيفونز (Jevons Paradox)، من المرجح أن يساهم في تجريب أوسع وزيادة الاستخدام العام لقدرات الذكاء الاصطناعي المتقدمة عبر الاقتصاد الرقمي.