يوم DeepSeek الثاني: نحو تبني الذكاء الاصطناعي المؤسسي

تكلفة تبني الذكاء الاصطناعي الباهظة

وفقًا للمحللين براد سيلز وكارلي ليو من BofA Global Research، فإن النفقات المرتبطة بتطبيقات الذكاء الاصطناعي هي العقبة الرئيسية التي تعيق انتشارها على نطاق واسع. يشير تقريرهم، الصادر يوم الثلاثاء 28 يناير، إلى أن تحقيق اختراقات في خفض التكاليف يمكن أن يؤدي إلى مزيد من انخفاض الأسعار، مما يؤدي إلى زيادة معدلات التبني.

أحدث إعلان DeepSeek يوم الاثنين 27 يناير صدمة في صناعة الذكاء الاصطناعي، مما تسبب في انخفاض أسهم العديد من شركات الذكاء الاصطناعي. كشفت الشركة عن قدرتها على تدريب نموذج أساسي بمبلغ 5.58 مليون دولار فقط باستخدام 2,048 شريحة Nvidia H800. يتناقض هذا الرقم بشكل صارخ مع التكاليف المقدرة لـ OpenAI و Anthropic، والتي تتراوح من 100 مليون دولار إلى مليار دولار وتتضمن استخدام الآلاف من شرائح Nvidia AI.

أكد روي بينيش، كبير مسؤولي التكنولوجيا في eSIMple، على الإمكانات التحويلية لإنجاز DeepSeek، مشيرًا إلى أنها تمكن الشركات الصغيرة والمطورين الأفراد وحتى الباحثين من الاستفادة من قوة الذكاء الاصطناعي دون تكبد تكاليف باهظة. يمكن أن تعزز هذه الزيادة في إمكانية الوصول تطوير الأفكار والتقنيات المبتكرة، مما يؤدي إلى زيادة القدرة التنافسية في هذا المجال. ونتيجة لذلك، يمكن للعملاء الاستفادة من الخيارات الجديدة، في حين من المرجح أن تخفض شركات الذكاء الاصطناعي القائمة أسعارها وتسريع التطورات التكنولوجية.

قدم محللو BofA أمثلة على التكاليف المرتبطة بتطبيقات الذكاء الاصطناعي الحالية. تفرض Microsoft’s 365 Copilot Chat ما بين 1 سنت و 30 سنتًا لكل مطالبة، اعتمادًا على مدى تعقيد الطلب. تفرض Salesforce’s Agentforce for Service Cloud سعرًا ثابتًا قدره 2 دولار لكل تحويل.

في حين اعترف BofA بأن رقم 5.58 مليون دولار الذي قدمته DeepSeek مضلل إلى حد ما بسبب استبعاد التكاليف المتعلقة بالبحث والتجارب والهندسة المعمارية والخوارزميات والبيانات، أكد المحللون على أهمية ابتكارات الشركة الناشئة في إظهار جدوى طرق التدريب الأقل تكلفة.

التدريب المسبق مقابل الاستدلال: فهم التكاليف

تخضع نماذج الذكاء الاصطناعي الأساسية، مثل GPT-4o من OpenAI و Gemini من Google، لعملية تسمى التدريب المسبق، حيث تتعرض لكميات هائلة من البيانات، مثل الإنترنت بأكمله، لتطوير المعرفة العامة. ومع ذلك، لجعل هذه النماذج أكثر ملاءمة وفائدة لشركات وصناعات معينة، تحتاج المؤسسات إلى مزيد من التدريب أو الضبط الدقيق باستخدام بياناتها الخاصة.

بمجرد الانتهاء من الضبط الدقيق لنموذج الذكاء الاصطناعي، يمكنه معالجة مطالبات المستخدمين وإنشاء استجابات ذات صلة. ومع ذلك، فإن عملية مطالبة النموذج والحصول على استجابة تتكبد تكاليف استدلال، وهي رسوم مرتبطة بإشراك النموذج ببيانات جديدة لفهمها وتحليلها.

من المهم ملاحظة أن معظم الشركات لا تتحمل تكلفة تدريب النماذج الأساسية. تقع هذه المسؤولية على عاتق مطوري هذه النماذج، بما في ذلك OpenAI و Google و Meta و Amazon و Microsoft و Anthropic و Cohere و Hugging Face و Mistral AI و Stability AI و xAI و IBM و Nvidia وبعض المعامل البحثية وعمالقة التكنولوجيا الصينية مثل Baidu و Alibaba.

تتحمل الشركات بشكل أساسي تكاليف الاستدلال لمعالجة أعباء عمل الذكاء الاصطناعي، والتي تشكل غالبية النفقات المتعلقة بالذكاء الاصطناعي.

اتصال الصين: تكاليف استدلال DeepSeek ومخاوف الخصوصية

تقدم DeepSeek خدمات الاستدلال الخاصة بها بتكاليف أقل بكثير مقارنة بشركات Silicon Valley. ومع ذلك، هناك بعض الاعتبارات التي يجب وضعها في الاعتبار عند استخدام هذه الخدمات.

وفقًا لسياسة خصوصية DeepSeek، يتم تخزين معلومات المستخدم على خوادم موجودة في الصين. تذكر الشركة أيضًا أنها ستلتزم بالالتزامات القانونية وتقوم بمهام في المصلحة العامة أو لحماية المصالح الحيوية لمستخدميها وغيرهم من الأشخاص.

ينص قانون الاستخبارات الوطنية الصيني، وتحديدًا المادة 7، على أن تدعم جميع المنظمات والمواطنين وتساعد وتتعاون مع جهود الاستخبارات الوطنية وفقًا للقانون وتحمي أسرار عمل الاستخبارات الوطنية التي هم على علم بها.

أثار كيفن سوراس، الرئيس التنفيذي لشركة Appvance، مخاوف بشأن الخصوصية، مشيرًا إلى أن جمع البيانات من المستخدمين ممارسة شائعة في الصين. نصح المستخدمين بتوخي الحذر.

في تجربة أجرتها PYMNTS، طُلب من chatbot الخاص بـ DeepSeek شرح كيف أثرت احتجاجات ميدان Tiananmen عام 1989 على السياسة الصينية. رد Chatbot، ‘آسف، لست متأكدًا من كيفية التعامل مع هذا النوع من الأسئلة حتى الآن.’

أشار تيم إنيكينغ، الرئيس التنفيذي لشركة Presearch، إلى أن DeepSeek هي شركة صينية مملوكة بنسبة 100٪ ومقرها في الصين. وأشار إلى أن عدم قدرة chatbot على تقديم معلومات حول ميدان Tiananmen أو كبار الشخصيات الحكومية الصينية يشير إلى وجود قيود في موضوعية التكنولوجيا. في حين أن Enneking أقر بالإمكانات المثيرة للتكنولوجيا، إلا أنه أعرب عن مخاوفه بشأن السيطرة عليها.

ومع ذلك، سلط Enneking أيضًا الضوء على الطبيعة مفتوحة المصدر لنماذج DeepSeek، مما يسمح بإجراء مراجعات لإزالة الضوابط الحكومية والشركات. إنه يعتقد أن الإبداع الهندسي للشركة يخلق فرصًا للشركات والدول الصغيرة للمشاركة والنجاح في مشهد الذكاء الاصطناعي التوليدي.

إمكانات DeepSeek لخفض تكاليف الاستدلال للجميع

إن نهج DeepSeek المبتكر لتدريب النماذج الأساسية بتكلفة أقل له آثار إيجابية على شركات مثل Microsoft، والتي يمكنها الاستمرار في خفض تكلفة حوسبة الذكاء الاصطناعي وزيادة الحجم. وفقًا لـ Sills و Liu، يمكن أن تؤدي تكاليف الحوسبة المنخفضة إلى تحسين الهوامش على العروض التي تدعم الذكاء الاصطناعي.

في مذكرة بحثية منفصلة، اقترح محللو BofA Alkesh Shah و Andrew Moss و Brad Sills أن تكاليف حوسبة الذكاء الاصطناعي المنخفضة يمكن أن تمكن خدمات الذكاء الاصطناعي الأوسع عبر مختلف القطاعات، من السيارات إلى الهواتف الذكية.

في حين أنه من غير المحتمل أن يحقق مطورو النماذج الأساسية مثل OpenAI على الفور تكاليف تدريب منخفضة مثل DeepSeek، يعتقد المحللون أن تقنيات التدريب والتدريب اللاحق المبتكرة التي تتبعها DeepSeek سيتم اعتمادها من قبل مطوري النماذج المتنافسة لتعزيز الكفاءة. ومع ذلك، فإنهم يؤكدون على أن النماذج الحالية ستظل تتطلب استثمارات كبيرة لأنها تشكل الأساس لوكلاء الذكاء الاصطناعي.

على المدى الطويل، يتوقع المحللون تسريع اعتماد الذكاء الاصطناعي من قبل المؤسسات حيث تصبح chatbots والطيارين الآليين والوكلاء أكثر ذكاءً وأرخص، وهي ظاهرة تُعرف باسم مفارقة Jevons.

ردد ساتيا ناديلا، الرئيس التنفيذي لشركة Microsoft، هذا الشعور على X، قائلاً إن مفارقة Jevons مطروحة بينما يصبح الذكاء الاصطناعي أكثر كفاءة وسهولة في الوصول إليه. إنه يعتقد أن هذا سيؤدي إلى زيادة كبيرة في استخدام الذكاء الاصطناعي، وتحويله إلى سلعة لا يمكننا الحصول على ما يكفي منها.

نظرة أكثر تعمقًا على النماذج الأساسية وتأثيرها

تُحدث النماذج الأساسية، وهي العمود الفقري للذكاء الاصطناعي الحديث، ثورة في طريقة عمل الشركات وتفاعلها مع التكنولوجيا. تمتلك هذه النماذج، المدربة على مجموعات بيانات ضخمة، القدرة على أداء مجموعة واسعة من المهام، من معالجة اللغة الطبيعية إلى التعرف على الصور. ومع ذلك، فإن تطوير ونشر هذه النماذج يتضمن تفاعلًا معقدًا للعوامل، بما في ذلك تكاليف التدريب وتكاليف الاستدلال وخصوصية البيانات والاعتبارات الأخلاقية.

فهم النماذج الأساسية

في جوهرها، النماذج الأساسية هي شبكات عصبية كبيرة مدربة على مجموعات بيانات ضخمة. تسمح عملية التدريب هذه لهم بتعلم الأنماط والعلاقات داخل البيانات، مما يمكنهم من أداء مجموعة متنوعة من المهام بدقة ملحوظة. تتضمن بعض الأمثلة على النماذج الأساسية ما يلي:

  • GPT-4o: نموذج لغة قوي تم تطويره بواسطة OpenAI، قادر على إنشاء نص بجودة بشرية وترجمة اللغات والإجابة على الأسئلة بطريقة شاملة.
  • Google’s Gemini: نموذج ذكاء اصطناعي متعدد الوسائط يمكنه معالجة وفهم أنواع مختلفة من البيانات، بما في ذلك النصوص والصور والصوت.

لا تقتصر هذه النماذج على مهام محددة ولكن يمكن تكييفها مع مجموعة واسعة من التطبيقات، مما يجعلها أدوات متعددة الاستخدامات للشركات.

دور التدريب المسبق والضبط الدقيق

يتضمن تطوير نموذج أساسي عادةً مرحلتين رئيسيتين: التدريب المسبق والضبط الدقيق.

  • التدريب المسبق: في هذه المرحلة، يتم تدريب النموذج على مجموعة بيانات ضخمة، مثل الإنترنت بأكمله، لتعلم المعرفة العامة ومهارات اللغة. تزود هذه العملية النموذج بالقدرة على فهم وإنشاء النصوص وترجمة اللغات وأداء المهام الأساسية الأخرى.
  • الضبط الدقيق: في هذه المرحلة، يتم تدريب النموذج المدرب مسبقًا بشكل أكبر على مجموعة بيانات أصغر وأكثر تحديدًا تتعلق بمهمة أو صناعة معينة. تسمح هذه العملية للنموذج بتكييف معرفته ومهاراته مع الاحتياجات المحددة للتطبيق.

على سبيل المثال، يمكن ضبط نموذج لغة مدرب مسبقًا على مجموعة بيانات من تفاعلات خدمة العملاء لإنشاء برنامج دردشة يمكنه الاستجابة بفعالية لاستفسارات العملاء.

تكلفة التدريب والاستدلال

يمكن تقسيم التكاليف المرتبطة بالنماذج الأساسية إلى فئتين رئيسيتين: تكاليف التدريب وتكاليف الاستدلال.

  • تكاليف التدريب: تتضمن هذه التكاليف الموارد الحاسوبية والبيانات والخبرة المطلوبة لتدريب النموذج الأساسي. يمكن أن يكون تدريب نموذج أساسي كبير مكلفًا للغاية، وغالبًا ما يتطلب ملايين الدولارات من الاستثمار.
  • تكاليف الاستدلال: تتضمن هذه التكاليف الموارد الحاسوبية المطلوبة لاستخدام النموذج المدرب لتقديم التنبؤات أو إنشاء المخرجات. يمكن أن تختلف تكاليف الاستدلال اعتمادًا على حجم وتعقيد النموذج وكمية البيانات التي تتم معالجتها والبنية التحتية المستخدمة.

يكمن ابتكار DeepSeek في قدرته على تقليل تكاليف التدريب المرتبطة بالنماذج الأساسية بشكل كبير، مما يجعلها أكثر سهولة في الوصول إليها لمجموعة واسعة من الشركات والمؤسسات.

معالجة مخاوف الخصوصية والأخلاق

يثير استخدام النماذج الأساسية أسئلة مهمة حول خصوصية البيانات والاعتبارات الأخلاقية. يتم تدريب النماذج الأساسية على مجموعات بيانات ضخمة، والتي قد تحتوي على معلومات حساسة أو شخصية. من الأهمية بمكان التأكد من أن هذه النماذج تستخدم بطريقة مسؤولة وأخلاقية، مع احترام خصوصية المستخدمين وتجنب التحيز.

تتضمن بعض الاستراتيجيات لمعالجة هذه المخاوف ما يلي:

  • إخفاء هوية البيانات: إزالة أو إخفاء المعلومات الشخصية من بيانات التدريب لحماية خصوصية المستخدم.
  • اكتشاف التحيز والتخفيف منه: تحديد ومعالجة التحيزات في بيانات التدريب لضمان ألا يديم النموذج الصور النمطية الضارة أو الممارسات التمييزية.
  • الشفافية والمساءلة: تقديم معلومات واضحة حول كيفية عمل النموذج وكيف يتم استخدامه، وإنشاء آليات للمساءلة في حالة حدوث أخطاء أو عواقب غير مقصودة.

نظرًا لأن النماذج الأساسية أصبحت أكثر انتشارًا، فمن الضروري معالجة هذه المخاوف المتعلقة بالخصوصية والأخلاق بشكل استباقي لضمان استخدامها لصالح المجتمع.

مستقبل النماذج الأساسية

تتطور النماذج الأساسية بسرعة، وتأثيرها المحتمل على المجتمع هائل. في المستقبل، يمكننا أن نتوقع أن نرى:

  • نماذج أكثر قوة وتنوعًا: بينما يواصل الباحثون تطوير هياكل وتقنيات تدريب جديدة، ستصبح النماذج الأساسية أكثر قوة وتنوعًا، وقادرة على أداء مجموعة واسعة من المهام بدقة أكبر.
  • زيادة إمكانية الوصول: مع انخفاض تكاليف التدريب وزيادة انتشار منصات الذكاء الاصطناعي المستندة إلى السحابة، ستصبح النماذج الأساسية أكثر سهولة في الوصول إليها للشركات من جميع الأحجام.
  • تطبيقات وحالات استخدام جديدة: ستستمر النماذج الأساسية في تطبيقها على حالات استخدام جديدة ومبتكرة عبر مختلف الصناعات، من الرعاية الصحية إلى التمويل إلى التعليم.

يمثل ظهور النماذج الأساسية تحولًا نموذجيًا في مجال الذكاء الاصطناعي. من خلال فهم قدراتهم وتكاليفهم واعتباراتهم الأخلاقية، يمكننا تسخير قوتهم لخلق مستقبل أفضل.

مساهمة DeepSeek في إضفاء الطابع الديمقراطي على الذكاء الاصطناعي

يمثل إنجاز DeepSeek في تقليل تكلفة تدريب النماذج الأساسية بشكل كبير لحظة محورية في إضفاء الطابع الديمقراطي على الذكاء الاصطناعي. من خلال خفض حاجز الدخول، تعمل DeepSeek على تمكين مجموعة واسعة من المنظمات والأفراد للمشاركة في ثورة الذكاء الاصطناعي.

التأثير على الشركات الصغيرة

غالبًا ما تفتقر الشركات الصغيرة إلى الموارد والخبرة لتطوير ونشر نماذج الذكاء الاصطناعي الخاصة بها. توفر نماذج DeepSeek الأساسية الفعالة من حيث التكلفة هذه الشركات إمكانية الوصول إلى تقنية الذكاء الاصطناعي المتطورة التي كانت في السابق بعيدة المنال. يمكن أن يؤدي ذلك إلى تكافؤ الفرص، مما يسمح للشركات الصغيرة بالتنافس بفعالية أكبر مع الشركات الأكبر والأكثر رسوخًا.

على سبيل المثال، يمكن لشركة تجارة إلكترونية صغيرة استخدام نماذج DeepSeek لتخصيص توصيات المنتجات لعملائها أو تحسين خدمة العملاء أو أتمتة حملاتها التسويقية.

تمكين المطورين الأفراد

تعمل نماذج DeepSeek أيضًا على تمكين المطورين والباحثين الأفراد من استكشاف تطبيقات وابتكارات الذكاء الاصطناعي الجديدة. من خلال الوصول إلى النماذج الأساسية بأسعار معقولة، يمكن للمطورين تجربة أفكار مختلفة وتطوير أدوات جديدة تعمل بالذكاء الاصطناعي والمساهمة في تطوير تقنية الذكاء الاصطناعي.

يمكن أن يؤدي ذلك إلى زيادة كبيرة في الابتكار، حيث تتاح لعدد أكبر من الأشخاص الفرصة للمشاركة في تطوير الذكاء الاصطناعي.

إمكانات التعاون مفتوح المصدر

يعزز نهج DeepSeek مفتوح المصدر أيضًا التعاون والابتكار في مجتمع الذكاء الاصطناعي. من خلال إتاحة نماذجه للجمهور، تشجع DeepSeek المطورين على المساهمة في تحسينها وتحديد الأخطاء وإصلاحها وتطوير ميزات جديدة.

يمكن أن يؤدي هذا النهج التعاوني إلى تسريع تطوير تقنية الذكاء الاصطناعي والتأكد من استخدامها لصالح الجميع.

تسريع اعتماد الذكاء الاصطناعي

من خلال خفض تكلفة الذكاء الاصطناعي، تعمل DeepSeek على تسريع اعتماد الذكاء الاصطناعي عبر مختلف الصناعات. نظرًا لأن الذكاء الاصطناعي أصبح أكثر تكلفة ويسهل الوصول إليه، فستتمكن المزيد من الشركات من دمجه في عملياتها، مما يؤدي إلى زيادة الإنتاجية والكفاءة والابتكار.

يمكن أن يكون لذلك تأثير عميق على الاقتصاد العالمي، مما يؤدي إلى النمو وخلق فرص جديدة.

نظام بيئي للذكاء الاصطناعي أكثر شمولاً

تساهم جهود DeepSeek لإضفاء الطابع الديمقراطي على الذكاء الاصطناعي في نظام بيئي للذكاء الاصطناعي أكثر شمولاً، حيث تتاح لعدد أكبر من الأشخاص الفرصة للمشاركة في تطوير واستخدام الذكاء الاصطناعي. يمكن أن يساعد ذلك في ضمان استخدام الذكاء الاصطناعي بطريقة تفيد جميع أفراد المجتمع، بدلاً من مجرد عدد قليل منتقى.

من خلال تمكين الشركات الصغيرة والمطورين الأفراد والباحثين، تعمل DeepSeek على تعزيز مشهد ذكاء اصطناعي أكثر تنوعًا وابتكارًا.