ثمن البكسل: OpenAI تواجه أزمة GPU مع حمى صور ChatGPT

اعتراف صريح: عندما يتفوق الابتكار على البنية التحتية

في عالم الذكاء الاصطناعي سريع الخطى، يمكن للنجاح أحيانًا أن يبدو وكأنه رف خوادم محموم. هذه هي الصورة التي رسمها، حرفيًا، الرئيس التنفيذي لشركة OpenAI، Sam Altman، مؤخرًا. في مواجهة انفجار حماس المستخدمين لقدرات توليد الصور المدمجة في أحدث نموذج رائد للشركة، GPT-4o، قدم Altman رسالة صارخة: كان الطلب يدفع أجهزتهم إلى أقصى حدودها. كانت كلماته المختارة على منصة التواصل الاجتماعي X صريحة بشكل غير عادي بالنسبة لمدير تنفيذي في مجال التكنولوجيا، حيث ذكر بشكل لا لبس فيه أن وحدات معالجة الرسومات (GPUs) الخاصة بالشركة - وهي وحدات المعالجة الرسومية القوية الضرورية لحوسبة الذكاء الاصطناعي - كانت ‘تذوب’. لم يكن هذا انهيارًا حرفيًا بالطبع، ولكنه استعارة حية للإجهاد الحسابي المكثف الناجم عن ملايين المستخدمين الذين يكلفون الذكاء الاصطناعي في وقت واحد بإنشاء صور جديدة. أشار الإعلان إلى تعديل تشغيلي فوري، وإن كان مؤقتًا: ستقوم OpenAI بتطبيق حدود للمعدل (rate limits) على طلبات توليد الصور لإدارة الحمل.

يؤكد هذا الموقف على توتر أساسي في صناعة الذكاء الاصطناعي: الدفع المستمر نحو نماذج أكثر قدرة وأكثر سهولة في الوصول مقابل البنية التحتية المادية الحقيقية والمكلفة للغاية المطلوبة لتشغيلها. يكشف اعتراف Altman الستار عن الحقائق التشغيلية التي غالبًا ما تكون مخفية وراء واجهات المستخدم الأنيقة وقدرات الذكاء الاصطناعي التي تبدو سحرية. إن وحدات معالجة الرسومات ‘الذائبة’ هي نتيجة ملموسة لإضفاء الطابع الديمقراطي على تقنية كانت، حتى وقت قريب، محصورة إلى حد كبير في مختبرات الأبحاث أو التطبيقات المتخصصة. تحولت الشعبية الهائلة لميزة الصور في GPT-4o، لا سيما قدرتها على توليد أنماط محددة مثل تلك المستوحاة من Studio Ghibli، إلى سيناريو ‘ضحية نجاحها’، مما فرض اعترافًا عامًا بقيود الموارد الأساسية.

تحت الغطاء: لماذا تعتبر معالجات الرسوميات القوة الدافعة للذكاء الاصطناعي

لفهم سبب تسبب حماس المستخدمين لإنشاء الصور الرقمية في مثل هذا الاختناق، من الضروري تقدير دور وحدات معالجة الرسومات (GPUs). صُممت في الأصل لعرض الرسومات المعقدة لألعاب الفيديو، وتمتلك وحدات معالجة الرسومات بنية فريدة مُحسَّنة لأداء العديد من العمليات الحسابية في وقت واحد. هذه القدرة على المعالجة المتوازية تجعلها مناسبة بشكل استثنائي للمهام الرياضية الثقيلة التي ينطوي عليها تدريب وتشغيل نماذج الذكاء الاصطناعي الكبيرة. تعتمد مهام مثل التعلم الآلي، وخاصة التعلم العميق الذي يشغل نماذج مثل GPT-4o، بشكل كبير على عمليات ضرب المصفوفات وغيرها من العمليات التي يمكن تقسيمها إلى العديد من العمليات الحسابية الأصغر والمستقلة - وهو بالضبط ما تتفوق فيه وحدات معالجة الرسومات.

إن توليد صورة من مطالبة نصية، على الرغم من أنه يبدو فوريًا للمستخدم، يتضمن رقصة حسابية معقدة. يجب على نموذج الذكاء الاصطناعي تفسير الفروق الدقيقة في اللغة، والوصول إلى قاعدة معارفه الداخلية الواسعة، وتصور المشهد، ثم ترجمة هذا المفهوم إلى شبكة من البكسلات، مع مراعاة عناصر مثل التكوين واللون والإضاءة والأسلوب. تتطلب كل خطوة قوة حسابية هائلة. عندما يتضاعف هذا العدد بفعل ملايين المستخدمين المحتملين الذين يقدمون طلبات بشكل متزامن، يصبح الطلب على مجموعات وحدات معالجة الرسومات فلكيًا. على عكس وحدات المعالجة المركزية (CPUs) ذات الأغراض العامة التي تتعامل مع المهام بشكل تسلسلي، تعالج وحدات معالجة الرسومات أعباء العمل المتوازية الضخمة هذه، وتعمل كمحركات متخصصة تقود ثورة الذكاء الاصطناعي. ومع ذلك، حتى هذه المعالجات القوية لها سعة محدودة وتولد حرارة كبيرة تحت الحمل الثقيل. وبالتالي، فإن تعليق Altman حول ‘الذوبان’ يشير مباشرة إلى القيود المادية ومتطلبات الطاقة الكامنة في تشغيل الذكاء الاصطناعي المتطور على نطاق واسع. أدى الارتفاع الكبير في الطلب فعليًا إلى حدوث ازدحام مروري على الطريق السريع الحسابي لـ OpenAI، مما استلزم اتخاذ تدابير للتحكم في التدفق.

GPT-4o: المحفز الذي أشعل الشرارة الإبداعية (والخوادم)

كان المحفز المحدد لهذا الإجهاد في البنية التحتية هو إطلاق GPT-4o، أحدث وأكثر نماذج الذكاء الاصطناعي متعددة الوسائط تطورًا من OpenAI. لم يكن GPT-4o، الذي أعلنت عنه الشركة باعتباره يشتمل على ‘مولد الصور الأكثر تقدمًا لدينا حتى الآن’، مجرد تحديث تدريجي؛ بل مثّل قفزة كبيرة في القدرة والتكامل. على عكس التكرارات السابقة حيث قد يكون توليد الصور ميزة منفصلة أو أقل دقة، يمزج GPT-4o بسلاسة بين معالجة النصوص والرؤية والصوت، مما يسمح بتفاعلات أكثر سهولة وقوة، بما في ذلك إنشاء صور متطورة مباشرة داخل واجهة الدردشة.

سلطت OpenAI الضوء على العديد من التطورات الرئيسية في براعة توليد الصور في GPT-4o:

  • الواقعية والدقة: تم تصميم النموذج لإنتاج مخرجات ليست جذابة بصريًا فحسب، بل دقيقة ومخلصة لمطالبة المستخدم، وقادرة على توليد صور واقعية للغاية.
  • عرض النص: كان التحدي السيئ السمعة لمولدات صور الذكاء الاصطناعي هو عرض النص بدقة داخل الصور. أظهر GPT-4o تحسينات ملحوظة في هذا المجال، مما سمح للمستخدمين بإنشاء صور تتضمن كلمات أو عبارات محددة بشكل أكثر موثوقية.
  • الالتزام بالمطالبة: أظهر النموذج فهمًا أفضل للمطالبات المعقدة والدقيقة، وترجمة طلبات المستخدم المعقدة إلى عناصر مرئية مقابلة بدقة أكبر.
  • الوعي بالسياق: بالاستفادة من القوة الأساسية لـ GPT-4o، يمكن لمولد الصور استخدام سياق الدردشة المستمر وقاعدة معارفه الواسعة. وهذا يعني أنه يمكنه توليد صور تعكس أجزاء سابقة من المحادثة أو تتضمن مفاهيم معقدة تمت مناقشتها.
  • معالجة الصور: يمكن للمستخدمين تحميل الصور الموجودة واستخدامها كمصدر إلهام أو توجيه الذكاء الاصطناعي لتعديلها، مما يضيف طبقة أخرى من التحكم الإبداعي والطلب الحسابي.

كان هذا المزيج القوي من سهولة الوصول (المدمجة مباشرة في واجهة ChatGPT الشهيرة) والقدرة المتقدمة هو الذي غذى التبني الفيروسي. بدأ المستخدمون بسرعة في التجريب، ودفع حدود التكنولوجيا ومشاركة إبداعاتهم على نطاق واسع عبر الإنترنت. أصبح اتجاه توليد الصور بأسلوب Studio Ghibli المميز والغريب بارزًا بشكل خاص، مما يدل على قدرة النموذج على التقاط جماليات فنية محددة. هذا التبني العضوي الواسع النطاق، على الرغم من كونه شهادة على جاذبية النموذج، استهلك بسرعة موارد GPU المتاحة لدى OpenAI، مما أدى مباشرة إلى الحاجة إلى التدخل. إن الميزات ذاتها التي جعلت توليد الصور في GPT-4o مقنعًا للغاية كانت أيضًا كثيفة من الناحية الحسابية، مما حوّل الافتتان الواسع النطاق إلى تحدٍ تشغيلي كبير.

التأثير المتتالي: التنقل بين حدود المعدل وتوقعات المستخدم

إن تطبيق حدود المعدل (rate limits)، على الرغم من إعلان Altman أنها مؤقتة، يؤثر حتمًا على تجربة المستخدم عبر مستويات الخدمة المختلفة. لم يحدد Altman الطبيعة الدقيقة لحدود المعدل العامة، مما ترك بعض الغموض لمستخدمي الفئات المدفوعة. ومع ذلك، فقد قدم رقمًا ملموسًا للفئة المجانية: سيقتصر المستخدمون الذين ليس لديهم اشتراك قريبًا على ثلاث عمليات توليد صور فقط يوميًا. يمثل هذا تراجعًا كبيرًا عن الوصول الأولي الأوسع نطاقًا ويسلط الضوء على الحقائق الاقتصادية لتوفير خدمات مكلفة حسابيًا مجانًا.

بالنسبة للمستخدمين الذين يعتمدون على الفئة المجانية، فإن هذا القيد يحد بشكل كبير من قدرتهم على التجربة واستخدام ميزة توليد الصور. في حين أن ثلاث عمليات توليد يوميًا تسمح ببعض الاستخدام الأساسي، إلا أنها أقل بكثير من السعة اللازمة للاستكشاف الإبداعي المكثف، أو التحسين التكراري للمطالبات، أو توليد خيارات متعددة لمفهوم واحد. يضع هذا القرار فعليًا قدرة توليد الصور المتقدمة في المقام الأول كميزة متميزة، يمكن الوصول إليها بطريقة غير محدودة بشكل أكبر فقط لأولئك المشتركين في فئات ChatGPT Plus أو Pro أو Team أو Select. ومع ذلك، حتى هؤلاء العملاء الذين يدفعون يخضعون لـ ‘حدود المعدل المؤقتة’ غير المحددة التي ذكرها Altman، مما يشير إلى أنه تحت ذروة الحمل، قد يواجه حتى المشتركون تباطؤًا أو تأخيرات.

ومما يزيد الأمر تعقيدًا، اعترف Altman بمشكلة أخرى ذات صلة: كان النظام أحيانًا ‘يرفض بعض عمليات التوليد التي يجب السماح بها’. يشير هذا إلى أن الآليات الموضوعة لإدارة الحمل، أو ربما مرشحات الأمان الأساسية للنموذج، كانت مقيدة بشكل مفرط في بعض الأحيان، مما أدى إلى حظر الطلبات المشروعة. وأكد للمستخدمين أن الشركة تعمل على إصلاح هذا ‘بأسرع ما يمكن’، لكنه يشير إلى تحديات ضبط ضوابط الوصول وبروتوكولات الأمان تحت الضغط، وضمان عملها بشكل صحيح دون إعاقة المستخدمين بشكل غير مبرر. يجبر الوضع برمته المستخدمين، لا سيما أولئك الموجودين في الفئة المجانية، على أن يكونوا أكثر تعمدًا واقتصادًا في مطالبات توليد الصور الخاصة بهم، مما قد يخنق التجريب ذاته الذي جعل الميزة شائعة جدًا في البداية.

عملية الموازنة: التوفيق بين الابتكار والوصول وتكاليف البنية التحتية

مأزق OpenAI هو صورة مصغرة لتحدٍ أكبر يواجه قطاع الذكاء الاصطناعي بأكمله: الموازنة بين الدافع للتقدم التكنولوجي والوصول الواسع للمستخدمين مقابل التكاليف الكبيرة والقيود المادية للبنية التحتية الحاسوبية المطلوبة. يتطلب تطوير نماذج حديثة مثل GPT-4o استثمارًا هائلاً في البحث والتطوير. يتطلب نشر هذه النماذج على نطاق واسع، وإتاحتها لملايين المستخدمين على مستوى العالم، استثمارًا أكبر بكثير في الأجهزة - وتحديدًا، مزارع ضخمة من وحدات معالجة الرسومات (GPUs) عالية الأداء.

هذه الوحدات (GPUs) ليست باهظة الثمن للشراء فحسب (غالبًا ما تكلف آلاف أو عشرات الآلاف من الدولارات لكل منها)، ولكنها تستهلك أيضًا كميات هائلة من الكهرباء وتولد حرارة كبيرة، مما يستلزم أنظمة تبريد متطورة ويترتب عليه تكاليف تشغيل عالية. وبالتالي، فإن توفير الوصول المجاني إلى الميزات كثيفة الحوسبة مثل توليد الصور عالي الدقة يمثل تكلفة مباشرة وكبيرة للمزود.

يصبح نموذج ‘freemium’، الشائع في البرامج والخدمات عبر الإنترنت، صعبًا بشكل خاص مع الذكاء الاصطناعي المتعطش للموارد. في حين أن الفئات المجانية يمكن أن تجتذب قاعدة مستخدمين كبيرة وتجمع ملاحظات قيمة، فإن تكلفة خدمة هؤلاء المستخدمين المجانيين يمكن أن تصبح بسرعة غير مستدامة إذا كانت أنماط الاستخدام تتضمن حوسبة ثقيلة. يعد قرار OpenAI بتقييد عمليات توليد الصور المجانية إلى ثلاث عمليات يوميًا خطوة واضحة لإدارة هذه التكاليف وضمان الجدوى طويلة الأجل للخدمة. إنه يشجع المستخدمين الذين يجدون قيمة كبيرة في الميزة على الترقية إلى الفئات المدفوعة، وبالتالي المساهمة في الإيرادات اللازمة للحفاظ على البنية التحتية الأساسية وتوسيعها.

يشير وعد Altman بـ ‘العمل على جعلها أكثر كفاءة’ إلى جانب حاسم آخر في عملية الموازنة هذه: التحسين. قد يشمل ذلك تحسينات خوارزمية لجعل توليد الصور أقل تطلبًا من الناحية الحسابية، أو موازنة تحميل أفضل عبر مجموعات الخوادم، أو تطوير أجهزة أكثر تخصصًا (مثل رقائق تسريع الذكاء الاصطناعي المخصصة) يمكنها أداء هذه المهام بكفاءة أكبر من وحدات معالجة الرسومات (GPUs) ذات الأغراض العامة. ومع ذلك، تستغرق جهود التحسين هذه وقتًا وموارد، مما يجعل حدود المعدل المؤقتة إجراءً مؤقتًا ضروريًا. يعد الحادث بمثابة تذكير بأنه حتى بالنسبة للمؤسسات الممولة جيدًا في طليعة الذكاء الاصطناعي، تظل الحقائق المادية لقوة الحوسبة قيدًا حاسمًا، مما يفرض مقايضات صعبة بين الابتكار وإمكانية الوصول والاستدامة الاقتصادية.

المشهد الأوسع: تسابق عالمي على حوسبة الذكاء الاصطناعي

إن اختناق GPU الذي شهدته OpenAI ليس حادثًا معزولًا ولكنه بالأحرى عرض لاتجاه أكبر بكثير: تسابق عالمي على قوة حوسبة الذكاء الاصطناعي. مع ازدياد حجم نماذج الذكاء الاصطناعي وتعقيدها ودمجها بشكل أكبر في تطبيقات مختلفة، ارتفع الطلب بشكل كبير على الأجهزة المتخصصة اللازمة لتدريبها وتشغيلها. شهدت شركات مثل Nvidia، الشركة المصنعة المهيمنة لوحدات معالجة الرسومات (GPUs) المتطورة المستخدمة في الذكاء الاصطناعي، ارتفاعًا كبيرًا في تقييماتها حيث تتنافس عمالقة التكنولوجيا والشركات الناشئة والمؤسسات البحثية في جميع أنحاء العالم بشراسة على منتجاتها.

لهذا الطلب الشديد عدة آثار:

  1. قيود العرض: في بعض الأحيان، يتجاوز الطلب على وحدات معالجة الرسومات (GPUs) المتطورة العرض، مما يؤدي إلى فترات انتظار طويلة وتحديات في التخصيص، حتى بالنسبة للاعبين الرئيسيين.
  2. ارتفاع التكاليف: يساهم الطلب المرتفع والعرض المحدود في التكلفة الباهظة بالفعل للحصول على الأجهزة اللازمة، مما يخلق حاجزًا كبيرًا أمام دخول المؤسسات الصغيرة والباحثين.
  3. بناء البنية التحتية: تستثمر شركات التكنولوجيا الكبرى مليارات الدولارات في بناء مراكز بيانات ضخمة مليئة بوحدات معالجة الرسومات (GPUs) لتشغيل طموحاتها في مجال الذكاء الاصطناعي، مما يؤدي إلى استهلاك كبير للطاقة واعتبارات بيئية.
  4. الأبعاد الجيوسياسية: أصبح الوصول إلى تكنولوجيا أشباه الموصلات المتقدمة، بما في ذلك وحدات معالجة الرسومات (GPUs)، مسألة ذات أهمية وطنية استراتيجية، مما يؤثر على السياسات التجارية والعلاقات الدولية.
  5. الابتكار في الكفاءة: تدفع التكاليف المرتفعة ومتطلبات الطاقة البحث نحو معماريات وخوارزميات وأجهزة متخصصة (مثل TPUs من Google أو رقائق مخصصة من شركات أخرى) أكثر كفاءة من الناحية الحسابية ومصممة خصيصًا لأعباء عمل الذكاء الاصطناعي.

من الواضح أن OpenAI، على الرغم من مكانتها البارزة وشراكاتها العميقة (لا سيما مع Microsoft، المستثمر الرئيسي الذي يوفر موارد حوسبة سحابية كبيرة)، ليست محصنة ضد ضغوط الصناعة الأوسع هذه. يسلط حادث ‘ذوبان GPUs’ الضوء على أنه حتى المؤسسات ذات الموارد الكبيرة يمكن أن تواجه تحديات في السعة عندما تستحوذ ميزة جديدة ومرغوبة للغاية على خيال الجمهور على نطاق واسع. إنه يؤكد الأهمية الحاسمة لتخطيط البنية التحتية والحاجة المستمرة لتحقيق اختراقات في الكفاءة الحسابية للحفاظ على وتيرة التطور والنشر السريعة للذكاء الاصطناعي.

التطلع إلى الأمام: السعي نحو الكفاءة والتوسع المستدام

بينما كانت الاستجابة الفورية للطلب الهائل على توليد الصور في GPT-4o هي الضغط على المكابح من خلال تحديد المعدل (rate limiting)، أكد تعليق Sam Altman على هدف تطلعي: تعزيز الكفاءة. هذا السعي حاسم ليس فقط لاستعادة الوصول الأوسع ولكن للتوسع المستدام لقدرات الذكاء الاصطناعي القوية على المدى الطويل. يتوقف التصريح بأن القيود ‘نأمل ألا تطول’ على قدرة OpenAI على تحسين العملية، مما يجعل كل طلب لتوليد الصور أقل إرهاقًا لموارد GPU الخاصة بهم.

ماذا قد يستلزم ‘جعلها أكثر كفاءة’؟ هناك عدة طرق ممكنة:

  • تحسينات خوارزمية: يمكن للباحثين تطوير تقنيات جديدة أو تحسين الخوارزميات الحالية داخل نموذج توليد الصور نفسه، مما يمكنه من إنتاج نتائج عالية الجودة بخطوات حسابية أقل أو استخدام ذاكرة أقل.
  • تحسين النموذج: يمكن لتقنيات مثل تكميم النموذج (model quantization) (استخدام أرقام ذات دقة أقل للحسابات) أو التقليم (pruning) (إزالة الأجزاء الأقل أهمية من النموذج) أن تقلل من الحمل الحسابي دون التأثير بشكل كبير على جودة المخرجات.
  • تحسينات البنية التحتية: يمكن لبرامج أفضل لإدارة أعباء العمل عبر مجموعات GPU، وموازنة تحميل أكثر فعالية، أو ترقيات للبنية التحتية للشبكات داخل مراكز البيانات أن تساعد في توزيع المهام بشكل أكثر توازنًا ومنع ‘الانهيارات’ الموضعية.
  • تخصص الأجهزة: بينما تهيمن وحدات معالجة الرسومات (GPUs) حاليًا، تستكشف الصناعة باستمرار رقائق أكثر تخصصًا (ASICs أو FPGAs) مصممة خصيصًا لمهام الذكاء الاصطناعي، والتي يمكن أن تقدم أداءً أفضل لكل واط لعمليات معينة مثل توليد الصور. قد تستفيد OpenAI من الأجيال الأحدث من وحدات معالجة الرسومات أو ربما تستكشف حلول أجهزة مخصصة في المستقبل.
  • التخزين المؤقت وإعادة الاستخدام: يمكن لتطبيق آليات التخزين المؤقت الذكية أن يسمح للنظام بإعادة استخدام أجزاء من الحسابات أو العناصر التي تم إنشاؤها مسبقًا عندما تكون الطلبات متشابهة، مما يوفر المعالجة الزائدة عن الحاجة.

يعكس الالتزام بتحسين الكفاءة فهمًا بأن مجرد إلقاء المزيد من الأجهزة على المشكلة ليس دائمًا حلاً مستدامًا أو قابلاً للتطبيق اقتصاديًا على المدى الطويل. التحسين هو مفتاح إضفاء الطابع الديمقراطي على الوصول إلى أدوات الذكاء الاصطناعي المتقدمة بمسؤولية. بينما يواجه المستخدمون حاليًا قيودًا مؤقتة، فإن الرسالة الأساسية هي رسالة حل المشكلات النشط الذي يهدف إلى مواءمة قدرات التكنولوجيا مع الجوانب العملية لتقديمها بشكل موثوق وعلى نطاق واسع. ستحدد السرعة التي يمكن بها لـ OpenAI تحقيق هذه الكفاءات مدى سرعة إطلاق الإمكانات الكاملة لتوليد الصور في GPT-4o دون إغراق البنية التحتية التي تشغلها.