التدريب مقابل الاستدلال: وجهان لعملة الذكاء الاصطناعي
لفهم أهمية الاستدلال، من الضروري تمييزه عن نظيره: التدريب. تمر نماذج الذكاء الاصطناعي، وهي المحركات التي تدفع التطبيقات الذكية، بمرحلتين متميزتين.
التدريب: هذه هي المرحلة المكثفة حسابيًا حيث يتعلم نموذج الذكاء الاصطناعي من مجموعات بيانات ضخمة. فكر في الأمر على أنه النموذج الذي يلتحق بالمدرسة، ويمتص كميات هائلة من المعلومات لتطوير ذكائه. تتطلب هذه المرحلة قوة معالجة هائلة، وقد تفوقت وحدات معالجة الرسومات (GPUs) من Nvidia تاريخيًا هنا، حيث قدمت إمكانات المعالجة المتوازية اللازمة للتعامل مع العمليات الحسابية المعقدة المتضمنة في التدريب.
الاستدلال: بمجرد تدريب النموذج، يصبح جاهزًا للنشر والبدء في العمل. هذا هو المكان الذي يأتي فيه الاستدلال. الاستدلال هو عملية استخدام النموذج المدرب لعمل تنبؤات أو قرارات بناءً على بيانات جديدة. إنه مثل تخرج النموذج وتطبيق معرفته في العالم الحقيقي. في حين أن الاستدلال أقل تطلبًا من الناحية الحسابية من التدريب، إلا أنه يتطلب السرعة والكفاءة، وغالبًا ما يتطلب استهلاكًا منخفضًا للطاقة.
التمييز أمر بالغ الأهمية لأن متطلبات الأجهزة للتدريب والاستدلال تختلف اختلافًا كبيرًا. في حين هيمنت وحدات معالجة الرسومات من Nvidia على سوق التدريب، فإن سوق الاستدلال يقدم مشهدًا أكثر تنوعًا وتنافسية.
لماذا يكتسب الاستدلال زخمًا
تساهم عدة عوامل في الأهمية المتزايدة للاستدلال في سوق رقائق الذكاء الاصطناعي:
انتشار تطبيقات الذكاء الاصطناعي: لم يعد الذكاء الاصطناعي محصوراً في مختبرات الأبحاث وعمالقة التكنولوجيا. إنه يتغلغل بسرعة في كل جانب من جوانب حياتنا، من الهواتف الذكية والمنازل الذكية إلى المركبات ذاتية القيادة والتشخيص الطبي. هذا الانتشار الواسع يعني أن الاستدلال، وهو عملية استخدام نماذج الذكاء الاصطناعي فعليًا، يحدث على نطاق غير مسبوق.
الحوسبة الطرفية: يعد صعود الحوسبة الطرفية محركًا رئيسيًا آخر. تتضمن الحوسبة الطرفية معالجة البيانات بالقرب من المصدر، بدلاً من إرسالها إلى خوادم سحابية مركزية. يعد هذا أمرًا بالغ الأهمية للتطبيقات التي تتطلب استجابات في الوقت الفعلي، مثل السيارات ذاتية القيادة أو الأتمتة الصناعية. غالبًا ما تحتاج الأجهزة الطرفية، التي تعمل في بيئات مقيدة بالطاقة، إلى رقائق محسّنة للاستدلال منخفض الطاقة والفعال.
تحسين التكلفة: في حين أن تدريب نموذج الذكاء الاصطناعي هو تكلفة لمرة واحدة (أو غير متكررة)، فإن الاستدلال هو مصروف تشغيلي مستمر. مع توسع عمليات نشر الذكاء الاصطناعي، يمكن أن تصبح تكلفة الاستدلال كبيرة. يؤدي هذا إلى زيادة الطلب على الرقائق التي يمكنها إجراء الاستدلال بكفاءة أكبر، مما يقلل من استهلاك الطاقة وتكاليف التشغيل الإجمالية.
متطلبات زمن الوصول: تتطلب العديد من تطبيقات الذكاء الاصطناعي، خاصة تلك التي تنطوي على تفاعلات في الوقت الفعلي، زمن انتقال منخفض. هذا يعني أن الوقت الذي يستغرقه نموذج الذكاء الاصطناعي لمعالجة البيانات وإنشاء استجابة يجب أن يكون في حده الأدنى. تم تصميم الرقائق المحسّنة للاستدلال لتقليل زمن الانتقال هذا، مما يتيح تجارب ذكاء اصطناعي أسرع وأكثر استجابة.
نضوج نماذج الذكاء الاصطناعي: مع زيادة تطور نماذج الذكاء الاصطناعي وتخصصها، تزداد الحاجة إلى أجهزة استدلال محسّنة. قد لا تكون وحدات معالجة الرسومات ذات الأغراض العامة، على الرغم من أنها ممتازة للتدريب، هي الحل الأكثر كفاءة لتشغيل نماذج ذكاء اصطناعي محددة ومضبوطة للغاية.
ظهور المنافسين: مشهد متنوع
تجذب الأهمية المتزايدة للاستدلال موجة من المنافسين الحريصين على تحدي هيمنة Nvidia. تستخدم هذه الشركات استراتيجيات وتقنيات مختلفة للحصول على موطئ قدم في هذا السوق المزدهر:
الشركات الناشئة ذات البنى المتخصصة: تقوم العديد من الشركات الناشئة بتطوير رقائق مصممة خصيصًا للاستدلال. غالبًا ما تتميز هذه الرقائق ببنى جديدة محسّنة لأعباء عمل محددة للذكاء الاصطناعي، مثل معالجة اللغة الطبيعية أو رؤية الكمبيوتر. ومن الأمثلة على ذلك شركات مثل Graphcore و Cerebras Systems و SambaNova Systems. تراهن هذه الشركات على فكرة أن الأجهزة المتخصصة يمكن أن تتفوق على وحدات معالجة الرسومات ذات الأغراض العامة في مهام استدلال محددة.
الحلول القائمة على FPGA: توفر مصفوفات البوابات القابلة للبرمجة ميدانيًا (FPGAs) بديلاً مرنًا لوحدات معالجة الرسومات التقليدية والدوائر المتكاملة الخاصة بالتطبيقات (ASICs). يمكن إعادة برمجة FPGAs بعد التصنيع، مما يسمح بتكييفها مع نماذج وخوارزميات الذكاء الاصطناعي المختلفة. تستفيد شركات مثل Xilinx (الآن جزء من AMD) و Intel من FPGAs لتوفير حلول استدلال قابلة للتكيف وفعالة.
تطوير ASIC: ASICs هي رقائق مصممة خصيصًا ومصممة لغرض معين. في سياق الذكاء الاصطناعي، يمكن تصميم ASICs لتقديم أقصى أداء وكفاءة لأعباء عمل استدلال محددة. تعد وحدة معالجة Tensor (TPU) من Google، المستخدمة على نطاق واسع في مراكز البيانات الخاصة بها، مثالًا رئيسيًا على ASIC المصمم لكل من التدريب والاستدلال. تتابع شركات أخرى أيضًا تطوير ASIC لاكتساب ميزة تنافسية في سوق الاستدلال.
توسيع شركات تصنيع الرقائق الراسخة لعروض الذكاء الاصطناعي الخاصة بها: شركات تصنيع الرقائق التقليدية، مثل Intel و AMD و Qualcomm، لا تقف مكتوفة الأيدي. إنهم يعملون بنشاط على توسيع محافظ منتجاتهم لتشمل رقائق محسّنة لاستدلال الذكاء الاصطناعي. تستفيد Intel، على سبيل المثال، من خبرتها في وحدة المعالجة المركزية وتستحوذ على شركات متخصصة في مسرعات الذكاء الاصطناعي لتعزيز مكانتها. يوفر استحواذ AMD على Xilinx لها منصة قوية قائمة على FPGA للاستدلال. تقوم Qualcomm، الشركة الرائدة في معالجات الأجهزة المحمولة، بدمج إمكانات تسريع الذكاء الاصطناعي في رقائقها لتشغيل تطبيقات الذكاء الاصطناعي على الهواتف الذكية والأجهزة الطرفية الأخرى.
مزودو الخدمات السحابية يصممون رقائقهم الخاصة: يقوم مزودو الخدمات السحابية الرئيسيون، مثل Amazon Web Services (AWS) و Google Cloud، بتصميم رقائقهم المخصصة بشكل متزايد لأعباء عمل الذكاء الاصطناعي، بما في ذلك الاستدلال. تم تصميم شريحة Inferentia من AWS، على سبيل المثال، خصيصًا لتسريع الاستدلال في السحابة. يسمح هذا الاتجاه لموفري الخدمات السحابية بتحسين بنيتهم التحتية لاحتياجاتهم الخاصة وتقليل اعتمادهم على موردي الرقائق الخارجيين.
المعركة من أجل هيمنة الاستدلال: اعتبارات رئيسية
لا تقتصر المنافسة في سوق استدلال الذكاء الاصطناعي على قوة المعالجة الخام. هناك عدة عوامل أخرى حاسمة في تحديد النجاح:
النظام البيئي للبرمجيات: يعد النظام البيئي القوي للبرمجيات أمرًا ضروريًا لجذب المطورين وتسهيل نشر نماذج الذكاء الاصطناعي على شريحة معينة. كانت منصة CUDA من Nvidia، وهي منصة حوسبة متوازية ونموذج برمجة، ميزة رئيسية في سوق التدريب. يعمل المنافسون بجد لتطوير أدوات ومكتبات برمجية قوية لدعم أجهزتهم.
كفاءة الطاقة: كما ذكرنا سابقًا، تعد كفاءة الطاقة أمرًا بالغ الأهمية للعديد من تطبيقات الاستدلال، خاصة تلك الموجودة على الحافة. سيكون للرقائق التي يمكنها تقديم أداء عالٍ لكل واط ميزة كبيرة.
التكلفة: تعد تكلفة رقائق الاستدلال عاملاً رئيسيًا، خاصة بالنسبة لعمليات النشر واسعة النطاق. الشركات التي يمكنها تقديم أسعار تنافسية مع الحفاظ على الأداء ستكون في وضع جيد.
قابلية التوسع: تعد القدرة على توسيع نطاق عمليات نشر الاستدلال بكفاءة أمرًا بالغ الأهمية. لا يشمل هذا أداء الرقائق الفردية فحسب، بل يشمل أيضًا القدرة على توصيل وإدارة رقائق متعددة في مجموعة.
المرونة وقابلية البرمجة: في حين أن ASICs تقدم أداءً عاليًا لأعباء عمل محددة، إلا أنها تفتقر إلى مرونة وحدات معالجة الرسومات و FPGAs. تعد القدرة على التكيف مع نماذج وخوارزميات الذكاء الاصطناعي المتطورة اعتبارًا رئيسيًا للعديد من المستخدمين.
الأمان: مع الاستخدام المتزايد للذكاء الاصطناعي في التطبيقات الحساسة، مثل الرعاية الصحية والتمويل، أصبح الأمان أمرًا بالغ الأهمية.
مستقبل الاستدلال: مشهد متعدد الأوجه
يستعد سوق الاستدلال لنمو وتنويع كبيرين. من غير المرجح أن تهيمن شركة واحدة بالطريقة التي هيمنت بها Nvidia في مجال التدريب. بدلاً من ذلك، من المحتمل أن نشهد مشهدًا متعدد الأوجه مع بنيات رقائق مختلفة وبائعين يلبيون احتياجات وتطبيقات محددة.
ستكون المنافسة شرسة، مما يدفع الابتكار ويدفع حدود ما هو ممكن مع الذكاء الاصطناعي. سيفيد هذا المستخدمين في النهاية، مما يؤدي إلى حلول ذكاء اصطناعي أسرع وأكثر كفاءة وبأسعار معقولة. إن صعود الاستدلال لا يقتصر فقط على تحدي هيمنة Nvidia؛ يتعلق الأمر بإطلاق العنان للإمكانات الكاملة للذكاء الاصطناعي وجعله في متناول مجموعة واسعة من التطبيقات والصناعات. ستكون السنوات القادمة فترة حاسمة لهذا الجزء الحيوي من سوق رقائق الذكاء الاصطناعي، مما يشكل مستقبل كيفية نشر الذكاء الاصطناعي واستخدامه في جميع أنحاء العالم.