استراتيجية Ant Group المتنوعة لرقائق الذكاء الاصطناعي

في ساحة تطوير الذكاء الاصطناعي عالية المخاطر، غالبًا ما يحدد الوصول إلى تكنولوجيا أشباه الموصلات المتطورة وتيرة الابتكار. بالنسبة لعمالقة التكنولوجيا الصينيين، أصبح هذا الوصول معقدًا بشكل متزايد، متأثرًا بالتوترات الجيوسياسية وضوابط التصدير الصارمة التي تفرضها الولايات المتحدة (United States). وسط هذا المشهد المليء بالتحديات، ترسم Ant Group، القوة المالية التكنولوجية التابعة لـ Alibaba، مسارًا مميزًا. تقوم الشركة بنشر مزيج استراتيجي غير متجانس من أشباه الموصلات، مصدرها موردون أمريكيون ومحليون، لدعم طموحاتها في مجال الذكاء الاصطناعي، مع التركيز بشكل خاص على تعزيز كفاءة وفعالية تكلفة تدريب نماذج الذكاء الاصطناعي المعقدة.

هذا النهج المحسوب هو أكثر من مجرد حل تقني بديل؛ إنه يمثل تكيفًا استراتيجيًا أساسيًا. من خلال الدمج المتعمد للرقائق من مختلف الشركات المصنعة، بما في ذلك البدائل المحلية، تهدف Ant Group إلى التخفيف من المخاطر المرتبطة باضطرابات سلسلة التوريد وتقليل اعتمادها على أي بائع واحد، خاصة أولئك الخاضعين لقيود التجارة الدولية. هذا التنويع أمر بالغ الأهمية لضمان استمرارية ومرونة خط أنابيب البحث والتطوير في مجال الذكاء الاصطناعي الخاص بها. الهدف الأساسي ذو شقين: الحفاظ على الزخم في ابتكار الذكاء الاصطناعي مع تحسين التكاليف الكبيرة المرتبطة عادةً بتدريب النماذج واسعة النطاق.

قوة التخصص: تبني مزيج الخبراء (MoE)

تعتبر بنية الذكاء الاصطناعي المتقدمة المعروفة باسم مزيج الخبراء (Mixture of Experts - MoE) محورية في استراتيجية الأجهزة الخاصة بـ Ant Group. تمثل هذه التقنية خروجًا كبيرًا عن نماذج الذكاء الاصطناعي التقليدية المتجانسة، حيث تحاول شبكة عصبية ضخمة واحدة تعلم ومعالجة جميع جوانب مهمة معينة. على النقيض من ذلك، يستخدم نهج MoE بنية أكثر توزيعًا وتخصصًا. إنه يعمل إلى حد كبير مثل لجنة من المتخصصين بدلاً من متخصص عام واحد.

تخيل مشكلة معقدة تتطلب معرفة متنوعة. بدلاً من الاعتماد على موسوعي واحد، تقوم بتجميع فريق: عالم رياضيات، ولغوي، ومؤرخ، وربما فيزيائي. تعمل ‘شبكة البوابة’ (gating network) كمرسل، حيث تحلل المهام الواردة أو نقاط البيانات وتوجهها بذكاء إلى نموذج ‘الخبير’ (expert) الأنسب داخل النظام الأكبر. يتم تدريب كل نموذج خبير للتفوق في أنواع معينة من المدخلات أو المهام الفرعية. على سبيل المثال، في نموذج لغوي، قد يتخصص أحد الخبراء في فهم المصطلحات التقنية، وآخر في أساليب الكتابة الإبداعية، وثالث في الحوار التخاطبي.

تكمن الميزة الرئيسية لهذا التصميم المعياري في كفاءته الحسابية. أثناء التدريب أو الاستدلال (عندما يقوم النموذج بعمل تنبؤات)، يتم تنشيط نماذج الخبراء ذات الصلة وشبكة البوابة فقط لمدخل معين. يتناقض هذا الحساب الانتقائي بشكل حاد مع النماذج الكثيفة حيث يجب إشراك الشبكة بأكملها، بملياراتها أو حتى تريليوناتها من المعلمات، لكل عملية حسابية واحدة. وبالتالي، يمكن لنماذج MoE تحقيق أداء مماثل أو حتى متفوق لنظيراتها الكثيفة مع الحاجة إلى طاقة حاسوبية أقل بكثير، وبالتالي طاقة أقل.

استفادت Ant Group من هذه الميزة المعمارية بفعالية. أظهرت الأبحاث الداخلية والتطبيقات العملية أن MoE يسمح للشركة بتحقيق نتائج تدريب قوية حتى عند استخدام أجهزة أقل قوة أو متاحة بسهولة أكبر أو أقل تكلفة. وفقًا للنتائج التي شاركتها الشركة، مكّن هذا التنفيذ الاستراتيجي لـ MoE من تحقيق تخفيض ملحوظ بنسبة 20٪ في تكاليف الحوسبة المرتبطة بتدريب نماذج الذكاء الاصطناعي الخاصة بها. هذا التحسين في التكلفة ليس مجرد توفير تدريجي؛ إنه عامل تمكين استراتيجي، يسمح لـ Ant بمتابعة مشاريع الذكاء الاصطناعي الطموحة دون الاعتماد بالضرورة فقط على وحدات معالجة الرسومات (GPUs) الأغلى ثمناً والأعلى مستوى والتي يصعب على الشركات الصينية الحصول عليها بشكل متزايد. تعالج هذه الكفاءة المكتسبة بشكل مباشر قيود الأجهزة التي تفرضها البيئة الخارجية.

نسيج من السيليكون: محفظة أجهزة Ant

يتضمن التنفيذ العملي لاستراتيجية Ant Group التنقل في مشهد معقد لأشباه الموصلات. يقال إن البنية التحتية لتدريب الذكاء الاصطناعي للشركة مدعومة بمجموعة متنوعة من الرقائق، مما يعكس التزامها بالمرونة والصلابة. يشمل ذلك السيليكون المصمم داخليًا من قبل شركتها التابعة، Alibaba، والذي يشير على الأرجح إلى الرقائق التي طورتها وحدة T-Head لأشباه الموصلات التابعة لـ Alibaba. علاوة على ذلك، تدمج Ant رقائق من Huawei، وهي شركة تكنولوجيا صينية عملاقة أخرى استثمرت بكثافة في تطوير مسرعات الذكاء الاصطناعي الخاصة بها (مثل سلسلة Ascend) استجابة للعقوبات الأمريكية (US).

بينما استخدمت Ant Group تاريخيًا وحدات معالجة الرسومات (GPUs) عالية الأداء من Nvidia، الشركة الرائدة بلا منازع في سوق تدريب الذكاء الاصطناعي، فإن ضوابط التصدير الأمريكية (US) المتطورة استلزمت تحولًا. تقيد هذه اللوائح على وجه التحديد بيع مسرعات الذكاء الاصطناعي الأكثر تقدمًا للكيانات الصينية، مشيرة إلى مخاوف تتعلق بالأمن القومي. على الرغم من أن Nvidia لا تزال قادرة على توريد رقائق ذات مواصفات أقل للسوق الصينية، يبدو أن Ant Group تعمل بنشاط على توسيع قاعدة مورديها للتعويض عن الوصول المحدود إلى منتجات Nvidia من الدرجة الأولى.

يتميز هذا التنويع بشكل بارز برقائق من Advanced Micro Devices (AMD). برزت AMD كمنافس مهم لـ Nvidia في مجال الحوسبة عالية الأداء والذكاء الاصطناعي، حيث تقدم وحدات معالجة رسومات قوية تمثل بديلاً قابلاً للتطبيق لأعباء عمل معينة. من خلال دمج أجهزة AMD جنبًا إلى جنب مع الخيارات المحلية من Alibaba و Huawei، تبني Ant بيئة حوسبة غير متجانسة. يوفر هذا النهج المختلط، على الرغم من أنه قد يضيف تعقيدًا في تحسين البرامج وإدارة أعباء العمل، مرونة حاسمة. يسمح للشركة بتكييف استخدام أجهزتها بناءً على التوفر والتكلفة والمتطلبات الحسابية المحددة لنماذج ومهام الذكاء الاصطناعي المختلفة، وبالتالي تجاوز الاختناقات الناجمة عن الاعتماد على مصدر واحد مقيد.

خلفية هذه الاستراتيجية هي الشبكة المعقدة لضوابط التصدير الأمريكية (US). تم تشديد هذه الإجراءات تدريجياً، بهدف كبح تقدم China في تصنيع أشباه الموصلات المتقدمة وتطوير الذكاء الاصطناعي. بينما ركزت في البداية على الرقائق ذات النهاية الأعلى المطلقة، تطورت القيود، مما أثر على مجموعة أوسع من الأجهزة ومعدات تصنيع أشباه الموصلات. اضطرت Nvidia، على سبيل المثال، إلى إنشاء إصدارات محددة ذات أداء أقل من رقائق الذكاء الاصطناعي الرائدة (مثل A800 و H800، المشتقة من A100 و H100) للسوق الصينية للامتثال لهذه اللوائح. تعد استراتيجية Ant المتمثلة في تبني بدائل من AMD واللاعبين المحليين استجابة مباشرة وعملية لهذا الضغط التنظيمي، مما يدل على محاولة للحفاظ على القدرة التنافسية في مجال الذكاء الاصطناعي ضمن القيود المفروضة.

الذكاء الاصطناعي قيد التنفيذ: تحويل خدمات الرعاية الصحية

لا تعد التطورات التي حققتها Ant Group في كفاءة الذكاء الاصطناعي مجرد تمارين نظرية؛ بل يتم ترجمتها بنشاط إلى تطبيقات واقعية، مع التركيز بشكل ملحوظ على قطاع الرعاية الصحية. كشفت الشركة مؤخرًا عن تحسينات كبيرة في حلول الذكاء الاصطناعي المصممة خصيصًا للرعاية الصحية، مما يؤكد التأثير العملي لاستراتيجيتها التكنولوجية الأساسية.

يقال إن قدرات الذكاء الاصطناعي المطورة هذه قيد الاستخدام بالفعل في العديد من مؤسسات الرعاية الصحية البارزة في المدن الصينية الكبرى، بما في ذلك Beijing و Shanghai و Hangzhou (مقر Ant) و Ningbo. تستفيد سبع مستشفيات ومنظمات رعاية صحية كبرى من الذكاء الاصطناعي الخاص بـ Ant لتحسين جوانب مختلفة من عملياتها ورعاية المرضى.

يعتبر أساس نموذج الذكاء الاصطناعي للرعاية الصحية الخاص بـ Ant مثالاً على الابتكار التعاوني والاستفادة من نقاط القوة التكنولوجية المتنوعة. إنه مبني على مزيج من نماذج اللغات الكبيرة (LLMs) القوية:

  • نماذج R1 و V3 من DeepSeek: DeepSeek هي شركة أبحاث صينية بارزة في مجال الذكاء الاصطناعي معروفة بتطوير نماذج مفتوحة المصدر قادرة، وغالبًا ما تحقق معايير أداء قوية.
  • Qwen من Alibaba: هذه هي عائلة نماذج اللغات الكبيرة الخاصة التي طورتها Alibaba، الشركة التابعة لـ Ant، والتي تغطي مجموعة من الأحجام والقدرات.
  • نموذج BaiLing الخاص بـ Ant: يشير هذا إلى الجهود الداخلية لـ Ant Group في تطوير نماذج ذكاء اصطناعي مخصصة مصممة لاحتياجاتها الخاصة، ومن المحتمل أن تتضمن بيانات وخبرات مالية وربما خاصة بالرعاية الصحية.

يسمح هذا الأساس متعدد النماذج لحل الذكاء الاصطناعي للرعاية الصحية بالاعتماد على قاعدة واسعة من المعرفة والقدرات. وفقًا لـ Ant Group، فإن النظام بارع في معالجة الاستفسارات حول مجموعة واسعة من الموضوعات الطبية، ومن المحتمل أن يكون بمثابة أداة قيمة لكل من المتخصصين في الرعاية الصحية الذين يبحثون عن معلومات سريعة والمرضى الذين يبحثون عن معرفة طبية عامة (على الرغم من أن التحديد الدقيق لدوره مقابل المشورة الطبية المهنية أمر بالغ الأهمية).

بالإضافة إلى استرجاع المعلومات، تذكر الشركة أن نموذج الذكاء الاصطناعي مصمم لتعزيز خدمات المرضى. بينما تظهر تفاصيل محددة، يمكن أن يشمل ذلك مجموعة من التطبيقات، مثل:

  • الفرز الذكي: المساعدة في تحديد أولويات احتياجات المرضى بناءً على الأعراض الموصوفة.
  • جدولة المواعيد وإدارتها: أتمتة وتحسين عملية الحجز.
  • المتابعة بعد الخروج من المستشفى: توفير تذكيرات آلية أو التحقق من تقدم تعافي المرضى.
  • الدعم الإداري: مساعدة موظفي الرعاية الصحية في مهام التوثيق أو التلخيص أو إدخال البيانات، مما يوفر الوقت للرعاية المباشرة للمرضى.

يمثل النشر في المستشفيات الكبرى خطوة حاسمة في التحقق من فائدة التكنولوجيا والتنقل في تعقيدات مجال الرعاية الصحية، والذي يتضمن متطلبات صارمة للدقة والموثوقية وخصوصية البيانات.

رسم مسار يتجاوز وحدات معالجة الرسومات المتميزة

بالنظر إلى المستقبل، يبدو أن استراتيجية Ant Group تتماشى مع طموح أوسع داخل صناعة التكنولوجيا الصينية: تحقيق أداء متطور في الذكاء الاصطناعي دون الاعتماد فقط على وحدات معالجة الرسومات (GPUs) الأكثر تقدمًا، والتي غالبًا ما تكون مقيدة. يقال إن الشركة تخطط لمحاكاة المسار الذي سلكته منظمات مثل DeepSeek، مع التركيز على طرق لتوسيع نطاق نماذج الذكاء الاصطناعي عالية الأداء ‘بدون وحدات معالجة رسومات متميزة’.

يشير هذا الطموح إلى الاعتقاد بأن الابتكارات المعمارية (مثل MoE)، وتحسينات البرامج، والاستخدام الذكي للأجهزة المتنوعة، التي قد تكون أقل قوة، يمكنها مجتمعة سد فجوة الأداء الناتجة عن الوصول المحدود إلى السيليكون من الدرجة الأولى. إنها استراتيجية ولدت جزئيًا من الضرورة بسبب ضوابط التصدير، ولكنها تعكس أيضًا مسارًا مستدامًا محتملاً نحو تطوير ذكاء اصطناعي أكثر فعالية من حيث التكلفة وديمقراطية.

يتضمن تحقيق هذا الهدف استكشاف طرق مختلفة تتجاوز مجرد MoE:

  • الكفاءة الخوارزمية: تطوير خوارزميات ذكاء اصطناعي جديدة تتطلب طاقة حاسوبية أقل للتدريب والاستدلال.
  • تقنيات تحسين النموذج: استخدام طرق مثل التكميم (quantization) (تقليل دقة الأرقام المستخدمة في الحسابات) والتقليم (pruning) (إزالة الأجزاء الزائدة من الشبكة العصبية) لجعل النماذج أصغر وأسرع دون فقدان كبير في الأداء.
  • أطر العمل البرمجية: إنشاء برامج متطورة يمكنها إدارة وتوزيع أعباء عمل الذكاء الاصطناعي بكفاءة عبر بيئات الأجهزة غير المتجانسة، مما يزيد من استخدام موارد الحوسبة المتاحة.
  • الأجهزة المحلية المتخصصة: الاستثمار المستمر واستخدام مسرعات الذكاء الاصطناعي التي طورتها شركات صينية مثل Huawei (Ascend) و Alibaba (T-Head) وربما غيرها، المصممة خصيصًا لمهام الذكاء الاصطناعي.

قد يكون لسعي Ant Group في هذا المسار، جنبًا إلى جنب مع آخرين في النظام البيئي التكنولوجي في China، آثار كبيرة. إذا نجحت، فقد تثبت أن الريادة في الذكاء الاصطناعي لا تعتمد فقط على الوصول إلى أسرع الرقائق المطلقة، ولكنها تتوقف أيضًا على الابتكار في البرامج والبنية وتحسين مستوى النظام. إنه يمثل جهدًا حازمًا لبناء قدرة ذكاء اصطناعي مرنة ومكتفية ذاتيًا، والتنقل في تعقيدات المشهد التكنولوجي العالمي الحالي من خلال التنويع الاستراتيجي والابتكار المستمر. يُظهر دمج أشباه الموصلات الأمريكية (US) والصينية، المحسّن من خلال تقنيات مثل MoE والمطبق على قطاعات حيوية مثل الرعاية الصحية، نهجًا عمليًا وقابلاً للتكيف للحفاظ على تقدم الذكاء الاصطناعي تحت الضغط.