راهبرد متنوع نیمه‌هادی Ant Group در هوش مصنوعی

در عرصه پرمخاطره توسعه هوش مصنوعی، دسترسی به فناوری پیشرفته نیمه‌هادی اغلب سرعت نوآوری را تعیین می‌کند. برای غول‌های فناوری چینی، این دسترسی به طور فزاینده‌ای پیچیده شده و تحت تأثیر تنش‌های ژئوپلیتیکی و کنترل‌های صادراتی سختگیرانه اعمال شده توسط ایالات متحده (United States) قرار گرفته است. در میان این چشم‌انداز چالش‌برانگیز، Ant Group، غول فین‌تک وابسته به Alibaba، در حال پیمودن مسیری متمایز است. این شرکت به طور استراتژیک از ترکیبی ناهمگن از نیمه‌هادی‌ها، که هم از تأمین‌کنندگان آمریکایی و هم داخلی تهیه شده‌اند، برای پیشبرد جاه‌طلبی‌های هوش مصنوعی خود استفاده می‌کند، به ویژه با تمرکز بر افزایش کارایی و مقرون‌به‌صرفه بودن آموزش مدل‌های پیچیده هوش مصنوعی.

این رویکرد حساب‌شده چیزی بیش از یک راه‌حل فنی است؛ این نشان‌دهنده یک انطباق استراتژیک بنیادین است. Ant Group با ادغام عمدی تراشه‌های سازندگان مختلف، از جمله جایگزین‌های داخلی، قصد دارد خطرات مرتبط با اختلالات زنجیره تأمین را کاهش داده و وابستگی خود را به هر فروشنده واحد، به ویژه آنهایی که مشمول محدودیت‌های تجاری بین‌المللی هستند، کم کند. این تنوع‌بخشی برای تضمین تداوم و انعطاف‌پذیری خط لوله تحقیق و توسعه هوش مصنوعی آن حیاتی است. هدف اصلی دوگانه است: حفظ شتاب در نوآوری هوش مصنوعی و بهینه‌سازی همزمان هزینه‌های قابل توجهی که معمولاً با آموزش مدل‌های مقیاس بزرگ مرتبط است.

قدرت تخصص‌گرایی: استقبال از ترکیب متخصصان (MoE)

محور استراتژی سخت‌افزاری Ant Group، اتخاذ یک معماری پیشرفته هوش مصنوعی موسوم به ترکیب متخصصان (Mixture of Experts - MoE) است. این تکنیک نشان‌دهنده یک انحراف قابل توجه از مدل‌های هوش مصنوعی یکپارچه سنتی است، جایی که یک شبکه عصبی عظیم و منفرد تلاش می‌کند تمام جنبه‌های یک کار معین را یاد بگیرد و مدیریت کند. رویکرد MoE، در مقابل، از ساختاری توزیع‌شده‌تر و تخصصی‌تر استفاده می‌کند. این بسیار شبیه به کمیته‌ای از متخصصان عمل می‌کند تا یک فرد همه‌فن‌حریف.

یک مسئله پیچیده را تصور کنید که به دانش متنوعی نیاز دارد. به جای تکیه بر یک دانشمند همه‌چیزدان، شما تیمی را گرد هم می‌آورید: یک ریاضیدان، یک زبان‌شناس، یک مورخ و شاید یک فیزیکدان. یک ‘شبکه دروازه’ (gating network) به عنوان یک توزیع‌کننده عمل می‌کند، وظایف یا نقاط داده ورودی را تجزیه و تحلیل کرده و هوشمندانه آنها را به مناسب‌ترین مدل ‘متخصص’ در سیستم بزرگتر هدایت می‌کند. هر مدل متخصص برای برتری در انواع خاصی از ورودی‌ها یا وظایف فرعی آموزش دیده است. به عنوان مثال، در یک مدل زبانی، یک متخصص ممکن است در درک اصطلاحات فنی تخصص داشته باشد، دیگری در سبک‌های نوشتاری خلاقانه، و سومی در گفتگوی محاوره‌ای.

مزیت کلیدی این طراحی ماژولار در کارایی محاسباتی آن نهفته است. در طول آموزش یا استنتاج (inference) (زمانی که مدل پیش‌بینی می‌کند)، فقط مدل‌های متخصص مربوطه و شبکه دروازه برای یک ورودی معین فعال می‌شوند. این محاسبات انتخابی در تضاد کامل با مدل‌های متراکم (dense models) قرار دارد که در آن کل شبکه، با میلیاردها یا حتی تریلیون‌ها پارامتر، باید برای هر محاسبه واحد درگیر شود. در نتیجه، مدل‌های MoE می‌توانند عملکرد قابل مقایسه یا حتی برتری نسبت به همتایان متراکم خود داشته باشند در حالی که به قدرت محاسباتی و در نتیجه انرژی بسیار کمتری نیاز دارند.

Ant Group از این مزیت معماری به طور مؤثر استفاده کرده است. تحقیقات داخلی و کاربرد عملی نشان داده است که MoE به شرکت اجازه می‌دهد تا حتی هنگام استفاده از سخت‌افزارهای کم‌قدرت‌تر، در دسترس‌تر یا ارزان‌تر، به نتایج آموزشی قوی دست یابد. طبق یافته‌های به اشتراک گذاشته شده توسط شرکت، این پیاده‌سازی استراتژیک MoE منجر به کاهش قابل توجه ۲۰ درصدی در هزینه‌های محاسباتی مرتبط با آموزش مدل‌های هوش مصنوعی آن شده است. این بهینه‌سازی هزینه صرفاً یک صرفه‌جویی تدریجی نیست؛ بلکه یک توانمندساز استراتژیک است که به Ant اجازه می‌دهد پروژه‌های بلندپروازانه هوش مصنوعی را دنبال کند بدون اینکه لزوماً فقط به گران‌ترین واحدهای پردازش گرافیکی (GPUs) سطح بالا که تهیه آنها برای شرکت‌های چینی به طور فزاینده‌ای دشوار شده است، تکیه کند. این افزایش کارایی مستقیماً به محدودیت‌های سخت‌افزاری تحمیل شده توسط محیط خارجی پاسخ می‌دهد.

ملیله‌ای از سیلیکون: سبد سخت‌افزاری Ant

پیاده‌سازی عملی استراتژی Ant Group شامل پیمایش در چشم‌انداز پیچیده نیمه‌هادی‌ها است. زیرساخت آموزش هوش مصنوعی این شرکت بنا بر گزارش‌ها توسط مجموعه‌ای متنوع از تراشه‌ها تأمین می‌شود که نشان‌دهنده تعهد آن به انعطاف‌پذیری و تاب‌آوری است. این شامل سیلیکون طراحی شده داخلی توسط شرکت وابسته آن، Alibaba، احتمالاً با اشاره به تراشه‌های توسعه یافته توسط واحد نیمه‌هادی T-Head Alibaba است. علاوه بر این، Ant تراشه‌هایی از Huawei، یکی دیگر از غول‌های فناوری چینی که در پاسخ به تحریم‌های ایالات متحده (US) به شدت در توسعه شتاب‌دهنده‌های هوش مصنوعی خود (مانند سری Ascend) سرمایه‌گذاری کرده است، را در بر می‌گیرد.

در حالی که Ant Group در گذشته از GPUهای با کارایی بالا از Nvidia، رهبر بی‌چون‌وچرای بازار آموزش هوش مصنوعی، استفاده می‌کرد، کنترل‌های صادراتی در حال تحول ایالات متحده (US) نیاز به تغییر را ایجاب کرده است. این مقررات به طور خاص فروش پیشرفته‌ترین شتاب‌دهنده‌های هوش مصنوعی به نهادهای چینی را با استناد به نگرانی‌های امنیت ملی محدود می‌کند. اگرچه Nvidia همچنان می‌تواند تراشه‌های با مشخصات پایین‌تر را به بازار چین عرضه کند، به نظر می‌رسد Ant Group فعالانه در حال گسترش پایگاه تأمین‌کنندگان خود برای جبران دسترسی محدود به محصولات سطح بالای Nvidia است.

این تنوع‌بخشی به طور برجسته‌ای شامل تراشه‌های Advanced Micro Devices (AMD) می‌شود. AMD به عنوان یک رقیب قابل توجه برای Nvidia در فضای محاسبات با کارایی بالا و هوش مصنوعی ظهور کرده است و GPUهای قدرتمندی را ارائه می‌دهد که جایگزین مناسبی برای برخی بارهای کاری هستند. Ant با گنجاندن سخت‌افزار AMD در کنار گزینه‌های داخلی از Alibaba و Huawei، یک محیط محاسباتی ناهمگن ایجاد می‌کند. این رویکرد ترکیبی (mix-and-match)، در حالی که به طور بالقوه پیچیدگی در بهینه‌سازی نرم‌افزار و مدیریت بار کاری را افزایش می‌دهد، انعطاف‌پذیری حیاتی را فراهم می‌کند. این به شرکت اجازه می‌دهد تا استفاده از سخت‌افزار خود را بر اساس در دسترس بودن، هزینه و نیازهای محاسباتی خاص مدل‌ها و وظایف مختلف هوش مصنوعی تنظیم کند و بدین ترتیب تنگناهای ناشی از اتکا به یک منبع واحد و محدود را دور بزند.

پس‌زمینه این استراتژی، شبکه پیچیده کنترل‌های صادراتی ایالات متحده (US) است. این اقدامات به تدریج تشدید شده‌اند و هدف آن مهار پیشرفت چین در تولید نیمه‌هادی‌های پیشرفته و توسعه هوش مصنوعی است. در حالی که در ابتدا بر روی تراشه‌های مطلقاً سطح بالا متمرکز بود، محدودیت‌ها تکامل یافته و طیف وسیع‌تری از سخت‌افزار و تجهیزات تولید نیمه‌هادی را تحت تأثیر قرار داده‌اند. به عنوان مثال، Nvidia مجبور شده است نسخه‌های خاص و با عملکرد پایین‌تر از تراشه‌های پرچمدار هوش مصنوعی خود (مانند A800 و H800، مشتق شده از A100 و H100) را برای بازار چین ایجاد کند تا با این مقررات مطابقت داشته باشد. استراتژی Ant در استقبال از جایگزین‌های AMD و بازیگران داخلی، پاسخی مستقیم و عمل‌گرایانه به این فشار نظارتی است که تلاشی برای حفظ رقابت‌پذیری هوش مصنوعی در چارچوب محدودیت‌های موجود را نشان می‌دهد.

هوش مصنوعی در عمل: تحول خدمات بهداشتی و درمانی

پیشرفت‌های Ant Group در کارایی هوش مصنوعی صرفاً تمرین‌های نظری نیستند؛ آنها به طور فعال در حال تبدیل شدن به کاربردهای دنیای واقعی هستند، با تمرکز قابل توجه بر بخش مراقبت‌های بهداشتی. این شرکت اخیراً پیشرفت‌های قابل توجهی را در راه‌حل‌های هوش مصنوعی خود که برای مراقبت‌های بهداشتی طراحی شده‌اند، رونمایی کرد و بر تأثیر عملی استراتژی فناوری زیربنایی خود تأکید کرد.

گفته می‌شود این قابلیت‌های ارتقا یافته هوش مصنوعی در حال حاضر در چندین موسسه برجسته مراقبت‌های بهداشتی در شهرهای بزرگ چین، از جمله Beijing، Shanghai، Hangzhou (مقر Ant) و Ningbo در حال استفاده هستند. هفت بیمارستان و سازمان مراقبت‌های بهداشتی بزرگ از هوش مصنوعی Ant برای بهبود جنبه‌های مختلف عملیات و مراقبت از بیمار خود استفاده می‌کنند.

اساس مدل هوش مصنوعی مراقبت‌های بهداشتی Ant خود نمونه‌ای از نوآوری مشترک و بهره‌گیری از نقاط قوت فناورانه متنوع است. این مدل بر اساس ترکیبی از مدل‌های زبان بزرگ (LLMs) قدرتمند ساخته شده است:

  • مدل‌های R1 و V3 DeepSeek: DeepSeek یک شرکت تحقیقاتی برجسته هوش مصنوعی چینی است که به دلیل توسعه مدل‌های منبع باز توانمند، که اغلب به معیارهای عملکرد قوی دست می‌یابند، شناخته شده است.
  • Qwen Alibaba: این خانواده مدل‌های زبان بزرگ اختصاصی است که توسط شرکت وابسته Ant، یعنی Alibaba، توسعه یافته و طیف وسیعی از اندازه‌ها و قابلیت‌ها را پوشش می‌دهد.
  • مدل BaiLing خود Ant: این نشان‌دهنده تلاش‌های داخلی Ant Group در توسعه مدل‌های هوش مصنوعی سفارشی متناسب با نیازهای خاص خود است که احتمالاً داده‌ها و تخصص‌های مالی و بالقوه ویژه مراقبت‌های بهداشتی را در بر می‌گیرد.

این پایه چند مدلی به راه‌حل هوش مصنوعی مراقبت‌های بهداشتی اجازه می‌دهد تا از پایگاه گسترده‌ای از دانش و قابلیت‌ها بهره‌مند شود. به گفته Ant Group، این سیستم در پاسخگویی به پرسش‌ها در مورد طیف گسترده‌ای از موضوعات پزشکی مهارت دارد و به طور بالقوه به عنوان ابزاری ارزشمند هم برای متخصصان مراقبت‌های بهداشتی که به دنبال اطلاعات سریع هستند و هم برای بیمارانی که به دنبال دانش عمومی پزشکی هستند (اگرچه تعیین دقیق نقش آن در مقابل مشاوره پزشکی حرفه‌ای حیاتی است) عمل می‌کند.

فراتر از بازیابی اطلاعات، این شرکت بیان می‌کند که مدل هوش مصنوعی برای بهبود خدمات بیمار طراحی شده است. در حالی که جزئیات خاص در حال ظهور هستند، این می‌تواند طیف وسیعی از کاربردها را در بر گیرد، مانند:

  • تریاژ هوشمند: کمک به اولویت‌بندی نیازهای بیمار بر اساس علائم توصیف شده.
  • زمان‌بندی و مدیریت قرار ملاقات: خودکارسازی و بهینه‌سازی فرآیند رزرو.
  • پیگیری پس از ترخیص: ارائه یادآوری‌های خودکار یا بررسی پیشرفت بهبودی بیماران.
  • پشتیبانی اداری: کمک به کارکنان مراقبت‌های بهداشتی در مستندسازی، خلاصه‌سازی یا وظایف ورود داده‌ها، و آزاد کردن زمان برای مراقبت مستقیم از بیمار.

استقرار در بیمارستان‌های بزرگ گامی حیاتی در تأیید سودمندی فناوری و پیمایش پیچیدگی‌های حوزه مراقبت‌های بهداشتی است که شامل الزامات سختگیرانه برای دقت، قابلیت اطمینان و حریم خصوصی داده‌ها می‌شود.

ترسیم مسیری فراتر از GPUهای ممتاز

با نگاه به آینده، به نظر می‌رسد استراتژی Ant Group با جاه‌طلبی گسترده‌تری در صنعت فناوری چین همسو است: دستیابی به عملکرد پیشرفته هوش مصنوعی بدون اتکای صرف به پیشرفته‌ترین و اغلب محدود شده‌ترین GPUها. بنا بر گزارش‌ها، این شرکت قصد دارد مسیر طی شده توسط سازمان‌هایی مانند DeepSeek را تقلید کند و بر روش‌هایی برای مقیاس‌بندی مدل‌های هوش مصنوعی با کارایی بالا ‘بدون GPUهای ممتاز’ تمرکز کند.

این جاه‌طلبی نشان‌دهنده این باور است که نوآوری‌های معماری (مانند MoE)، بهینه‌سازی‌های نرم‌افزاری، و استفاده هوشمندانه از سخت‌افزارهای متنوع و بالقوه کم‌قدرت‌تر می‌توانند به طور جمعی شکاف عملکردی ایجاد شده توسط دسترسی محدود به سیلیکون سطح بالا را پر کنند. این استراتژی تا حدی ناشی از ضرورت به دلیل کنترل‌های صادراتی است، اما همچنین منعکس‌کننده مسیری بالقوه پایدار به سوی توسعه هوش مصنوعی مقرون‌به‌صرفه‌تر و دموکراتیک‌تر است.

دستیابی به این هدف شامل کاوش در مسیرهای مختلف فراتر از MoE است:

  • کارایی الگوریتمی: توسعه الگوریتم‌های جدید هوش مصنوعی که به قدرت محاسباتی کمتری برای آموزش و استنتاج نیاز دارند.
  • تکنیک‌های بهینه‌سازی مدل: به‌کارگیری روش‌هایی مانند کوانتیزاسیون (quantization) (کاهش دقت اعداد مورد استفاده در محاسبات) و هرس (pruning) (حذف بخش‌های اضافی شبکه عصبی) برای کوچک‌تر و سریع‌تر کردن مدل‌ها بدون افت عملکرد قابل توجه.
  • چارچوب‌های نرم‌افزاری: ایجاد نرم‌افزارهای پیچیده‌ای که بتوانند به طور کارآمد بارهای کاری هوش مصنوعی را در محیط‌های سخت‌افزاری ناهمگن مدیریت و توزیع کنند و استفاده از منابع محاسباتی موجود را به حداکثر برسانند.
  • سخت‌افزار داخلی تخصصی: سرمایه‌گذاری و استفاده مستمر از شتاب‌دهنده‌های هوش مصنوعی توسعه یافته توسط شرکت‌های چینی مانند Huawei (Ascend)، Alibaba (T-Head) و بالقوه دیگران، که به طور خاص برای وظایف هوش مصنوعی طراحی شده‌اند.

پیگیری این مسیر توسط Ant Group، در کنار سایرین در اکوسیستم فناوری چین، می‌تواند پیامدهای قابل توجهی داشته باشد. در صورت موفقیت، می‌تواند نشان دهد که رهبری در هوش مصنوعی صرفاً به داشتن دسترسی به سریع‌ترین تراشه‌ها وابسته نیست، بلکه به نوآوری در نرم‌افزار، معماری و بهینه‌سازی در سطح سیستم نیز بستگی دارد. این نشان‌دهنده تلاشی مصمم برای ایجاد یک قابلیت هوش مصنوعی انعطاف‌پذیر و خودکفا است که از طریق تنوع‌بخشی استراتژیک و نوآوری بی‌وقفه، پیچیدگی‌های چشم‌انداز فناوری جهانی کنونی را هدایت می‌کند. ادغام نیمه‌هادی‌های آمریکایی (US) و چینی، که از طریق تکنیک‌هایی مانند MoE بهینه شده و در بخش‌های حیاتی مانند مراقبت‌های بهداشتی به کار گرفته شده است، رویکردی عمل‌گرایانه و تطبیقی برای حفظ پیشرفت هوش مصنوعی تحت فشار را به نمایش می‌گذارد.