در عرصه پرمخاطره توسعه هوش مصنوعی، دسترسی به فناوری پیشرفته نیمههادی اغلب سرعت نوآوری را تعیین میکند. برای غولهای فناوری چینی، این دسترسی به طور فزایندهای پیچیده شده و تحت تأثیر تنشهای ژئوپلیتیکی و کنترلهای صادراتی سختگیرانه اعمال شده توسط ایالات متحده (United States) قرار گرفته است. در میان این چشمانداز چالشبرانگیز، Ant Group، غول فینتک وابسته به Alibaba، در حال پیمودن مسیری متمایز است. این شرکت به طور استراتژیک از ترکیبی ناهمگن از نیمههادیها، که هم از تأمینکنندگان آمریکایی و هم داخلی تهیه شدهاند، برای پیشبرد جاهطلبیهای هوش مصنوعی خود استفاده میکند، به ویژه با تمرکز بر افزایش کارایی و مقرونبهصرفه بودن آموزش مدلهای پیچیده هوش مصنوعی.
این رویکرد حسابشده چیزی بیش از یک راهحل فنی است؛ این نشاندهنده یک انطباق استراتژیک بنیادین است. Ant Group با ادغام عمدی تراشههای سازندگان مختلف، از جمله جایگزینهای داخلی، قصد دارد خطرات مرتبط با اختلالات زنجیره تأمین را کاهش داده و وابستگی خود را به هر فروشنده واحد، به ویژه آنهایی که مشمول محدودیتهای تجاری بینالمللی هستند، کم کند. این تنوعبخشی برای تضمین تداوم و انعطافپذیری خط لوله تحقیق و توسعه هوش مصنوعی آن حیاتی است. هدف اصلی دوگانه است: حفظ شتاب در نوآوری هوش مصنوعی و بهینهسازی همزمان هزینههای قابل توجهی که معمولاً با آموزش مدلهای مقیاس بزرگ مرتبط است.
قدرت تخصصگرایی: استقبال از ترکیب متخصصان (MoE)
محور استراتژی سختافزاری Ant Group، اتخاذ یک معماری پیشرفته هوش مصنوعی موسوم به ترکیب متخصصان (Mixture of Experts - MoE) است. این تکنیک نشاندهنده یک انحراف قابل توجه از مدلهای هوش مصنوعی یکپارچه سنتی است، جایی که یک شبکه عصبی عظیم و منفرد تلاش میکند تمام جنبههای یک کار معین را یاد بگیرد و مدیریت کند. رویکرد MoE، در مقابل، از ساختاری توزیعشدهتر و تخصصیتر استفاده میکند. این بسیار شبیه به کمیتهای از متخصصان عمل میکند تا یک فرد همهفنحریف.
یک مسئله پیچیده را تصور کنید که به دانش متنوعی نیاز دارد. به جای تکیه بر یک دانشمند همهچیزدان، شما تیمی را گرد هم میآورید: یک ریاضیدان، یک زبانشناس، یک مورخ و شاید یک فیزیکدان. یک ‘شبکه دروازه’ (gating network) به عنوان یک توزیعکننده عمل میکند، وظایف یا نقاط داده ورودی را تجزیه و تحلیل کرده و هوشمندانه آنها را به مناسبترین مدل ‘متخصص’ در سیستم بزرگتر هدایت میکند. هر مدل متخصص برای برتری در انواع خاصی از ورودیها یا وظایف فرعی آموزش دیده است. به عنوان مثال، در یک مدل زبانی، یک متخصص ممکن است در درک اصطلاحات فنی تخصص داشته باشد، دیگری در سبکهای نوشتاری خلاقانه، و سومی در گفتگوی محاورهای.
مزیت کلیدی این طراحی ماژولار در کارایی محاسباتی آن نهفته است. در طول آموزش یا استنتاج (inference) (زمانی که مدل پیشبینی میکند)، فقط مدلهای متخصص مربوطه و شبکه دروازه برای یک ورودی معین فعال میشوند. این محاسبات انتخابی در تضاد کامل با مدلهای متراکم (dense models) قرار دارد که در آن کل شبکه، با میلیاردها یا حتی تریلیونها پارامتر، باید برای هر محاسبه واحد درگیر شود. در نتیجه، مدلهای MoE میتوانند عملکرد قابل مقایسه یا حتی برتری نسبت به همتایان متراکم خود داشته باشند در حالی که به قدرت محاسباتی و در نتیجه انرژی بسیار کمتری نیاز دارند.
Ant Group از این مزیت معماری به طور مؤثر استفاده کرده است. تحقیقات داخلی و کاربرد عملی نشان داده است که MoE به شرکت اجازه میدهد تا حتی هنگام استفاده از سختافزارهای کمقدرتتر، در دسترستر یا ارزانتر، به نتایج آموزشی قوی دست یابد. طبق یافتههای به اشتراک گذاشته شده توسط شرکت، این پیادهسازی استراتژیک MoE منجر به کاهش قابل توجه ۲۰ درصدی در هزینههای محاسباتی مرتبط با آموزش مدلهای هوش مصنوعی آن شده است. این بهینهسازی هزینه صرفاً یک صرفهجویی تدریجی نیست؛ بلکه یک توانمندساز استراتژیک است که به Ant اجازه میدهد پروژههای بلندپروازانه هوش مصنوعی را دنبال کند بدون اینکه لزوماً فقط به گرانترین واحدهای پردازش گرافیکی (GPUs) سطح بالا که تهیه آنها برای شرکتهای چینی به طور فزایندهای دشوار شده است، تکیه کند. این افزایش کارایی مستقیماً به محدودیتهای سختافزاری تحمیل شده توسط محیط خارجی پاسخ میدهد.
ملیلهای از سیلیکون: سبد سختافزاری Ant
پیادهسازی عملی استراتژی Ant Group شامل پیمایش در چشمانداز پیچیده نیمههادیها است. زیرساخت آموزش هوش مصنوعی این شرکت بنا بر گزارشها توسط مجموعهای متنوع از تراشهها تأمین میشود که نشاندهنده تعهد آن به انعطافپذیری و تابآوری است. این شامل سیلیکون طراحی شده داخلی توسط شرکت وابسته آن، Alibaba، احتمالاً با اشاره به تراشههای توسعه یافته توسط واحد نیمههادی T-Head Alibaba است. علاوه بر این، Ant تراشههایی از Huawei، یکی دیگر از غولهای فناوری چینی که در پاسخ به تحریمهای ایالات متحده (US) به شدت در توسعه شتابدهندههای هوش مصنوعی خود (مانند سری Ascend) سرمایهگذاری کرده است، را در بر میگیرد.
در حالی که Ant Group در گذشته از GPUهای با کارایی بالا از Nvidia، رهبر بیچونوچرای بازار آموزش هوش مصنوعی، استفاده میکرد، کنترلهای صادراتی در حال تحول ایالات متحده (US) نیاز به تغییر را ایجاب کرده است. این مقررات به طور خاص فروش پیشرفتهترین شتابدهندههای هوش مصنوعی به نهادهای چینی را با استناد به نگرانیهای امنیت ملی محدود میکند. اگرچه Nvidia همچنان میتواند تراشههای با مشخصات پایینتر را به بازار چین عرضه کند، به نظر میرسد Ant Group فعالانه در حال گسترش پایگاه تأمینکنندگان خود برای جبران دسترسی محدود به محصولات سطح بالای Nvidia است.
این تنوعبخشی به طور برجستهای شامل تراشههای Advanced Micro Devices (AMD) میشود. AMD به عنوان یک رقیب قابل توجه برای Nvidia در فضای محاسبات با کارایی بالا و هوش مصنوعی ظهور کرده است و GPUهای قدرتمندی را ارائه میدهد که جایگزین مناسبی برای برخی بارهای کاری هستند. Ant با گنجاندن سختافزار AMD در کنار گزینههای داخلی از Alibaba و Huawei، یک محیط محاسباتی ناهمگن ایجاد میکند. این رویکرد ترکیبی (mix-and-match)، در حالی که به طور بالقوه پیچیدگی در بهینهسازی نرمافزار و مدیریت بار کاری را افزایش میدهد، انعطافپذیری حیاتی را فراهم میکند. این به شرکت اجازه میدهد تا استفاده از سختافزار خود را بر اساس در دسترس بودن، هزینه و نیازهای محاسباتی خاص مدلها و وظایف مختلف هوش مصنوعی تنظیم کند و بدین ترتیب تنگناهای ناشی از اتکا به یک منبع واحد و محدود را دور بزند.
پسزمینه این استراتژی، شبکه پیچیده کنترلهای صادراتی ایالات متحده (US) است. این اقدامات به تدریج تشدید شدهاند و هدف آن مهار پیشرفت چین در تولید نیمههادیهای پیشرفته و توسعه هوش مصنوعی است. در حالی که در ابتدا بر روی تراشههای مطلقاً سطح بالا متمرکز بود، محدودیتها تکامل یافته و طیف وسیعتری از سختافزار و تجهیزات تولید نیمههادی را تحت تأثیر قرار دادهاند. به عنوان مثال، Nvidia مجبور شده است نسخههای خاص و با عملکرد پایینتر از تراشههای پرچمدار هوش مصنوعی خود (مانند A800 و H800، مشتق شده از A100 و H100) را برای بازار چین ایجاد کند تا با این مقررات مطابقت داشته باشد. استراتژی Ant در استقبال از جایگزینهای AMD و بازیگران داخلی، پاسخی مستقیم و عملگرایانه به این فشار نظارتی است که تلاشی برای حفظ رقابتپذیری هوش مصنوعی در چارچوب محدودیتهای موجود را نشان میدهد.
هوش مصنوعی در عمل: تحول خدمات بهداشتی و درمانی
پیشرفتهای Ant Group در کارایی هوش مصنوعی صرفاً تمرینهای نظری نیستند؛ آنها به طور فعال در حال تبدیل شدن به کاربردهای دنیای واقعی هستند، با تمرکز قابل توجه بر بخش مراقبتهای بهداشتی. این شرکت اخیراً پیشرفتهای قابل توجهی را در راهحلهای هوش مصنوعی خود که برای مراقبتهای بهداشتی طراحی شدهاند، رونمایی کرد و بر تأثیر عملی استراتژی فناوری زیربنایی خود تأکید کرد.
گفته میشود این قابلیتهای ارتقا یافته هوش مصنوعی در حال حاضر در چندین موسسه برجسته مراقبتهای بهداشتی در شهرهای بزرگ چین، از جمله Beijing، Shanghai، Hangzhou (مقر Ant) و Ningbo در حال استفاده هستند. هفت بیمارستان و سازمان مراقبتهای بهداشتی بزرگ از هوش مصنوعی Ant برای بهبود جنبههای مختلف عملیات و مراقبت از بیمار خود استفاده میکنند.
اساس مدل هوش مصنوعی مراقبتهای بهداشتی Ant خود نمونهای از نوآوری مشترک و بهرهگیری از نقاط قوت فناورانه متنوع است. این مدل بر اساس ترکیبی از مدلهای زبان بزرگ (LLMs) قدرتمند ساخته شده است:
- مدلهای R1 و V3 DeepSeek: DeepSeek یک شرکت تحقیقاتی برجسته هوش مصنوعی چینی است که به دلیل توسعه مدلهای منبع باز توانمند، که اغلب به معیارهای عملکرد قوی دست مییابند، شناخته شده است.
- Qwen Alibaba: این خانواده مدلهای زبان بزرگ اختصاصی است که توسط شرکت وابسته Ant، یعنی Alibaba، توسعه یافته و طیف وسیعی از اندازهها و قابلیتها را پوشش میدهد.
- مدل BaiLing خود Ant: این نشاندهنده تلاشهای داخلی Ant Group در توسعه مدلهای هوش مصنوعی سفارشی متناسب با نیازهای خاص خود است که احتمالاً دادهها و تخصصهای مالی و بالقوه ویژه مراقبتهای بهداشتی را در بر میگیرد.
این پایه چند مدلی به راهحل هوش مصنوعی مراقبتهای بهداشتی اجازه میدهد تا از پایگاه گستردهای از دانش و قابلیتها بهرهمند شود. به گفته Ant Group، این سیستم در پاسخگویی به پرسشها در مورد طیف گستردهای از موضوعات پزشکی مهارت دارد و به طور بالقوه به عنوان ابزاری ارزشمند هم برای متخصصان مراقبتهای بهداشتی که به دنبال اطلاعات سریع هستند و هم برای بیمارانی که به دنبال دانش عمومی پزشکی هستند (اگرچه تعیین دقیق نقش آن در مقابل مشاوره پزشکی حرفهای حیاتی است) عمل میکند.
فراتر از بازیابی اطلاعات، این شرکت بیان میکند که مدل هوش مصنوعی برای بهبود خدمات بیمار طراحی شده است. در حالی که جزئیات خاص در حال ظهور هستند، این میتواند طیف وسیعی از کاربردها را در بر گیرد، مانند:
- تریاژ هوشمند: کمک به اولویتبندی نیازهای بیمار بر اساس علائم توصیف شده.
- زمانبندی و مدیریت قرار ملاقات: خودکارسازی و بهینهسازی فرآیند رزرو.
- پیگیری پس از ترخیص: ارائه یادآوریهای خودکار یا بررسی پیشرفت بهبودی بیماران.
- پشتیبانی اداری: کمک به کارکنان مراقبتهای بهداشتی در مستندسازی، خلاصهسازی یا وظایف ورود دادهها، و آزاد کردن زمان برای مراقبت مستقیم از بیمار.
استقرار در بیمارستانهای بزرگ گامی حیاتی در تأیید سودمندی فناوری و پیمایش پیچیدگیهای حوزه مراقبتهای بهداشتی است که شامل الزامات سختگیرانه برای دقت، قابلیت اطمینان و حریم خصوصی دادهها میشود.
ترسیم مسیری فراتر از GPUهای ممتاز
با نگاه به آینده، به نظر میرسد استراتژی Ant Group با جاهطلبی گستردهتری در صنعت فناوری چین همسو است: دستیابی به عملکرد پیشرفته هوش مصنوعی بدون اتکای صرف به پیشرفتهترین و اغلب محدود شدهترین GPUها. بنا بر گزارشها، این شرکت قصد دارد مسیر طی شده توسط سازمانهایی مانند DeepSeek را تقلید کند و بر روشهایی برای مقیاسبندی مدلهای هوش مصنوعی با کارایی بالا ‘بدون GPUهای ممتاز’ تمرکز کند.
این جاهطلبی نشاندهنده این باور است که نوآوریهای معماری (مانند MoE)، بهینهسازیهای نرمافزاری، و استفاده هوشمندانه از سختافزارهای متنوع و بالقوه کمقدرتتر میتوانند به طور جمعی شکاف عملکردی ایجاد شده توسط دسترسی محدود به سیلیکون سطح بالا را پر کنند. این استراتژی تا حدی ناشی از ضرورت به دلیل کنترلهای صادراتی است، اما همچنین منعکسکننده مسیری بالقوه پایدار به سوی توسعه هوش مصنوعی مقرونبهصرفهتر و دموکراتیکتر است.
دستیابی به این هدف شامل کاوش در مسیرهای مختلف فراتر از MoE است:
- کارایی الگوریتمی: توسعه الگوریتمهای جدید هوش مصنوعی که به قدرت محاسباتی کمتری برای آموزش و استنتاج نیاز دارند.
- تکنیکهای بهینهسازی مدل: بهکارگیری روشهایی مانند کوانتیزاسیون (quantization) (کاهش دقت اعداد مورد استفاده در محاسبات) و هرس (pruning) (حذف بخشهای اضافی شبکه عصبی) برای کوچکتر و سریعتر کردن مدلها بدون افت عملکرد قابل توجه.
- چارچوبهای نرمافزاری: ایجاد نرمافزارهای پیچیدهای که بتوانند به طور کارآمد بارهای کاری هوش مصنوعی را در محیطهای سختافزاری ناهمگن مدیریت و توزیع کنند و استفاده از منابع محاسباتی موجود را به حداکثر برسانند.
- سختافزار داخلی تخصصی: سرمایهگذاری و استفاده مستمر از شتابدهندههای هوش مصنوعی توسعه یافته توسط شرکتهای چینی مانند Huawei (Ascend)، Alibaba (T-Head) و بالقوه دیگران، که به طور خاص برای وظایف هوش مصنوعی طراحی شدهاند.
پیگیری این مسیر توسط Ant Group، در کنار سایرین در اکوسیستم فناوری چین، میتواند پیامدهای قابل توجهی داشته باشد. در صورت موفقیت، میتواند نشان دهد که رهبری در هوش مصنوعی صرفاً به داشتن دسترسی به سریعترین تراشهها وابسته نیست، بلکه به نوآوری در نرمافزار، معماری و بهینهسازی در سطح سیستم نیز بستگی دارد. این نشاندهنده تلاشی مصمم برای ایجاد یک قابلیت هوش مصنوعی انعطافپذیر و خودکفا است که از طریق تنوعبخشی استراتژیک و نوآوری بیوقفه، پیچیدگیهای چشمانداز فناوری جهانی کنونی را هدایت میکند. ادغام نیمههادیهای آمریکایی (US) و چینی، که از طریق تکنیکهایی مانند MoE بهینه شده و در بخشهای حیاتی مانند مراقبتهای بهداشتی به کار گرفته شده است، رویکردی عملگرایانه و تطبیقی برای حفظ پیشرفت هوش مصنوعی تحت فشار را به نمایش میگذارد.