Навигация Ant Group по рынку ИИ-чипов: стратегия

На арене разработки искусственного интеллекта (ИИ), где ставки высоки, доступ к передовым полупроводниковым технологиям часто определяет темпы инноваций. Для китайских технологических гигантов этот доступ становится все более сложным из-за геополитической напряженности и строгих экспортных ограничений, введенных Соединенными Штатами. В этих непростых условиях Ant Group, финтех-гигант, аффилированный с Alibaba, прокладывает свой особый путь. Компания стратегически использует гетерогенную смесь полупроводников, поставляемых как американскими, так и отечественными производителями, для реализации своих амбиций в области ИИ, уделяя особое внимание повышению эффективности и экономической целесообразности обучения сложных моделей ИИ.

Этот продуманный подход — не просто техническое решение; он представляет собой фундаментальную стратегическую адаптацию. Сознательно интегрируя чипы от различных производителей, включая отечественные альтернативы, Ant Group стремится снизить риски, связанные с перебоями в цепочках поставок, и уменьшить свою зависимость от одного поставщика, особенно тех, кто подпадает под международные торговые ограничения. Эта диверсификация имеет решающее значение для обеспечения непрерывности и устойчивости ее исследований и разработок в области ИИ. Основная цель двояка: поддерживать темпы инноваций в ИИ, одновременно оптимизируя значительные затраты, обычно связанные с обучением крупномасштабных моделей.

Сила специализации: внедрение Mixture of Experts (MoE)

Центральное место в аппаратной стратегии Ant Group занимает внедрение передовой архитектуры ИИ, известной как Mixture of Experts (MoE). Этот метод представляет собой значительный отход от традиционных монолитных моделей ИИ, где одна массивная нейронная сеть пытается изучить и обработать все аспекты данной задачи. Подход MoE, напротив, использует более распределенную и специализированную структуру. Он функционирует скорее как комитет специалистов, чем как один универсал.

Представьте себе сложную проблему, требующую разнообразных знаний. Вместо того чтобы полагаться на одного эрудита, вы собираете команду: математика, лингвиста, историка и, возможно, физика. ‘Gating network’ (управляющая сеть) действует как диспетчер, анализируя входящие задачи или точки данных и интеллектуально направляя их к наиболее подходящей ‘экспертной’ модели в рамках более крупной системы. Каждая экспертная модель обучена превосходно справляться с определенными типами входных данных или подзадач. Например, в языковой модели один эксперт может специализироваться на понимании технического жаргона, другой — на стилях творческого письма, а третий — на диалоговом общении.

Ключевое преимущество этой модульной конструкции заключается в ее вычислительной эффективности. Во время обучения или инференса (когда модель делает предсказания) для данного входа активируются только соответствующие экспертные модели и управляющая сеть. Это выборочное вычисление резко контрастирует с плотными моделями, где вся сеть с ее миллиардами или даже триллионами параметров должна быть задействована для каждого отдельного вычисления. Следовательно, модели MoE могут достигать сравнимой или даже превосходящей производительности по сравнению с их плотными аналогами, требуя при этом значительно меньшей вычислительной мощности и, следовательно, меньшего энергопотребления.

Ant Group эффективно использовала это архитектурное преимущество. Внутренние исследования и практическое применение показали, что MoE позволяет компании достигать надежных результатов обучения даже при использовании менее мощного, более доступного или более дешевого оборудования. Согласно данным, предоставленным компанией, это стратегическое внедрение MoE позволило добиться заметного снижения вычислительных затрат на 20%, связанных с обучением ее моделей ИИ. Эта оптимизация затрат — не просто постепенная экономия; это стратегический фактор, позволяющий Ant преследовать амбициозные проекты в области ИИ, не полагаясь исключительно на самые дорогие графические процессоры (GPU) высшего уровня, которые китайским фирмам становится все труднее закупать. Это повышение эффективности напрямую решает проблемы аппаратных ограничений, налагаемых внешней средой.

Кремниевый гобелен: аппаратный портфель Ant

Практическая реализация стратегии Ant Group включает навигацию в сложном полупроводниковом ландшафте. Сообщается, что инфраструктура обучения ИИ компании основана на разнообразном наборе чипов, что отражает ее приверженность гибкости и устойчивости. Сюда входят чипы, разработанные собственными силами ее аффилированной компанией Alibaba, вероятно, речь идет о чипах, созданных полупроводниковым подразделением Alibaba T-Head. Кроме того, Ant использует чипы от Huawei, другого китайского технологического гиганта, который активно инвестировал в разработку собственных ИИ-ускорителей (таких как серия Ascend) в ответ на санкции США.

Хотя Ant Group исторически использовала высокопроизводительные GPU от Nvidia, бесспорного лидера на рынке обучения ИИ, развивающиеся экспортные ограничения США потребовали сдвига. Эти правила конкретно ограничивают продажу самых передовых ИИ-ускорителей китайским организациям, ссылаясь на соображения национальной безопасности. Хотя Nvidia все еще может поставлять на китайский рынок чипы с более низкими характеристиками, Ant Group, похоже, активно расширяет свою базу поставщиков, чтобы компенсировать ограниченный доступ к продуктам Nvidia высшего уровня.

Эта диверсификация заметно включает чипы от Advanced Micro Devices (AMD). AMD стала значительным конкурентом Nvidia в области высокопроизводительных вычислений и ИИ, предлагая мощные GPU, которые представляют собой жизнеспособную альтернативу для определенных рабочих нагрузок. Включая оборудование AMD наряду с отечественными вариантами от Alibaba и Huawei, Ant создает гетерогенную вычислительную среду. Этот подход ‘mix-and-match’ (смешивай и сочетай), хотя и может добавить сложности в оптимизации программного обеспечения и управлении рабочими нагрузками, обеспечивает критически важную гибкость. Он позволяет компании адаптировать использование оборудования в зависимости от доступности, стоимости и конкретных вычислительных требований различных моделей и задач ИИ, тем самым обходя узкие места, вызванные зависимостью от одного ограниченного источника.

Фоном для этой стратегии служит сложная паутина экспортных ограничений США. Эти меры постепенно ужесточались с целью сдерживания прогресса Китая в производстве передовых полупроводников и разработке ИИ. Хотя первоначально они были сосредоточены на чипах абсолютного высшего класса, ограничения эволюционировали, затрагивая более широкий спектр оборудования и оборудования для производства полупроводников. Nvidia, например, пришлось создать специальные версии своих флагманских ИИ-чипов с пониженной производительностью (такие как A800 и H800, производные от A100 и H100) для китайского рынка, чтобы соответствовать этим правилам. Стратегия Ant по использованию альтернатив от AMD и отечественных игроков является прямым, прагматичным ответом на это регуляторное давление, демонстрируя усилия по поддержанию конкурентоспособности в области ИИ в заданных ограничениях.

ИИ в действии: трансформация медицинских услуг

Достижения Ant Group в эффективности ИИ — это не просто теоретические упражнения; они активно претворяются в жизнь в реальных приложениях, с заметным акцентом на сектор здравоохранения. Компания недавно представила значительные усовершенствования своих ИИ-решений, адаптированных для здравоохранения, подчеркивая практическое влияние своей базовой технологической стратегии.

Сообщается, что эти обновленные возможности ИИ уже используются в нескольких известных медицинских учреждениях в крупных китайских городах, включая Пекин, Шанхай, Ханчжоу (штаб-квартира Ant) и Нинбо. Семь крупных больниц и медицинских организаций используют ИИ Ant для улучшения различных аспектов своей деятельности и ухода за пациентами.

Основа модели ИИ для здравоохранения от Ant сама по себе является примером совместных инноваций и использования разнообразных технологических преимуществ. Она построена на комбинации мощных больших языковых моделей (LLM):

  • Модели R1 и V3 от DeepSeek: DeepSeek — известная китайская исследовательская фирма в области ИИ, известная разработкой мощных моделей с открытым исходным кодом, часто достигающих высоких показателей производительности.
  • Qwen от Alibaba: Это семейство проприетарных больших языковых моделей, разработанных аффилированной с Ant компанией Alibaba, охватывающее ряд размеров и возможностей.
  • Собственная модель BaiLing от Ant: Это указывает на внутренние усилия Ant Group по разработке заказных моделей ИИ, адаптированных к ее конкретным потребностям, вероятно, включающих финансовые и, возможно, специфичные для здравоохранения данные и экспертизу.

Эта многомодельная основа позволяет ИИ-решению для здравоохранения опираться на широкую базу знаний и возможностей. По словам Ant Group, система способна отвечать на запросы по широкому кругу медицинских тем, потенциально служа ценным инструментом как для медицинских работников, ищущих быструю информацию, так и для пациентов, ищущих общие медицинские знания (хотя четкое разграничение ее роли и профессиональной медицинской консультации имеет решающее значение).

Помимо извлечения информации, компания заявляет, что модель ИИ предназначена для улучшения обслуживания пациентов. Хотя конкретные детали появляются, это может охватывать ряд приложений, таких как:

  • Интеллектуальный триаж: Помощь в приоритизации потребностей пациентов на основе описанных симптомов.
  • Планирование и управление приемами: Автоматизация и оптимизация процесса записи.
  • Послевыписное наблюдение: Предоставление автоматических напоминаний или проверка хода выздоровления пациентов.
  • Административная поддержка: Помощь медицинскому персоналу в ведении документации, составлении резюме или вводе данных, освобождая время для непосредственного ухода за пациентами.

Развертывание в крупных больницах означает критический шаг в проверке полезности технологии и навигации в сложностях сферы здравоохранения, которая включает строгие требования к точности, надежности и конфиденциальности данных.

Прокладывая курс за пределы премиальных GPU

Заглядывая вперед, стратегия Ant Group, похоже, согласуется с более широкими амбициями в китайской технологической индустрии: достичь передовой производительности ИИ, не полагаясь исключительно на самые продвинутые, часто ограниченные GPU. Сообщается, что компания планирует подражать пути, пройденному такими организациями, как DeepSeek, сосредоточившись на методах масштабирования высокопроизводительных моделей ИИ ‘без премиальных GPU’.

Эти амбиции сигнализируют о вере в то, что архитектурные инновации (такие как MoE), оптимизация программного обеспечения и умное использование разнообразного, потенциально менее мощного оборудования могут коллективно преодолеть разрыв в производительности, созданный ограниченным доступом к кремнию высшего уровня. Это стратегия, рожденная отчасти из-за необходимости, вызванной экспортным контролем, но она также отражает потенциально устойчивый путь к более экономичной и демократизированной разработке ИИ.

Достижение этой цели включает исследование различных направлений помимо MoE:

  • Алгоритмическая эффективность: Разработка новых алгоритмов ИИ, требующих меньшей вычислительной мощности для обучения и инференса.
  • Методы оптимизации моделей: Использование таких методов, как квантование (уменьшение точности чисел, используемых в вычислениях) и прунинг (удаление избыточных частей нейронной сети), чтобы сделать модели меньше и быстрее без значительной потери производительности.
  • Программные фреймворки: Создание сложных программных средств, которые могут эффективно управлять и распределять рабочие нагрузки ИИ по гетерогенным аппаратным средам, максимизируя использование доступных вычислительных ресурсов.
  • Специализированное отечественное оборудование: Продолжение инвестиций и использование ИИ-ускорителей, разработанных китайскими компаниями, такими как Huawei (Ascend), Alibaba (T-Head) и, возможно, другими, специально предназначенных для задач ИИ.

Стремление Ant Group идти по этому пути, наряду с другими участниками технологической экосистемы Китая, может иметь значительные последствия. В случае успеха это может продемонстрировать, что лидерство в ИИ зависит не только от доступа к абсолютно самым быстрым чипам, но также от инноваций в программном обеспечении, архитектуре и оптимизации на системном уровне. Это представляет собой решительные усилия по созданию устойчивого и самодостаточного потенциала ИИ, навигации в сложностях текущего глобального технологического ландшафта посредством стратегической диверсификации и неустанных инноваций. Интеграция американских и китайских полупроводников, оптимизированная с помощью таких методов, как MoE, и применяемая в критически важных секторах, таких как здравоохранение, демонстрирует прагматичный и адаптивный подход к поддержанию прогресса ИИ под давлением.