В арената с високи залози на развитието на изкуствения интелект, достъпът до авангардни полупроводникови технологии често диктува темпото на иновациите. За китайските технологични гиганти този достъп става все по-сложен, оформен от геополитически напрежения и строг контрол върху износа, наложен от Съединените щати. Сред този предизвикателен пейзаж, Ant Group, финтехгигантът, свързан с Alibaba, проправя свой собствен път. Компанията стратегически разгръща хетерогенна комбинация от полупроводници, доставени както от американски, така и от местни доставчици, за да захрани своите AI амбиции, като се фокусира особено върху подобряването на ефективността и рентабилността на обучението на сложни AI модели.
Този пресметнат подход е повече от просто техническо заобиколно решение; той представлява фундаментална стратегическа адаптация. Чрез умишлено интегриране на чипове от различни производители, включително местни алтернативи, Ant Group цели да смекчи рисковете, свързани с прекъсвания на веригата за доставки, и да намали зависимостта си от един-единствен доставчик, особено тези, които са обект на международни търговски ограничения. Тази диверсификация е от решаващо значение за осигуряване на непрекъснатостта и устойчивостта на нейния процес на изследване и развитие на AI. Основната цел е двойна: поддържане на инерцията в AI иновациите, като същевременно се оптимизират значителните разходи, обикновено свързани с обучението на мащабни модели.
Силата на специализацията: Възприемане на Mixture of Experts (MoE)
Централно място в хардуерната стратегия на Ant Group заема възприемането на усъвършенствана AI архитектура, известна като Mixture of Experts (MoE). Тази техника представлява значително отклонение от традиционните монолитни AI модели, при които една-единствена, масивна невронна мрежа се опитва да научи и да се справи с всички аспекти на дадена задача. Подходът MoE, за разлика от това, използва по-разпределена и специализирана структура. Той функционира много подобно на комитет от специалисти, а не на един-единствен универсален специалист.
Представете си сложен проблем, изискващ разнообразни знания. Вместо да разчитате на един ерудит, вие събирате екип: математик, лингвист, историк и може би физик. ‘Gating network’ (управляваща мрежа) действа като диспечер, анализирайки входящите задачи или точки от данни и интелигентно ги насочвайки към най-подходящия ‘expert’ (експертен) модел в рамките на по-голямата система. Всеки експертен модел е обучен да се справя отлично със специфични типове входове или подзадачи. Например, в езиков модел, един експерт може да се специализира в разбирането на технически жаргон, друг в стилове на творческо писане, а трети в разговорен диалог.
Ключовото предимство на този модулен дизайн се крие в неговата изчислителна ефективност. По време на обучение или ‘inference’ (извод - когато моделът прави прогнози), само съответните експертни модели и управляващата мрежа се активират за даден вход. Това селективно изчисление рязко контрастира с ‘dense models’ (плътни модели), където цялата мрежа, със своите милиарди или дори трилиони параметри, трябва да бъде ангажирана за всяко едно изчисление. Следователно, MoE моделите могат да постигнат сравнима или дори по-добра производителност от техните плътни аналози, като същевременно изискват значително по-малко изчислителна мощност и следователно по-малко енергия.
Ant Group ефективно използва това архитектурно предимство. Вътрешни изследвания и практическо приложение показват, че MoE позволява на компанията да постигне стабилни резултати от обучението дори при използване на по-малко мощни, по-лесно достъпни или по-евтини хардуерни компоненти. Според констатации, споделени от компанията, това стратегическо внедряване на MoE е позволило забележително 20% намаление на изчислителните разходи, свързани с обучението на нейните AI модели. Тази оптимизация на разходите не е просто незначително спестяване; тя е стратегически фактор, позволяващ на Ant да преследва амбициозни AI проекти, без непременно да разчита единствено на най-скъпите, първокласни графични процесори (GPUs), които стават все по-трудни за набавяне от китайските фирми. Това повишаване на ефективността директно адресира хардуерните ограничения, наложени от външната среда.
Гоблен от силиций: Хардуерното портфолио на Ant
Практическото прилагане на стратегията на Ant Group включва навигация в сложен полупроводников пейзаж. Съобщава се, че инфраструктурата за обучение на AI на компанията се захранва от разнообразен набор от чипове, отразявайки нейния ангажимент към гъвкавост и устойчивост. Това включва силиций, проектиран вътрешно от нейния филиал, Alibaba, вероятно визирайки чиповете, разработени от полупроводниковото звено T-Head на Alibaba. Освен това, Ant включва чипове от Huawei, друг китайски технологичен гигант, който инвестира сериозно в разработването на собствени AI ускорители (като серията Ascend) в отговор на санкциите на САЩ.
Въпреки че Ant Group исторически е използвала високопроизводителни GPUs от Nvidia, безспорният лидер на пазара за обучение на AI, развиващият се контрол върху износа от САЩ наложи промяна. Тези регулации конкретно ограничават продажбата на най-модерните AI ускорители на китайски субекти, позовавайки се на съображения за национална сигурност. Въпреки че Nvidia все още може да доставя чипове с по-ниски спецификации на китайския пазар, Ant Group изглежда активно разширява своята база от доставчици, за да компенсира ограничения достъп до първокласни продукти на Nvidia.
Тази диверсификация включва видно чипове от Advanced Micro Devices (AMD). AMD се очерта като значителен конкурент на Nvidia в областта на високопроизводителните изчисления и AI, предлагайки мощни GPUs, които представляват жизнеспособна алтернатива за определени работни натоварвания. Чрез включването на хардуер от AMD заедно с местни опции от Alibaba и Huawei, Ant изгражда хетерогенна изчислителна среда. Този подход на смесване и съчетаване, макар и потенциално добавящ сложност в оптимизацията на софтуера и управлението на работните натоварвания, осигурява решаваща гъвкавост. Той позволява на компанията да адаптира използването на хардуера си въз основа на наличността, цената и специфичните изчислителни изисквания на различните AI модели и задачи, като по този начин заобикаля тесните места, причинени от зависимостта от един-единствен, ограничен източник.
Фонът на тази стратегия е сложната мрежа от контрол върху износа от САЩ. Тези мерки бяха постепенно затягани с цел ограничаване на напредъка на Китай в производството на модерни полупроводници и развитието на AI. Докато първоначално бяха фокусирани върху абсолютния връх на чиповете, ограниченията се развиха, засягайки по-широк кръг от хардуер и оборудване за производство на полупроводници. Nvidia, например, трябваше да създаде специфични версии с по-ниска производителност на своите водещи AI чипове (като A800 и H800, производни на A100 и H100) за китайския пазар, за да спази тези регулации. Стратегията на Ant да възприеме алтернативи от AMD и местни играчи е пряк, прагматичен отговор на този регулаторен натиск, демонстрирайки усилие за поддържане на конкурентоспособността в AI в рамките на дадените ограничения.
AI в действие: Трансформиране на здравните услуги
Напредъкът на Ant Group в ефективността на AI не са просто теоретични упражнения; те активно се превръщат в приложения в реалния свят, със забележим фокус върху сектора на здравеопазването. Компанията наскоро обяви значителни подобрения в своите AI решения, пригодени за здравеопазването, подчертавайки практическото въздействие на нейната основна технологична стратегия.
Съобщава се, че тези подобрени AI възможности вече се използват в няколко видни здравни институции в големи китайски градове, включително Beijing, Shanghai, Hangzhou (централата на Ant) и Ningbo. Седем големи болници и здравни организации използват AI на Ant, за да подобрят различни аспекти на своите операции и грижи за пациентите.
Основата на AI модела за здравеопазване на Ant сама по себе си е пример за съвместни иновации и използване на разнообразни технологични силни страни. Той е изграден върху комбинация от мощни големи езикови модели (LLMs):
- Моделите R1 и V3 на DeepSeek: DeepSeek е забележителна китайска изследователска фирма в областта на AI, известна с разработването на способни модели с отворен код, често постигащи силни резултати в бенчмарковете.
- Qwen на Alibaba: Това е семейството от собствени големи езикови модели, разработени от филиала на Ant, Alibaba, покриващи редица размери и възможности.
- Собственият модел BaiLing на Ant: Това показва вътрешните усилия на Ant Group в разработването на персонализирани AI модели, съобразени с нейните специфични нужди, вероятно включващи финансови и потенциално специфични за здравеопазването данни и експертиза.
Тази многомоделна основа позволява на AI решението за здравеопазване да черпи от широка база знания и възможности. Според Ant Group, системата е способна да отговаря на запитвания по широк кръг медицински теми, потенциално служейки като ценен инструмент както за здравни специалисти, търсещи бърза информация, така и за пациенти, търсещи общи медицински познания (въпреки че е от решаващо значение внимателното разграничаване на нейната роля от професионалния медицински съвет).
Освен извличането на информация, компанията заявява, че AI моделът е проектиран да подобрява услугите за пациентите. Въпреки че конкретните детайли се появяват, това може да обхване редица приложения, като например:
- Интелигентен триаж: Подпомагане при приоритизиране на нуждите на пациентите въз основа на описаните симптоми.
- Планиране и управление на часове: Автоматизиране и оптимизиране на процеса на резервация.
- Проследяване след изписване: Предоставяне на автоматизирани напомняния или проверка на напредъка на възстановяването на пациентите.
- Административна поддръжка: Подпомагане на здравния персонал със задачи по документация, обобщаване или въвеждане на данни, освобождавайки време за директна грижа за пациентите.
Разгръщането в големи болници означава критична стъпка в утвърждаването на полезността на технологията и навигацията в сложностите на здравната сфера, която включва строги изисквания за точност, надеждност и поверителност на данните.
Начертаване на курс отвъд премиум GPUs
В перспектива, стратегията на Ant Group изглежда съобразена с по-широка амбиция в рамките на китайската технологична индустрия: постигане на авангардна AI производителност без да се разчита единствено на най-модерните, често ограничени, GPUs. Съобщава се, че компанията планира да подражава на пътя, поет от организации като DeepSeek, фокусирайки се върху методи за мащабиране на високопроизводителни AI модели ‘без премиум GPUs’.
Тази амбиция сигнализира за вярата, че архитектурните иновации (като MoE), софтуерните оптимизации и интелигентното използване на разнообразен, потенциално по-малко мощен хардуер могат колективно да преодолеят разликата в производителността, създадена от ограничения достъп до първокласен силиций. Това е стратегия, родена отчасти от необходимост поради контрола върху износа, но също така отразява потенциално устойчив път към по-рентабилно и демократизирано развитие на AI.
Постигането на тази цел включва изследване на различни пътища отвъд само MoE:
- Алгоритмична ефективност: Разработване на нови AI алгоритми, които изискват по-малко изчислителна мощност за обучение и ‘inference’.
- Техники за оптимизация на модели: Използване на методи като ‘quantization’ (квантуване - намаляване на точността на числата, използвани в изчисленията) и ‘pruning’ (подрязване - премахване на излишни части от невронната мрежа), за да се направят моделите по-малки и по-бързи без значителна загуба на производителност.
- Софтуерни рамки: Създаване на сложен софтуер, който може ефективно да управлява и разпределя AI работни натоварвания в хетерогенни хардуерни среди, максимизирайки използването на наличните изчислителни ресурси.
- Специализиран местен хардуер: Продължаващи инвестиции и използване на AI ускорители, разработени от китайски компании като Huawei (Ascend), Alibaba (T-Head) и потенциално други, проектирани специално за AI задачи.
Преследването на този път от Ant Group, заедно с други в технологичната екосистема на Китай, може да има значителни последици. Ако успее, това може да демонстрира, че лидерството в AI не зависи единствено от достъпа до абсолютно най-бързите чипове, но също така зависи от иновациите в софтуера, архитектурата и оптимизацията на системно ниво. Това представлява решително усилие за изграждане на устойчива и самодостатъчна AI способност, навигирайки в сложностите на настоящия глобален технологичен пейзаж чрез стратегическа диверсификация и неуморни иновации. Интегрирането на американски и китайски полупроводници, оптимизирано чрез техники като MoE и приложено в критични сектори като здравеопазването, показва прагматичен и адаптивен подход за поддържане на напредъка в AI под натиск.