Китайското open-source движение бързо се консолидира в сила, с която трябва да се съобразяват. С фундаментални модели като DeepSeek и Qwen на Alibaba, които водят атаката, поставяйки нови стандарти за китайските open-source възможности, нарастващ брой малки и средни предприятия (МСП) използват тези постижения за разработване на по-малки, но по-мощни вертикални модели. Този скок в иновациите ускори темпото на актуализациите на големите модели в Китай, като постоянно предоставя нови и вълнуващи развития. За разлика от предимно затворения подход, преобладаващ в Съединените щати, китайските компании възприемат open-source, демонстрирайки своята технологична увереност и поставяйки началото на нов път към технологичното приобщаване и глобалното сътрудничество, непрекъснато разширявайки се на отвъдморските пазари и измествайки глобалния AI пейзаж от ‘еднополюсна хегемония’ към ‘многополюсно съвместно съществуване’.
Сближаването на китайския Open Source
В началото на февруари, когато китайският open-source голям модел DeepSeek оглави класациите за изтегляне на пазара на приложения в 140 държави и региони по света, OpenAI публично обвини DeepSeek, че използва дестилирани данни от ChatGPT без разрешение.
Вместо да спаси репутацията на OpenAI, това обвинение беше посрещнато с широко разпространено подигравки от изследователи по целия свят.
Сега се появи друг претендент, който напълно възприема ‘дестилационния’ буфет.
На 13 април Kunlun Wanwei пусна моделите от серията Skywork-OR1 (Open Reasoner 1), надминавайки Qwen-32B на Alibaba в същия мащаб и съвпадайки с DeepSeek-R1.
Как може Kunlun Wanwei, компания с ограничени финансови ресурси, да създаде голям модел от SOTA ниво? Официалното обяснение е, че техните модели са базирани на DeepSeek-R1-Distill-Qwen-7B и DeepSeek-R1-Distill-Qwen-32B.
Както подсказват имената, моделите на DeepSeek дестилират моделите от серията Qwen на Alibaba.
Докато използва отлични open-source модели, Kunlun Wanwei също допринася за open-source общността. За разлика от DeepSeek, която отвори само теглата на моделите, Kunlun Wanwei също така отвори своите набори от данни и код за обучение, привеждайки се по-близо до концепцията за ‘истински open source’. Това означава, че всеки потребител може да опита да повтори процеса на обучение на техния модел.
Постижението на Kunlun Wanwei демонстрира най-важния аспект на open source: той не само предоставя на потребителите безплатен и лесно достъпен продукт, но също така дава възможност на повече разработчици да застанат на раменете на предшествениците, бързо и рентабилно да напредват в технологиите.
Всъщност, на фона на миналогодишните дискусии в индустрията за тясното място в предварителното обучение на големи модели, темпото на итерация на китайските големи модели се ускори тази година, като все повече компании инвестират в open source.
Tongyi Qianwen на Alibaba Cloud отвори новия си визуален модел Qwen2.5-VL в навечерието на китайската Нова година и пусна и отвори новия си модел за разсъждение QwQ-32B в началото на март, оглавявайки списъка с тенденции на глобалната основна AI open-source общност Hugging Face в деня, в който беше отворен.
След това Stepwise отвори три мултимодални големи модела за около месец, последният от които е моделът за изображение към видео Step-Video-TI2V, който поддържа генерирането на видеоклипове с контролируема амплитуда на движение и движение на обектива, а също така идва с определени възможности за генериране на специални ефекти.
Zhipu обяви през април, че ще отвори сериите GLM от 32B/9B модели, обхващащи базови, разсъждаващи и съзерцателни модели, всички под лицензионното споразумение MIT.
Дори Baidu, който някога беше със затворен код, обяви, че ще отвори напълно големия модел Wenxin на 30 юни.
В сравнение с нарастващия просперитет на вътрешната open-source екосистема, американските големи компании за модели все още се фокусират главно върху затворен код, което даде на китайските големи модели рядка възможност да отидат в чужбина. DeepSeek позволи на индонезийската образователна компания Ruangguru да оптимизира своя модел на преподаване на ниска цена; Сингапурската B2B компания за туристически технологии Atlas интегрира Qwen в своята интелигентна система за обслужване на клиенти, за да постигне 24/7 многоезична поддръжка.
Защо затворен код в САЩ, open source в Китай?
Тенденцията към затворен код в американската AI индустрия и нарастващата отвореност на китайския AI са неизбежните резултати от различните среди за развитие на AI в двете страни.
Американската AI индустрия се ръководи главно от технологични гиганти и VCs (venture capitalists), които имат огромни очаквания за капиталови печалби от AI. Следователно, американските компании за AI модели обикновено имат силна вяра в технологиите, т.е. да преследват технологично лидерство, да постигнат определена степен на пазарен монопол и след това да създадат огромни печалби и тяхната екосистема е естествено наклонена към затворен код.
Вземайки историята на развитие на OpenAI като пример, тя започна като организация с нестопанска цел по време на създаването си, но оттогава става все по-затворена. GPT-1 беше напълно open source, GPT-2 беше частично open source и срещна съпротива, преди да бъде напълно open source, GPT-3 официално стана със затворен код и след това GPT-4 допълнително засили стратегията със затворен код, като архитектурата на модела и данните за обучение бяха напълно поверителни и дори ограничиха честотата на API повикванията на корпоративните потребители.
Въпреки че OpenAI каза, че затварянето на кода се основава на съответствие и контролиране на злоупотребите с технологии, пазарът като цяло смята, че знаменателното събитие за преминаването на OpenAI към затворен код е достигането на сто милиарда долара сътрудничество с Microsoft, вграждайки GPT-3 в облачните услуги на Azure, за да образува ‘технологично-капиталов’ затворен цикъл.
Когато Microsoft за първи път разкри инвестицията си в OpenAI във финансовия си отчет през октомври миналата година, тя каза: ‘Инвестирахме в OpenAIGlobal, LLC, с общ инвестиционен ангажимент от 13 милиарда долара и инвестицията се отчита с помощта на метода на дяловото участие.’
Така нареченият метод на дяловото участие може да се разбира и като това, че инвестицията на Microsoft в OpenAI е насочена към получаване на възвръщаемост, а не към чисто благотворителни изследвания. Очевидно, продажбата на скъпи API-та на OpenAI чрез затворена екосистема е нейният най-голям източник на приходи и се превърна в най-голямата пречка за нежеланието на OpenAI да отвори кода.
Anthropic, който беше основан от ‘разделянето’ на OpenAI, беше решен да поеме по маршрута със затворен код от самото начало и неговият голям модел продукт Claude напълно прие модела със затворен код.
Дори Llama на META, единственият open-source лидер в Съединените щати, добави две анти-приятелски клаузи при отваряне на кода:
- Open-source моделите не могат да се използват за продукти и услуги с повече от 700 милиона месечни активни потребители, преди META да ги одобри.
- Изходното съдържание на моделите Llama не може да се използва за обучение и подобряване на други големи езикови модели.
Вижда се, че дори и за open-source модели, основната цел на Meta е все още да изгради своя собствена AI екосистема, а не техническо приобщаване.
Съединените щати избраха AI стратегия, базирана на затворен код с open source като допълнение на капиталово ниво, което може да се каже, че е чисто търговско съображение. За разлика от това, топ-надолу дизайнът на Китай отгоре надолу обърна внимание на open source от самото начало, отразявайки индустриален път, водещ под концепцията за независим контрол.
Още през 2017 г. китайското правителство публикува ‘План за развитие на изкуствения интелект от ново поколение’, който ясно предложи да се ускори дълбоката интеграция на AI с икономиката и обществото и да се разположи за изграждане на предимството на първия двигател на развитието на AI. През 2021 г. свързаното с open-source съдържание беше изрично включено в китайския ‘14-ти петгодишен план’, което предизвика активно насърчаване на технологичните иновации от местните правителства.
Мей Хонг, академик от Китайската академия на науките, веднъж каза, че бъдещото развитие на езиковите модели трябва да разчита на open-source платформи. Само в отворена среда може да се гарантира сигурността и надеждността на качването на данни и бизнес интеграцията за потребители в различни индустрии.
‘Специален план за действие за цифрово овластяване на малки и средни предприятия (2025-2027)’, издаден от Министерството на промишлеността и информационните технологии и други четири отдела през декември миналата година, ясно подкрепя Open Atom Open Source Foundation да създаде ‘Специален проект за AI Open Source за малки и средни предприятия’, за да предостави възпроизводими и лесни за популяризиране рамки за обучение, инструменти за тестване и други ресурси, за да се намали техническия праг за предприятията.
По-реалистичен проблем е, че поради потенциалната технологична блокада от Съединените щати, Китай не може просто да бъде последовател в областта на AI, а трябва да изгради независима вътрешна екосистема. Изграждането на друга затворена екосистема под екосистемата, която Съединените щати вече са изградили със затворен код като основен фокус, е равносилно на изграждането на кола зад затворени врати. Само open-source екосистема може бързо да помогне за развитието на AI индустрията.
В допълнение към подкрепата отгоре надолу, различни местни правителства също направиха реални парични инвестиции в open-source екосистемата.
Z Fund, съвместно създаден от Zhipu и Beijing State-owned Assets, който се фокусира върху инвестиции в екосистемата на големи модели, обяви, че ще инвестира 300 милиона юана в подкрепа на развитието на AI open-source общността по целия свят. Всеки стартиращ проект, базиран на open-source модели (неограничен до Zhipu open-source модели), може да кандидатства.
Разминаването между Китай и Съединените щати в техните open-source и стратегии със затворен код за AI индустрията е по същество фундаментална разлика в логиката на развитие. Съединените щати се движат от капитал, а стремежът към печалба на технологичните гиганти и VCs породи екосистема със затворен код на ‘технологичен монопол-реализация на високи цени’. Дори ако Meta се опита да отвори кода, е трудно да се избягат оковите на търговските бариери. Китай разчита на дизайн от най-високо ниво, с ‘технологичен капитал + индустриално сътрудничество’ като своя основна концепция и изгражда отворена екосистема чрез овластяване на политиките, превръщайки open source в основна инфраструктура за понижаване на техническите прагове и насърчаване на интеграцията на реалната икономика. Този стратегически избор не само оформя различните пътища на AI индустриите в двете страни, но също така предвещава ускоряването на глобалната AI екосистема от ‘монополна конкуренция’ към ‘отворена и печеливша’.
Достатъчно добро е достатъчно добро
Китайската AI open-source екосистема не само ускорява индустриализацията на AI развитието в Китай и света, но също така поставя вярата на Съединените щати в технологиите на първо място в неудобен капан.
Изправена пред нарастващия натиск, донесен от ефекта DeepSeek, Meta пусна Llama4 на 5 април, твърдейки, че е най-силният мултимодален голям модел в историята.
Въпреки това, след действително тестване, това е модел, който разочарова. Контекстната дължина от 10 милиона токена често се обърква, първоначалният тест с топка е труден за завършване и се появява грешка в размера на сравнението 9.11 > 9.9. В рамките на няколко дни след пускането на модела също бяха потвърдени скандали като оставки на ръководители и измама при тестове от вътрешни служители.
Повече новини доказват, че Llama4 може да се каже, че е продукт, който Zuckerberg побърза да пусне на рафтовете. Така че въпросът е, защо Zuckerberg трябваше да го пусне през април?
Както споменахме по-рано, американската AI индустрия има объркваща вяра в технологиите, вярвайки, че техните продукти трябва да са най-силните и най-модерните, така че те започнаха надпревара във въоръжаването. Въпреки това, намаляващият маргинален ефект от обучението на AI накара големите производители да консумират огромни разходи и не само, че не е изграден техническият праг, но те са изпаднали в блатото на тесните места в изчислителната мощност.
След като OpenAI пусна функцията за генериране на изображения на GPT-4o, Altman туитира няколко дни по-късно, че техните графични процесори ‘изгарят’. По-малко от седмица след пускането на Gemini2.5 ръководителят на GoogleAIStudio каза, че все още са измъчвани от ‘ограничения на скоростта’ и разработчиците могат да изпращат само 20 заявки в минута. Изглежда, че никоя компания не може да се справи с нуждите за извод на супер-големи модели.
Всъщност Съединените щати изпадат в неразбиране. Отговорникът на Института за изследвания Zhiyuan каза: ‘Ако нов модел използва 100 пъти повече разходи, за да избяга от увеличение на референтния резултат от 10 точки, тогава този нов модел е безсмислен за повече от 80% от сценариите на приложение, защото няма рентабилност.’
Китайските големи компании за модели ускоряват open-source екосистемата. Те изглежда вече не се състезават за първото място, а вместо това са спечелили повече клиенти, особено индустриални клиенти, с техния подход ‘достатъчно добър’.
В сравнение с десетките милиони бюджети за правителствени и корпоративни клиенти, много компании и институции имат спешни AI нужди, но нямат толкова много съществуващи решения. Използването на open-source модели за разработване на собствени решения почти се превърна в техния единствен избор:
- Baosteel използва ‘голям модел + малък модел’ за ключови металургични инженерни процеси за интелигентно ранно предупреждение за производствено оборудване.
- ‘Coal Science Guardian Large Model ChinamjGPT’ на China Coal Science and Industry Group намалява времето за престой на оборудването и разходите за поддръжка съответно с 30% и 20%.
- Shanghai Mengbo Intelligent Internet of Things Technology създаде платформа за приложение за откриване на ръбове и оптимизация на процеса на пещ за непрекъснато отгряване, базирана на лек голям модел.
- Mifei Technology реализира интелигентно прогнозиране, поддръжка и управление на автоматизирани системи за обработка на материали в полупроводникови фабрики за пластини, базирани на голяма моделна технология.
Това са всички представителни случаи на внедряване на open-source модели в индустриални сценарии.
В допълнение към индустриалните приложения, open-source екосистемата може да помогне и на повече обществени благотворителни начинания.
Shanshui Nature Conservation Center се ангажира със защитата на снежни леопарди и плато екосистеми. Инфрачервените камери, които инсталира, правят голям брой снимки или видеоклипове всяко тримесечие. Изключително неефективно и отнема много време да се разчита на ръчна идентификация на следи от снежен леопард. Huawei Ascend си сътрудничи с Shanshui Nature Conservation Center за идентифициране на следи от снежен леопард. Huawei отвори съответните модели и инструменти за разпознаване на видове с инфрачервени изображения в Sanjiangyuan, понижавайки прага за участие в AI развитие и позволявайки на повече изследователски и защитни институции, използващи модела, да се възползват. Хората могат да работят заедно, за да оптимизират модела по отношение на набори от данни, обработка на данни и почистване на данни.
Ефектът ‘Базар’ на Open Source
Ерик Реймънд, знаменосецът на open-source софтуерното движение, предложи метафора в книгата си от 1999 г. ‘Катедралата и базарът’: Традиционният модел за разработка на софтуер със затворен код е като изграждане на катедрала. Софтуерът е внимателно проектиран и изграден от няколко експерти (архитекти) в изолирана среда и се пуска на потребителите едва след като бъде окончателно завършен; Моделът за разработка на open-source е като оживен, привидно хаотичен, но жизнен базар. Разработката на софтуер е отворена, децентрализирана и еволюционна.
Книгата вярва, че за много видове софтуерни проекти, особено сложен софтуер на системно ниво (като ядра на операционни системи), отвореният, съвместен и децентрализиран модел на разработка ‘базар’, въпреки че може да изглежда хаотичен, всъщност е по-ефективен, произвежда по-качествен и по-здрав софтуер от традиционния, затворен и централизиран модел ‘катедрала’. Той може да открива и коригира грешки по-бързо и по-добре да абсорбира обратна връзка от потребителите и приноси от общността чрез механизми като ‘пусни рано, пускай често’ и използване на мащабна партньорска проверка (‘достатъчно очи’), като по този начин насърчава бърза итерация и иновации на софтуера.
Огромният успех на open-source проекти като Linux потвърди гледната точка на Реймънд.
Open-source движението донесе на Съединените щати и света огромна стойност, далеч надхвърляща собствените си инвестиции. Изследователски доклад от Харвардския университет от 2024 г. гласи: ‘Open-source инвестира 4,15 милиарда долара и създаде 8,8 трилиона долара стойност за компаниите (т.е. всеки инвестиран долар създава 2000 долара стойност). Без open source, корпоративните разходи за софтуер биха били 3,5 пъти по-високи от сегашните.’
Днес китайските компании са научили това. Американските AI компании изглежда са го забравили.
Всъщност, за китайските големи компании за модели, дори и да не вземат предвид социалните ползи, изборът да прегърнат open-source екосистемата не е нерентабилен за самите компании.
Много големи компании за модели казаха на Observer.com, че open source не означава отказване от комерсиализация. Open source все още има логиката на печалбата от open source. В сравнение с това дали е open source или не, как да се обслужват по-добре клиентите технически е ключовият въпрос.
Вземайки Zhipu AI като пример, той твърди, че е единствената компания в Китай, която напълно сравнява OpenAI, но в сравнение със стратегията със затворен код на OpenAI, той е един от най-решените практикуващи на open-source стратегия в индустрията.
Zhipu пое водещата роля в open-sourcing първия в Китай Chat голям модел ChatGLM-6B през 2023 г. От създаването си преди близо шест години, Zhipu отвори над 55 модела, с кумулативен обем на изтегляне от близо 40 милиона пъти в международната open-source общност.
Zhipu каза на Observer.com, че Zhipu се надява, че неговата open-source стратегия ще допринесе за превръщането на Пекин в ‘глобална open-source столица’ за изкуствен интелект.
Конкретно, на търговско ниво, Zhipu избра да привлече екосистема на разработчици чрез open source и да предостави платени персонализирани решения на B-end и G-end клиенти.
В допълнение към продажбата на решения, продажбата на API-та също е важна връзка за печалба.
Вземайки DeepSeek като пример, първият бизнес на open-source модела е продажбата на високопроизводителни API-та. Въпреки че основните услуги са безплатни, компаниите могат да предоставят високопроизводителни API услуги и да начисляват такси въз основа на употреба. Цената на API за DeepSeek-R1 е 1 юан на милион входни токена и 16 юана на милион изходни токена. Ако безплатната квота за токени е изчерпана или основният API не може да отговори на нуждите, потребителите са склонни да използват платената версия, за да поддържат стабилността на бизнес процесите.
В сравнение с компаниите, които имат само моделни услуги, Alibaba избра друг open-source модел за монетизиране: екосистемно обвързване.
Серията Qwen на Alibaba, като open-source пионер, привлича разработчиците да използват облачни изчисления и друга инфраструктура чрез пълна модална open source, образувайки затворен контур. Техният модел е само въведение в ранния етап, а стоките с маркирани цени всъщност са облачни услуги.
Глобализационното приложение на китайските open-source големи модели се измести от ‘технологично следване’ към ‘доминиране на екосистемата’. Когато Съединените щати са хванати в дилемата на ‘затворен код монопол’ и ‘open-source извън контрол’, Китай реконструира основната логика на глобалната AI open-source екосистема чрез ‘иновация на споразумения + култивиране на сценарии’. Крайното бойно поле на тази игра не е в конкуренцията на мащаба на параметрите, а в трилионния пазар на дълбока интеграция на AI технологията и реалната икономика.