Китайский Open Source: Меняя AI Мир

Конвергенция китайского Open Source

В начале февраля, когда китайская open source большая модель DeepSeek возглавила чарты загрузок в 140 странах и регионах мира, OpenAI публично обвинила DeepSeek в использовании дистиллированных данных из ChatGPT без разрешения.

Вместо того, чтобы спасти репутацию OpenAI, это обвинение было встречено всеобщим высмеиванием со стороны исследователей по всему миру.

Теперь появился еще один претендент, полностью использующий “дистилляцию”.

13 апреля Kunlun Wanwei запустила серию моделей Skywork-OR1 (Open Reasoner 1), превзойдя Qwen-32B от Alibaba в том же масштабе и соответствуя DeepSeek-R1.

Как Kunlun Wanwei, компания с ограниченными финансовыми ресурсами, может создать большую модель уровня SOTA? Официальное объяснение состоит в том, что их модели основаны на DeepSeek-R1-Distill-Qwen-7B и DeepSeek-R1-Distill-Qwen-32B.

Как следует из названий, модели DeepSeek дистиллировали модели серии Qwen от Alibaba.

Используя отличные open source модели, Kunlun Wanwei также вносит свой вклад в open source сообщество. В отличие от DeepSeek, которая открыла только веса модели, Kunlun Wanwei также открыла свои наборы данных и код обучения, что больше соответствует концепции “истинного open source”. Это означает, что любой пользователь может попытаться воспроизвести процесс обучения их модели.

Достижение Kunlun Wanwei демонстрирует наиболее важный аспект open source: он не только предоставляет пользователям бесплатный и легкодоступный продукт, но и позволяет большему количеству разработчиков стоять на плечах предшественников, быстро и экономично продвигая технологии.

Фактически, на фоне прошлогодних отраслевых дискуссий о узком месте в предварительном обучении больших моделей, темпы итерации китайских больших моделей ускорились в этом году, и все больше и больше компаний инвестируют в open source.

Alibaba Cloud Tongyi Qianwen открыла свою новую визуальную модель Qwen2.5-VL в канун китайского Нового года, а в начале марта выпустила и открыла свою новую модель рассуждений QwQ-32B, возглавив список трендов глобального основного AI open source сообщества Hugging Face в день открытия.

Затем Stepwise открыла три мультимодальные большие модели примерно за месяц, последней из которых является модель преобразования изображения в видео Step-Video-TI2V, которая поддерживает создание видео с контролируемой амплитудой движения и движением объектива, а также обладает определенными возможностями создания спецэффектов.

Zhipu объявила в апреле, что откроет серию GLM моделей 32B/9B, охватывающих базовые, рассуждающие и созерцательные модели, все по лицензионному соглашению MIT.

Даже Baidu, которая когда-то была закрытой, объявила, что полностью откроет большую модель Wenxin 30 июня.

По сравнению с растущим процветанием отечественной open source экосистемы, американские компании больших моделей по-прежнему в основном сосредоточены на закрытом source, что дало китайским большим моделям редкую возможность выйти за границу. DeepSeek позволила индонезийской образовательной компании Ruangguru оптимизировать свою обучающую модель по низкой цене; Сингапурская B2B компания Atlas, занимающаяся туристическими технологиями, интегрировала Qwen в свою интеллектуальную систему обслуживания клиентов для обеспечения круглосуточной многоязычной поддержки.

Почему в США Closed Source, а в Китае Open Source?

Тенденция к closed source в американской AI индустрии и растущая открытость китайской AI являются неизбежным результатом различных условий развития AI в двух странах.

Американская AI индустрия в основном возглавляется технологическими гигантами и венчурными капиталистами, которые возлагают огромные надежды на возврат капитала от AI. Поэтому американские компании AI моделей, как правило, твердо верят в технологии, то есть стремятся к технологическому лидерству, добиваются определенной степени рыночной монополии, а затем создают огромные прибыли, и их экосистема, естественно, склоняется к closed source.

В качестве примера можно привести историю развития OpenAI: она начиналась как некоммерческая организация во время своего создания, но с тех пор становится все более закрытой. GPT-1 была полностью open source, GPT-2 была частично open source и столкнулась с сопротивлением, прежде чем стать полностью open source, GPT-3 официально перешла в closed source, а затем GPT-4 еще больше укрепила стратегию closed source, при этом архитектура модели и данные обучения были полностью конфиденциальными и даже ограничивали частоту вызовов API корпоративными пользователями.

Хотя OpenAI заявила, что закрытие source основано на соблюдении требований и контроле над злоупотреблением технологиями, рынок в целом считает, что знаковым событием перехода OpenAI к closed source стало достижение стомиллиардного сотрудничества с Microsoft, встраивание GPT-3 в облачные сервисы Azure для формирования “технологическо-капитального” замкнутого цикла.

Когда Microsoft впервые раскрыла свои инвестиции в OpenAI в своем финансовом отчете в октябре прошлого года, она заявила: “Мы инвестировали в OpenAIGlobal, LLC, с общим инвестиционным обязательством в 13 миллиардов долларов, и инвестиции учитываются с использованием метода долевого участия”.

Так называемый метод долевого участия можно также понимать как то, что инвестиции Microsoft в OpenAI направлены на получение прибыли, а не на чистые благотворительные исследования. Очевидно, что продажа OpenAI дорогих API через closed source экосистему является ее текущим крупнейшим источником дохода и стала самым большим препятствием для нежелания OpenAI открывать source.

Anthropic, которая была основана в результате “раскола” OpenAI, с самого начала была полна решимости пойти по пути closed source, и ее большая модель продукта Claude полностью приняла модель closed source.

Даже Llama от META, единственный open source лидер в Соединенных Штатах, добавила два антивзаимных пункта при открытии source:

  1. Open source модели нельзя использовать для продуктов и услуг с более чем 700 миллионами активных пользователей в месяц до того, как META одобрит их.
  2. Выходной контент моделей Llama нельзя использовать для обучения и улучшения других больших языковых моделей.

Видно, что даже для open source моделей основная цель Meta по-прежнему заключается в создании собственной AI экосистемы, а не в технической инклюзивности.

Соединенные Штаты выбрали AI стратегию, основанную на closed source с open source в качестве дополнения на уровне капитала, что можно сказать, является чисто коммерческими соображениями. В отличие от этого, top-down проектирование Китая сверху вниз с самого начала придавало большое значение open source, отражая путь industry-first в соответствии с концепцией независимого контроля.

Еще в 2017 году китайское правительство опубликовало “План развития искусственного интеллекта нового поколения”, в котором четко предлагалось ускорить глубокую интеграцию AI с экономикой и обществом, а также развернуть для создания преимущества первопроходца в развитии AI. В 2021 году контент, связанный с open source, был явно включен в “14-ю пятилетку” Китая, что вызвало активное продвижение технологических инноваций местными органами власти.

Мэй Хун, академик Китайской академии наук, однажды сказал, что будущее развитие языковых моделей должно опираться на open source платформы. Только в открытой среде можно обеспечить безопасность и надежность загрузки данных и интеграции бизнеса для пользователей в различных отраслях.

“Специальный план действий по цифровому расширению прав и возможностей малых и средних предприятий (2025-2027)”, выпущенный Министерством промышленности и информационных технологий и другими четырьмя департаментами в декабре прошлого года, четко поддерживает Open Atom Open Source Foundation в создании “Специального проекта AI Open Source для малых и средних предприятий” для предоставления воспроизводимых и простых в продвижении фреймворков обучения, инструментов тестирования и других ресурсов для снижения технического порога для предприятий.

Более реалистичная проблема заключается в том, что из-за потенциальной технологической блокады со стороны Соединенных Штатов Китай не может просто быть последователем в области AI, но должен построить независимую внутреннюю экосистему. Строительство еще одной closed source экосистемы под экосистемой, которую Соединенные Штаты уже построили с closed source в качестве основного фокуса, равносильно строительству автомобиля за закрытыми дверями. Только open source экосистема может быстро помочь развитию AI индустрии.

В дополнение к поддержке сверху вниз, различные местные органы власти также сделали реальные денежные инвестиции в open source экосистему.

Z Fund, совместно созданный Zhipu и Beijing State-owned Assets, который фокусируется на инвестициях в большую модель экосистемы, объявил, что инвестирует 300 миллионов юаней для поддержки развития AI open source сообщества во всем мире. Любой стартап-проект, основанный на open source моделях (не ограничиваясь open source моделями Zhipu), может подать заявку.

Расхождение между Китаем и Соединенными Штатами в их стратегиях open source и closed source для AI индустрии по существу является фундаментальным различием в логике развития. Соединенные Штаты движимы капиталом, и стремление технологических гигантов и венчурных капиталистов к прибыли породило closed source экосистему “технологической монополии-высокой ценовой реализации”. Даже если Meta попытается открыть source, трудно избежать оков коммерческих барьеров. Китай полагается на проектирование сверху вниз, с “технологическим равенством + промышленным сотрудничеством” в качестве своей основной концепции, и строит открытую экосистему посредством расширения прав и возможностей политики, делая open source базовой инфраструктурой для снижения технических порогов и содействия интеграции реальной экономики. Этот стратегический выбор не только формирует различные пути AI индустрий в двух странах, но и предвещает ускорение глобальной AI экосистемы от “монопольной конкуренции” к “открытой и взаимовыгодной”.

Достаточно хорошо - это достаточно хорошо

Китайская AI open source экосистема не только ускоряет развитие AI индустриализации в Китае и мире, но и ставит веру Соединенных Штатов в технологии прежде всего в неловкую ловушку.

Столкнувшись с растущим давлением, вызванным эффектом DeepSeek, Meta выпустила Llama4 5 апреля, заявив, что это самая сильная мультимодальная большая модель в истории.

Однако, после фактического тестирования, это модель, которая разочаровывает. Длина контекста в 10 миллионов токенов часто дает сбои, начальный тест с мячом трудно завершить, и возникает ошибка размера сравнения 9,11 > 9,9. В течение нескольких дней после запуска модели были также подтверждены внутренними сотрудниками скандалы, такие как отставка руководителей и мошенничество при тестировании.

Больше новостей доказывает, что Llama4 можно назвать продуктом, который Цукерберг поспешил выставить на полки. Итак, вопрос в том, почему Цукербергу пришлось запустить его в апреле?

Как упоминалось ранее, у американской AI индустрии есть сбивающее с толку вера в технологии, полагая, что их продукты должны быть самыми сильными и самыми передовыми, поэтому они начали гонку вооружений. Однако уменьшающийся предельный эффект обучения AI привел к тому, что крупные производители потребляют огромные объемы затрат, и не только не был построен технический порог, но и они попали в трясину узких мест вычислительной мощности.

После того, как OpenAI выпустила функцию генерации изображений GPT-4o, Альтман написал в Твиттере несколько дней спустя, что их графические процессоры “сгорают”. Менее чем через неделю после выпуска Gemini2.5 глава GoogleAIStudio заявил, что они по-прежнему страдают от “ограничений скорости”, и разработчики могут отправлять только 20 запросов в минуту. Кажется, что ни одна компания не может справиться с потребностями в выводе сверхбольших моделей.

Фактически, Соединенные Штаты впадают в заблуждение. Ответственный сотрудник Zhiyuan Research Institute сказал: “Если новая модель использует в 100 раз больше затрат, чтобы получить 10-балльное увеличение эталонной оценки, то эта новая модель бессмысленна для более чем 80% сценариев применения, потому что нет экономической эффективности”.

Китайские компании больших моделей ускоряют open source экосистему. Кажется, они больше не борются за первое место, а вместо этого завоевали больше клиентов, особенно промышленных клиентов, своим подходом “достаточно хорошо”.

По сравнению с десятками миллионов бюджетов для правительственных и корпоративных клиентов, у многих компаний и учреждений есть насущные потребности в AI, но у них нет так много существующих решений. Использование open source моделей для разработки собственных решений стало почти их единственным выбором:

  • Baosteel использует “большую модель + маленькую модель” для ключевых металлургических инженерных процессов для интеллектуального раннего предупреждения производственного оборудования.
  • “Coal Science Guardian Large Model ChinamjGPT” от China Coal Science and Industry Group снижает время простоя оборудования и затраты на обслуживание на 30% и 20% соответственно.
  • Shanghai Mengbo Intelligent Internet of Things Technology создала платформу оптимизации процесса обрезки кромок и непрерывной печи отжига на основе облегченной большой модели.
  • Mifei Technology реализовала интеллектуальное прогнозирование, обслуживание и управление автоматизированными системами обработки материалов на заводах по производству полупроводниковых пластин на основе технологии больших моделей.

Это все репрезентативные случаи внедрения open source моделей в промышленные сценарии.

В дополнение к промышленному использованию, open source экосистема также может помочь большему количеству благотворительных предприятий.

Shanshui Nature Conservation Center занимается защитой снежных барсов и экосистем плато. Инфракрасные камеры, которые он устанавливает, делают большое количество фотографий или видео каждый квартал. Крайне неэффективно и трудоемко полагаться на ручную идентификацию следов снежного барса. Huawei Ascend сотрудничает с Shanshui Nature Conservation Center для идентификации следов снежного барса. Huawei открыла соответствующие модели и инструменты для распознавания видов инфракрасных изображений в Sanjiangyuan, снизив порог для участия в разработке AI и позволив большему количеству исследовательских и защитных учреждений, использующих модель, получить выгоду. Люди могут работать вместе над оптимизацией модели с точки зрения наборов данных, обработки данных и очистки данных.

Эффект “Базара” Open Source

Эрик Рэймонд, знаменосец движения open source программного обеспечения, предложил метафору в своей книге 1999 года “Собор и базар”: Традиционная модель разработки программного обеспечения с закрытым source подобна строительству собора. Программное обеспечение тщательно проектируется и строится несколькими экспертами (архитекторами) в изолированной среде и выпускается для пользователей только после его окончательного завершения; Модель разработки open source подобна шумному, казалось бы, хаотичному, но оживленному базару. Разработка программного обеспечения является открытой, децентрализованной и эволюционной.

Книга считает, что для многих типов программных проектов, особенно сложных программных проектов системного уровня (таких как ядра операционных систем), открытая, совместная и децентрализованная модель разработки “базара”, хотя она может показаться хаотичной, на самом деле более эффективна, производит более качественное и надежное программное обеспечение, чем традиционная, закрытая и централизованная модель “собора”. Она может быстрее обнаруживать и исправлять ошибки и лучше поглощать отзывы пользователей и вклад сообщества посредством таких механизмов, как “выпускать рано, выпускать часто” и использовать масштабную экспертную оценку (“достаточно глазных яблок”), тем самым способствуя быстрой итерации и инновациям программного обеспечения.

Огромный успех open source проектов, таких как Linux, подтвердил точку зрения Рэймонда.

Движение open source принесло Соединенным Штатам и миру огромную ценность, намного превосходящую его собственные инвестиции. В исследовательском отчете Гарвардского университета за 2024 год говорится: “Open source инвестировала 4,15 миллиарда долларов и создала 8,8 триллиона долларов стоимости для компаний (то есть каждый вложенный доллар создает 2000 долларов стоимости). Без open source расходы компаний на программное обеспечение были бы в 3,5 раза больше, чем сейчас”.

Сегодня китайские компании этому научились. Американские AI компании, кажется, забыли об этом.

Фактически, для китайских компаний больших моделей, даже если они не учитывают социальные выгоды, выбор в пользу open source экосистемы не является невыгодным для самих компаний.

Многие компании больших моделей сообщили Observer.com, что open source не означает отказ от коммерциализации. Open source по-прежнему имеет логику прибыли open source. По сравнению с тем, является ли это open source или нет, ключевым вопросом является то, как лучше технически обслуживать клиентов.

В качестве примера можно привести Zhipu AI, которая утверждает, что является единственной компанией в Китае, которая полностью сопоставляет OpenAI, но по сравнению со стратегией closed source OpenAI, она является одним из самых решительных практиков стратегии open source в отрасли.

Zhipu первой открыла первую в Китае большую модель чата ChatGLM-6B в 2023 году. С момента своего основания почти шесть лет назад Zhipu открыла более 55 моделей, с совокупным объемом загрузок почти 40 миллионов раз в международном open source сообществе.

Zhipu сообщила Observer.com, что Zhipu надеется, что ее open source стратегия внесет вклад в превращение Пекина в “глобальную open source столицу” для искусственного интеллекта.

В частности, на коммерческом уровне Zhipu решила привлечь экосистему разработчиков через open source и предоставить платные индивидуальные решения для клиентов B-end и G-end.

В дополнение к продаже решений, продажа API также является важным звеном прибыли.

В качестве примера можно привести DeepSeek, первым бизнесом open source модели является продажа высокопроизводительных API. Хотя базовые услуги бесплатны, компании могут предоставлять высокопроизводительные услуги API и взимать плату на основе использования. Цена API для DeepSeek-R1 составляет 1 юань за миллион входных токенов и 16 юаней за миллион выходных токенов. Если бесплатная квота токенов исчерпана или базовый API не может удовлетворить потребности, пользователи, как правило, используют платную версию для поддержания стабильности бизнес-процессов.

По сравнению с компаниями, которые имеют только модельные услуги, Alibaba выбрала другую модель монетизации open source: связывание экосистемы.

Серия Qwen от Alibaba, как open source пионер, привлекает разработчиков к использованию облачных вычислений и другой инфраструктуры посредством полномасштабного open source, формируя сценарий замкнутого цикла. Их модель является лишь введением на ранней стадии, а товарами с указанными ценами на самом деле являются облачные сервисы.

Глобализация применения китайских open source больших моделей перешла от “следования за технологиями” к “доминированию экосистемы”. Когда Соединенные Штаты застряли в дилемме “closed source монополии” и “open source выхода из-под контроля”, Китай реконструирует основную логику глобальной AI open source экосистемы посредством “согласования инноваций + культивирования сценариев”. Конечным полем битвы этой игры является не конкуренция масштаба параметров, а триллионный рынок глубокой интеграции AI технологий и реальной экономики.