Ландшафт искусственного интеллекта, который когда-то казался под властью горстки титанов Кремниевой долины, таких как OpenAI, Google, Meta и Microsoft, претерпевает захватывающую трансформацию. В то время как эти признанные игроки продолжают свою гонку разработок с высокими ставками, часто скрывая свои самые передовые возможности за платными подписками, мощное контртечение набирает обороты. Новая волна претендентов, особенно из инновационных центров Китая, демонстрирует, что передовой ИИ не обязательно требует непомерных затрат или проприетарной секретности. Компании, такие как DeepSeek, Alibaba и Baidu, выходят на мировую арену, продвигая мощные модели, которые часто предлагаются как альтернативы с открытым исходным кодом или по низкой цене, коренным образом бросая вызов преобладающим бизнес-моделям и расширяя возможности для разработчиков и пользователей по всему миру.
Эта формирующаяся динамика представляет собой нечто большее, чем просто выход на арену новых конкурентов; она сигнализирует о потенциальном сдвиге в философии, лежащей в основе разработки и доступности ИИ. Решение этих новых игроков выпускать сложные модели под разрешительными лицензиями, делая базовый код легко доступным на платформах вроде GitHub и Hugging Face, резко контрастирует с часто непрозрачным подходом ‘закрытого сада’, предпочитаемым некоторыми западными гигантами. Эта открытость не только демократизирует доступ к мощным инструментам, но и способствует развитию живой экосистемы, где разработчики могут свободно экспериментировать, настраивать и строить на основе этих фундаментальных моделей, потенциально ускоряя инновации беспрецедентными темпами. Давайте углубимся в три ярких примера, возглавляющих это движение, исследуя их происхождение, возможности и последствия их открытых стратегий.
DeepSeek: Гибкий новичок, сотрясающий устои
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., действующая под более лаконичным названием DeepSeek, ворвалась на международную арену ИИ с поразительной скоростью и влиянием. Будучи относительно молодой компанией, официально созданной в апреле 2023 года как дочернее предприятие фирмы количественного трейдинга High-Flyer Quant, DeepSeek быстро привлекла внимание разработкой моделей ИИ, которые соперничали, а по некоторым тестам, как сообщается, превосходили модели отраслевых гигантов с гораздо более длительными циклами разработки и значительно большими бюджетами. Эта способность достигать конкурентоспособной производительности с кажущейся большей эффективностью вызвала волнение в секторе.
Примечателен быстрый цикл итераций компании. Начав со своей первоначальной DeepSeek-LLM, она быстро выпустила специализированные модели, такие как DeepSeek-Math. Анонс DeepSeek V2 и впоследствии DeepSeek V3 в конце 2024 года уже сигнализировал об амбициозной траектории компании. Однако именно представление ее моделей рассуждений, DeepSeek-R1 и DeepSeek-R1-Zero, в январе 2025 года по-настоящему захватило воображение отрасли и, возможно, ознаменовало поворотный момент. Эти модели вызвали прямые и часто лестные сравнения с передовой серией GPT-4 от OpenAI и ее ожидаемой моделью ‘o1’, вызвав значительные дискуссии о состоянии дел в области ИИ-рассуждений. Представление было не просто академическим; сообщалось, что оно повлияло на цены акций конкурентов, побудило к стратегическим переоценкам в признанных лабораториях ИИ и даже вызвало обсуждения среди правительственных органов относительно последствий появления такого мощного, доступного ИИ от новых глобальных игроков.
DeepSeek применяет то, что она называет стратегией ‘открытых весов’ (‘open weight’) для многих своих моделей, выпуская их под разрешительной лицензией MIT License. Хотя это может не равняться 100% открытому исходному коду в самом строгом определении (поскольку некоторые аспекты обучающих данных или методологии могут оставаться проприетарными), это представляет собой значительную степень открытости. Важно отметить, что веса модели – параметры, которые инкапсулируют усвоенные знания модели – становятся доступными. Это позволяет разработчикам загружать модели из репозиториев, таких как GitHub и Hugging Face, давая им возможность запускать модели локально, дообучать их для конкретных задач, интегрировать их в уникальные приложения или просто изучать их архитектуру. Этот уровень доступа далек от взаимодействия исключительно через ограниченный API или закрытый веб-интерфейс.
С точки зрения пользователя, DeepSeek в основном проявляется как инструмент ИИ в стиле чат-бота, доступный через веб-интерфейс и специальные мобильные приложения для платформ iOS и Android. Его растущее влияние подтверждается растущим списком партнерств. Технология DeepSeek интегрируется или исследуется крупными технологическими игроками, включая, по сообщениям, Lenovo, Tencent, Alibaba и Baidu, демонстрируя ее потенциальную применимость в различных аппаратных и программных экосистемах. Взлет DeepSeek подчеркивает ключевую тему: значительные прорывы в ИИ больше не являются исключительной прерогативой давно существующих исследовательских лабораторий, а эффективная разработка в сочетании со стратегической открытостью может быстро изменить конкурентный ландшафт.
Qwen от Alibaba: Открытость в масштабе от гиганта электронной коммерции
В то время как DeepSeek представляет собой проворный стартап, бросающий вызов статус-кво, Alibaba Qwen (Tongyi Qianwen) означает стратегическое принятие открытости одним из крупнейших технологических конгломератов Китая и, по сути, мира. Alibaba, известная своей обширной империей электронной коммерции, облачными вычислениями и разнообразными технологическими предприятиями, вступила в гонку генеративного ИИ со значительными ресурсами и амбициями. Семейство больших языковых моделей Qwen быстро зарекомендовало себя среди ведущих предложений с открытым исходным кодом во всем мире.
Путь начался с бета-релиза в апреле 2023 года, быстро набравшего популярность в сообществе ИИ, поскольку Alibaba постепенно выпускала различные модели под лицензиями с открытым исходным кодом в течение того года. Эта приверженность открытости в значительной степени сохранилась и в последующих итерациях. Хотя некоторые узкоспециализированные или коммерчески чувствительные версии могут иметь другие лицензии, основные модели серии Qwen, включая Qwen 2, мультимодальную серию Qwen-VL (обрабатывающую как текст, так и изображения), Qwen-Audio и математически ориентированную Qwen2-Math, часто предоставлялись под разрешительными лицензиями, такими как Apache 2.0 License. Это позволяет широкое коммерческое и исследовательское использование, дополнительно стимулируя внедрение. Как и DeepSeek, эти модели легко доступны мировому сообществу разработчиков через такие платформы, как GitHub и Hugging Face.
Alibaba не стеснялась позиционировать свои модели напрямую против лучших в отрасли. Анонс Qwen 2.5-Max в январе 2025 года и мультимодальной Qwen2.5-VL в марте 2025 года сопровождался смелыми заявлениями, позиционирующими их как обладающие возможностями, превосходящими или соперничающими с известными моделями, такими как GPT-4o от OpenAI, V3 от DeepSeek и мощной Llama-3.1-405B от Meta. Хотя результаты тестов могут быть предметом интерпретации и конкретных оценок задач, последовательное развитие и конкурентное позиционирование подчеркивают серьезные намерения Alibaba в области ИИ.
Интересно, что первоначальная модель Qwen признавала свое наследие, частично основываясь на фундаментальной Llama LLM от Meta – сама по себе знаковая версия с открытым исходным кодом, которая катализировала большую активность в этой области. Однако Alibaba значительно модифицировала и развила эту основу, разработав свои собственные уникальные архитектуры и методологии обучения для последующих поколений Qwen. Эта эволюция подчеркивает общую закономерность в мире открытого исходного кода: создание на основе существующей работы для получения новых и улучшенных возможностей.
Влияние открытой стратегии Qwen, возможно, лучше всего иллюстрируется приведенной ошеломляющей статистикой: сообщается, что на основе открытого исходного кода Qwen было разработано более 90 000 независимых моделей. Эта цифра красноречиво говорит о силе открытого распространения. Она означает процветающую экосистему, где исследователи, стартапы и отдельные разработчики используют фундаментальную работу Alibaba для создания специализированных инструментов, проведения новых экспериментов и расширения границ ИИ в различных направлениях. Для конечных пользователей Qwen обычно доступен через знакомый интерфейс чат-бота, доступный в Интернете и через мобильные приложения на iOS и Android. Подход Alibaba демонстрирует, что даже технологические гиганты могут стратегически использовать открытый исходный код для стимулирования инноваций, создания сообщества и эффективной конкуренции на мировой арене ИИ.
Ernie от Baidu: Стратегический сдвиг от поискового гиганта
Baidu, которую часто называют китайским Google из-за ее доминирования на рынке поисковых систем, привносит в гонку ИИ наследие иного рода. В отличие от DeepSeek или даже относительно недавнего толчка Alibaba в области LLM, Baidu уже много лет глубоко вовлечена в исследования ИИ, особенно в области обработки естественного языка. Ее линейка моделей ERNIE (Enhanced Representation through Knowledge Integration) берет свое начало в 2019 году, предшествуя публичному ажиотажу, вызванному ChatGPT.
Публичный толчок в области генеративного ИИ начался всерьез с выпуска Ernie 3.0 LLM в марте 2023 года, за которым последовала Ernie 3.5 в июне 2023 года. Первоначально Baidu приняла более традиционный многоуровневый подход, схожий с некоторыми западными аналогами. Более продвинутая Ernie 4.0, выпущенная в октябре 2023 года, была в основном зарезервирована для продуктов Baidu на основе подписки, в то время как способная Ernie 3.5 лежала в основе бесплатной версии ее чат-бота, известного как Ernie Bot.
Однако конкурентная динамика в индустрии ИИ, характеризующаяся быстрыми достижениями конкурентов (как внутренних, так и международных) и растущей жизнеспособностью стратегий с открытым исходным кодом, в сочетании с потенциально снижающимися затратами на производство моделей, похоже, побудила к значительному стратегическому повороту. Baidu сигнализировала о решительном сдвиге в сторону большей открытости. Хотя текущие модели Ernie, лежащие в основе ее основных сервисов, изначально не были с открытым исходным кодом, компания объявила о планах кардинально изменить эту траекторию.
Выпуск Ernie 4.5 LLM и специальной модели рассуждений Ernie X1 в середине марта 2025 года немедленно вызвал сравнения с GPT-4.5 от OpenAI и R1 от DeepSeek соответственно, поместив Baidu твердо в высший эшелон поставщиков моделей ИИ. Важно отметить, что наряду с этими заявлениями о производительности Baidu объявила четкую дорожную карту к открытости. Компания заявила о своем намерении сделать свои основные модели с открытым исходным кодом начиная с 30 июня. Кроме того, она объявила, что ее чат-бот Ernie Bot станет бесплатным для всех пользователей с 1 апреля, устранив предыдущий барьер подписки для доступа к ее наиболее способному разговорному ИИ. Заглядывая вперед, Baidu также указала, что ее следующая крупная итерация, Ernie 5, ожидаемая во второй половине 2025 года, аналогичным образом примет философию открытого исходного кода и бесплатного использования.
Эта стратегическая переориентация игрока такого масштаба, как Baidu, весьма значительна. Она предполагает признание того, что открытость может становиться конкурентной необходимостью, а не просто альтернативным путем. Делая свои передовые модели свободно доступными, Baidu может взрастить сообщество разработчиков, стимулировать инновации вокруг своей платформы и потенциально захватить значительную долю внимания среди пользователей, ищущих мощные, неограниченные инструменты ИИ.
Как и у ее конкурентов, основной пользовательский интерфейс для Ernie - это чат-бот, доступный через веб и мобильные приложения (iOS и Android). Возможности Ernie также нашли свое применение в реальных потребительских продуктах, в частности, будучи интегрированными в функции ИИ международной версии смартфона Samsung Galaxy S24. Эта интеграция представляет собой конкретный пример того, как эти передовые языковые модели выходят за рамки исследовательских лабораторий и веб-интерфейсов в устройства, которыми ежедневно пользуются миллионы людей. Развивающаяся стратегия Baidu подчеркивает текучесть ландшафта ИИ, где даже признанные гиганты адаптируют свои подходы в ответ на технологический прогресс и меняющиеся ожидания рынка.
Навигация по расширяющейся вселенной ИИ
Появление мощных, доступных моделей ИИ от DeepSeek, Alibaba и Baidu означает нечто большее, чем просто усиление конкуренции для признанных игроков, таких как OpenAI и Google. Оно представляет собой фундаментальное расширение выбора и возможностей для разнообразного круга пользователей и разработчиков. Доступность этих моделей, часто под разрешительными лицензиями с открытым исходным кодом или ‘открытыми весами’, значительно снижает барьер для входа в инновации. Малые предприятия, отдельные разработчики, исследователи и студенты теперь могут получать доступ и использовать возможности ИИ, которые ранее были ограничены крупными корпорациями или дорогими уровнями подписки.
Это распространение подпитывает несколько положительных тенденций:
- Кастомизация: Разработчики могут дообучать эти открытые модели на конкретных наборах данных для создания узкоспециализированных инструментов ИИ, адаптированных для нишевых отраслей или уникальных задач, выходя за рамки общих решений ‘один размер для всех’.
- Экспериментирование: Возможность загружать и изменять веса моделей позволяет глубже исследовать архитектуры и возможности ИИ, способствуя академическим исследованиям и низовым инновациям.
- Снижение затрат: Для пользователей и организаций, уставших от повторяющихся абонентских плат, эти бесплатные или недорогие альтернативы предлагают мощную функциональность без связанного финансового бремени, потенциально демократизируя доступ к инструментам ИИ, повышающим производительность.
- Рост экосистемы: Доступность через платформы, такие как GitHub и Hugging Face, культивирует живые сообщества вокруг этих моделей, предлагая общие ресурсы, поддержку и возможности для совместной разработки.
Однако навигация по этой расширенной вселенной требует тщательного рассмотрения. Выбор модели ИИ включает в себя больше, чем просто сравнение тестов производительности. Такие факторы, как качество и доступность документации, отзывчивость сообщества разработчиков, конкретные сильные и слабые стороны модели (например, навыки кодирования против творческого письма против мультимодального понимания) и вычислительные ресурсы, необходимые для эффективного запуска или дообучения модели, являются решающими элементами в процессе принятия решений. Хотя облачные платформы предлагают масштабируемые ресурсы, возможность запускать мощные модели локально на способном оборудовании является привлекательным предложением, которое стало возможным благодаря некоторым открытым релизам.
Кроме того, рост этих мощных альтернатив неизбежно ставит стратегические вопросы перед действующими игроками. Вынудит ли давление со стороны высококачественных моделей с открытым исходным кодом западных гигантов ИИ принять более открытые стратегии, возможно, путем выпуска старых моделей или предложения более щедрых бесплатных уровней? Или они удвоят ставку на проприетарные функции, привязку к экосистеме и решения, ориентированные на предприятия, чтобы сохранить свое преимущество? Конкурентное взаимодействие динамично и постоянно развивается.
Геополитическое измерение также добавляет сложности, поскольку разработка передовых возможностей ИИ за пределами традиционных западных центров несет значительные долгосрочные последствия для технологического лидерства и глобальных стандартов. По мере того как эти мощные инструменты становятся все более широко распространенными, дискуссии вокруг ответственной разработки ИИ, этических принципов и потенциального злоупотребления также становятся все более актуальными для всех игроков, независимо от их происхождения или модели лицензирования. Гонка ИИ однозначно расширилась, предлагая более богатый, сложный и, в конечном счете, более доступный ландшафт, чем когда-либо прежде. Задача и возможность теперь заключаются в ответственном и эффективном использовании этого расширенного потенциала.