Qwen3 от Alibaba: Новая волна AI-приложений

Постоянно развивающийся ландшафт искусственного интеллекта (AI) пополняется новыми моделями и достижениями. Недавний открытый релиз компанией Alibaba модели Tongyi Qianwen следующего поколения, Qwen3, привлек значительное внимание. Qwen3, отличаясь меньшим размером параметров, сниженными затратами и улучшенной производительностью по сравнению с другими ведущими моделями, позиционирует себя как сильный претендент на мировой арене AI.

Qwen3 выделяется как новаторская модель гибридного рассуждения в Китае, предлагающая убедительное сочетание улучшенной производительности и сниженных затрат. Обладая общим количеством параметров в 235 миллиардов, она требует значительно меньше ресурсов для развертывания по сравнению с другими моделями с аналогичными возможностями. Такая экономическая эффективность делает Qwen3 привлекательным вариантом для организаций, стремящихся использовать мощь больших языковых моделей, не разоряя при этом бюджет.

Расширение возможностей AI-агентов и приложений

Одним из ключевых моментов Qwen3 является ее потенциал для ускорения разработки и развертывания AI-агентов и приложений больших языковых моделей. В оценках возможностей модельных агентов Qwen3 достигла впечатляющих результатов, превзойдя другие модели высшего уровня. Это говорит о том, что Qwen3 может снизить барьер для входа в разработку и развертывание AI-агентов, что потенциально приведет к всплеску инновационных приложений.

Растущий спрос на возможности вызова инструментов в AI-агентах

AI-агенты все чаще используются для автоматизации сложных задач и взаимодействия с реальным миром. Возможности, требуемые от AI-агента, зависят от сложности и автономности задач, для выполнения которых он предназначен.

Надежная система AI-агента обычно требует от базовой модели следующих возможностей:

  • Базовое понимание и генерация языка: Способность точно интерпретировать инструкции, понимать контекст и генерировать ответы на естественном языке.

  • Использование и вызов инструментов: Способность понимать и использовать внешние инструменты, включая API, для выполнения конкретных задач.

  • Рассуждение и планирование: Способность разбивать сложные цели на более мелкие подзадачи и выполнять их в логической последовательности.

Qwen3 решает критическую потребность в улучшенных возможностях вызова инструментов в AI-агентах. Она может интегрировать внешние инструменты с высокой точностью, как в режиме мышления, так и в режиме без мышления, что делает ее ведущей моделью с открытым исходным кодом для сложных задач на основе агентов.

В оценках возможностей модельных агентов Qwen3 достигла высокой оценки, превзойдя другие модели высшего уровня. Это означает значительное снижение барьеров для входа в разработку и развертывание AI-агентов.

Qwen3 изначально поддерживает протокол MCP и обладает надежными возможностями вызова инструментов. В сочетании с фреймворком Qwen-Agent, который инкапсулирует шаблоны и парсеры вызова инструментов, он упрощает процесс разработки и обеспечивает эффективную работу агентов на мобильных и компьютерных устройствах. Разработчики могут определять доступные инструменты на основе файлов конфигурации MCP и интегрировать их с помощью фреймворка Qwen-Agent или других пользовательских инструментов. Это позволяет быстро разрабатывать интеллектуальных агентов с базами знаний и возможностями использования инструментов.

Кроме того, Qwen3 демонстрирует высокую производительность в базовом понимании и генерации языка, а также в способностях к рассуждению.

Это означает, что при эквивалентных возможностях модели стоимость вызова моделей для агентов и отраслей AI-приложений ниже, а вызов более удобен, что неизбежно будет способствовать появлению большего количества новых агентов и AI-приложений.

Приверженность открытому исходному коду

Alibaba подтвердила свою приверженность сообществу открытого исходного кода, предложив разнообразный спектр моделей Qwen3. Это включает в себя две модели Mixture-of-Experts (MoE) с 30 миллиардами и 235 миллиардами параметров, а также шесть плотных моделей с различными размерами.

30-миллиардная модель MoE обеспечивает значительное повышение производительности, обеспечивая производительность, сопоставимую с моделью Qwen2.5-32B предыдущего поколения. Плотные модели также демонстрируют улучшенную производительность, причем даже меньшие модели достигают впечатляющих результатов.

Поскольку все модели Qwen3 являются моделями гибридного рассуждения, API можно настроить по мере необходимости для установки ‘бюджетов мышления’ (то есть ожидаемого максимального количества токенов для углубленного мышления) для выполнения различных степеней мышления и гибкого удовлетворения разнообразных потребностей AI-приложений и различных сценариев для производительности и стоимости. Малые и средние предприятия и разработчики AI могут гибко выбирать модели в соответствии со своими потребностями, что неизбежно снизит порог и стоимость использования больших моделей. Эти команды с очень ограниченными средствами и персоналом могут направить больше ресурсов и энергии на рынок и выявление потребностей и проблем пользователей, чтобы они могли разрабатывать более инновационные приложения.

Технологический фундамент Alibaba

После 16 лет разработки Alibaba всесторонне реконструировала технологическую архитектурную систему полного стека от базового оборудования до вычислительных, хранилищ, сети, обработки данных, обучения моделей и платформ рассуждений, что сделало ее ведущей платформой облачных вычислений в Азиатско-Тихоокеанском регионе. Alibaba также является одной из первых технологических компаний в мире, инвестировавших в исследования больших моделей.

Ранее Чжоу Цзиньжэнь заявил в интервью СМИ, что разработка больших моделей неотделима от поддержки облачной системы. Будь то обучение или рассуждение, каждый прорыв в больших моделях, на первый взгляд, является эволюцией возможностей модели, но за этим стоит всестороннее сотрудничество и модернизация всей платформы облачных вычислений и данных и инженерии. Мультимодальность также является важным путем к AGI.

Международное признание

Релиз Qwen3 привлек внимание в глобальном масштабе. После выпуска Alibaba Qwen 3 Илон Маск заявил в социальной сети X, что ранняя бета-версия Grok 3.5 будет выпущена для подписчиков SuperGrok на следующей неделе, утверждая, что это первый AI, который может точно отвечать на вопросы о ракетных двигателях или электрохимических технологиях.

Стимулирование инноваций и доступности

Сунь Маосун, исполнительный вице-президент Института искусственного интеллекта Университета Цинхуа и иностранный академик Европейской академии гуманитарных и естественных наук, заявил, что в последние годы Китай вносит большой вклад в развитие искусственного интеллекта, особенно в области больших моделей. Появление DeepSeek и серии продуктов с открытым исходным кодом от Tongyi Qianwen значительно продвинуло маршрут открытого исходного кода отечественных больших моделей, что, несомненно, имеет большое значение для ослабления технологических монополий, содействия технологическому равенству и повышения инклюзивности искусственного интеллекта.

В настоящее время количество моделей, производных от Qwen, в сообществах открытого исходного кода дома и за рубежом превысило 100 000, превзойдя серию моделей, производных от Llama, а Tongyi Qianwen Qwen занимает первое место в мире по величине группы генеративных языковых моделей. Согласно последнему глобальному списку больших моделей с открытым исходным кодом от Huggingface от 10 февраля 2025 года, первая десятка больших моделей с открытым исходным кодом - это все производные модели на основе моделей с открытым исходным кодом Tongyi Qianwen Qwen.

Сунь Маосун считает, что это означает, что культура больших моделей в Китае получила международное признание, что является культурным сдвигом. Это очень ценно и представляет собой признание развития и технологий больших моделей в Китае.