Расширение экосистемы ИИ в Китае
5 марта китайский технологический гигант Alibaba представил свою новейшую модель логического вывода искусственного интеллекта — разработку, которая привела к росту акций компании, котирующихся на Гонконгской бирже, на впечатляющие 8%. Хотя эта новая модель, получившая название QwQ-32B, возможно, еще не может конкурировать с возможностями ведущих систем ИИ в Соединенных Штатах, она, как сообщается, соответствует производительности своего отечественного конкурента, модели R1 от DeepSeek. Что отличает QwQ-32B, так это значительно меньшая потребность в вычислительных мощностях, как при разработке, так и при текущей эксплуатации. Создатели QwQ-32B утверждают, что она воплощает в себе «древний философский дух», подходя к проблемам с чувством «подлинного удивления и сомнения».
«Этот выпуск подчеркивает общую конкурентоспособность передовой экосистемы ИИ Китая», — отмечает Скотт Сингер, приглашенный научный сотрудник Программы технологий и международных отношений Фонда Карнеги за международный мир. Эта экосистема представляет собой динамичный ландшафт, населенный такими игроками, как DeepSeek с его моделью R1 и Tencent с его моделью Hunyuan. Примечательно, что соучредитель Anthropic Джек Кларк признал Hunyuan «мировым классом» в определенных аспектах. Однако важно отметить, что оценки последней модели Alibaba все еще находятся на ранней стадии. Неотъемлемая сложность измерения возможностей модели в сочетании с тем фактом, что QwQ-32B оценивалась только внутри компании Alibaba, означает, что «информационная среда сейчас не очень богата», как указывает Сингер.
Дебют модели R1 от DeepSeek в январе уже вызвал волну на мировом фондовом рынке, выдвинув технологическую экосистему Китая в центр международного внимания. Это внимание еще больше усиливается растущим в США восприятием гонки с Китаем за достижение общего искусственного интеллекта (AGI). AGI представляет собой гипотетический уровень развития ИИ, при котором системы обладают способностью выполнять широкий спектр когнитивных задач, от графического дизайна до исследований в области машинного обучения, на уровне, сравнимом с человеческими возможностями или превосходящем их.
Стратегические последствия AGI
Широко распространено мнение, что разработка AGI предоставит значительное военное и стратегическое преимущество тому, кто первым ее достигнет, будь то компания или правительство. Потенциальные применения такой системы обширны и преобразующи, начиная от передовых возможностей кибервойны и заканчивая созданием новых видов оружия массового уничтожения.
«Мы уверены, что объединение более сильных базовых моделей с обучением с подкреплением, основанным на масштабируемых вычислительных ресурсах, приблизит нас к достижению AGI», — заявила команда, ответственная за последнюю модель Alibaba. Это стремление к AGI является общей нитью, проходящей через большинство ведущих лабораторий ИИ. Заявленная цель DeepSeek — «разгадать тайну AGI с любопытством». Точно так же миссия OpenAI состоит в том, чтобы «гарантировать, что общий искусственный интеллект — системы ИИ, которые в целом умнее людей, — принесет пользу всему человечеству». Известные руководители компаний, занимающихся ИИ, выразили надежду, что системы, подобные AGI, могут появиться в течение текущего срока полномочий президента Трампа.
Возвращение Джека Ма и технологический ландшафт Китая
Недавний прорыв Alibaba в области ИИ произошел вскоре после заметного публичного появления соучредителя компании Джека Ма. Он сидел в первом ряду во время встречи президента Си Цзиньпина с ведущими бизнесменами Китая. Это ознаменовало значительный сдвиг для Ма, который в значительной степени ушел из поля зрения общественности с 2020 года. Его предыдущая критика государственных регуляторов и государственных банков за то, что они препятствуют инновациям и действуют с «менталитетом ломбарда», по-видимому, привела к периоду снижения видимости.
Во время отсутствия Ма в центре внимания китайское правительство приняло ряд мер, направленных против технологической индустрии. Были введены более строгие правила, касающиеся того, как компании могут использовать данные и участвовать в рыночной конкуренции. Одновременно правительство усилило контроль над ключевыми цифровыми платформами.
Смена приоритетов: от технологических репрессий к экономическому возрождению
К 2022 году наметился заметный сдвиг в фокусе правительства. Воспринимаемая угроза, исходящая от технологической индустрии, казалось, ослабла по сравнению с надвигающейся проблемой экономического застоя. «Эта история экономического застоя и попытки обратить его вспять действительно во многом определили политику за последние 18 месяцев», — объясняет Сингер. В настоящее время Китай активно стремится к внедрению передовых технологий. Сообщается, что по меньшей мере 13 городских правительств и 10 государственных энергетических компаний уже интегрировали модели DeepSeek в свои операционные системы.
Тенденция повышения эффективности ИИ
Модель Alibaba иллюстрирует продолжающуюся тенденцию в области ИИ: постоянное повышение производительности системы наряду со снижением эксплуатационных расходов. Epoch AI, некоммерческая исследовательская организация, подсчитала, что вычислительная мощность, необходимая для обучения систем ИИ, увеличивается более чем в 4 раза ежегодно. Однако одновременные достижения в разработке алгоритмов привели к трехкратному увеличению эффективности этой вычислительной мощности каждый год. На практике это означает, что система ИИ, для обучения которой в прошлом году могло потребоваться 10 000 передовых компьютерных чипов, в этом году может быть обучена только с третью этого числа.
Решающая роль высокопроизводительных вычислительных чипов
Несмотря на эти впечатляющие успехи в области эффективности, Сингер предупреждает, что высокопроизводительные вычислительные чипы остаются незаменимыми для разработки передового ИИ. Эта реальность подчеркивает сохраняющуюся проблему, создаваемую экспортным контролем США в отношении этих чиповдля китайских компаний, занимающихся ИИ, таких как Alibaba и DeepSeek. Генеральный директор DeepSeek особо отметил доступ к чипам, а не финансовые ресурсы или таланты, как основное узкое место.
Новая парадигма: «Модели рассуждений»
QwQ представляет собой новейшее дополнение к растущему поколению систем ИИ, классифицируемых как «модели рассуждений». Некоторые эксперты рассматривают это как смену парадигмы в области ИИ. Ранее системы ИИ совершенствовались за счет сочетания увеличения вычислительной мощности, используемой для обучения, и повышения количества и качества обучающих данных.
Эта новая парадигма подчеркивает иной подход. Он включает в себя использование модели, которая уже прошла начальное обучение — в данном случае Qwen 2.5-32B, — а затем значительное увеличение вычислительных ресурсов, выделяемых системе, когда она отвечает на конкретный запрос. Как красноречиво выразилась команда Qwen, «когда модели дается время на размышления, вопросы и рефлексию, ее понимание математики и программирования расцветает, как цветок, раскрывающийся навстречу солнцу». Это наблюдение согласуется с тенденциями, наблюдаемыми в западных моделях, где методы, позволяющие увеличить время «размышления», привели к значительному повышению производительности при решении сложных аналитических задач.
Выпуск с открытыми весами и динамика рынка
QwQ от Alibaba была выпущена под моделью «открытых весов». Это означает, что веса, которые по сути составляют модель и доступны в виде компьютерного файла, можно загрузить и запустить локально, даже на высокопроизводительном ноутбуке. Интересно, что предварительный просмотр модели, выпущенный в ноябре прошлого года, привлек значительно меньше внимания. Сингер отмечает, что «фондовый рынок, как правило, реагирует на выпуски моделей, а не на траекторию развития технологии», которая, как ожидается, продолжит свое быстрое развитие по обе стороны Тихого океана. Он также подчеркивает: «В китайской экосистеме есть множество игроков, каждый из которых выпускает очень мощные и убедительные модели, и неясно, кто в конечном итоге окажется обладателем лучшей модели».
Подробное изучение архитектуры QwQ-32B
Модель QwQ-32B, хотя и построена на основе Qwen 2.5-32B, включает в себя несколько ключевых архитектурных модификаций и улучшений обучения, которые способствуют ее улучшенным способностям к рассуждению. Эти улучшения можно условно разделить на следующие категории:
Расширение контекстного окна: Контекстное окно, которое определяет объем текста, который модель может рассматривать одновременно, вероятно, было значительно расширено. Это позволяет QwQ-32B обрабатывать и понимать более длинные и сложные отрывки текста, что приводит к лучшему пониманию и более тонким ответам.
Улучшенные механизмы внимания: Механизм внимания, основной компонент моделей на основе трансформеров, таких как QwQ-32B, вероятно, был усовершенствован. Это может включать в себя такие методы, как многоголовое внимание или разреженное внимание, что позволяет модели более эффективно сосредотачиваться на релевантной информации во входном тексте и отфильтровывать шум.
Обучение с подкреплением на основе обратной связи от человека (RLHF): Хотя это и не указано явно, весьма вероятно, что QwQ-32B была точно настроена с использованием RLHF. Этот метод включает в себя обучение модели генерировать выходные данные, которые предпочитают люди-оценщики, что приводит к улучшениям в таких областях, как согласованность, полезность и безвредность.
Настройка инструкций: QwQ-32B, возможно, прошла обширную настройку инструкций — процесс, при котором модель обучается на разнообразном наборе инструкций и соответствующих выходных данных. Это помогает модели лучше обобщать новые задачи и более точно следовать инструкциям.
Подсказки цепочки мыслей: Модель явно разработана для использования подсказок цепочки мыслей — метода, при котором модель побуждается генерировать серию промежуточных шагов рассуждения, прежде чем прийти к окончательному ответу. Это способствует более обдуманному и логичному рассуждению.
Последствия для конкретных отраслей
Достижения, воплощенные в QwQ-32B и других китайских моделях ИИ, имеют значительные последствия для различных отраслей, как в Китае, так и во всем мире. Некоторые ключевые сектора, которые, вероятно, будут затронуты, включают:
Электронная коммерция: Основной бизнес Alibaba, электронная коммерция, может значительно выиграть от улучшения возможностей ИИ. Это включает в себя такие области, как персонализированные рекомендации, чат-боты для обслуживания клиентов, обнаружение мошенничества и оптимизация цепочки поставок.
Финансы: Модели ИИ могут использоваться для таких задач, как оценка рисков, обнаружение мошенничества, алгоритмическая торговля и управление взаимоотношениями с клиентами. Повышенные способности к рассуждению таких моделей, как QwQ-32B, могут привести к более точным финансовым прогнозам и улучшению принятия решений.
Здравоохранение: ИИ может помочь в открытии лекарств, диагностике заболеваний, персонализированной медицине и мониторинге пациентов. Более мощные модели рассуждений могут анализировать сложные медицинские данные и предоставлять информацию, которая ранее была недоступна.
Производство: Автоматизация на основе ИИ, контроль качества и профилактическое обслуживание могут повысить эффективность и снизить затраты в производственных процессах.
Транспорт: Беспилотные автомобили, системы управления дорожным движением и оптимизация логистики в значительной степени зависят от ИИ. Достижения в области рассуждений ИИ могут способствовать созданию более безопасных и эффективных транспортных сетей.
Образование: Модели ИИ все чаще используются для обеспечения лучшей поддержки студентов и даже персонализированного обучения.
Будущее конкуренции и сотрудничества в области ИИ
Быстрый прогресс китайских моделей ИИ, таких как QwQ-32B, поднимает важные вопросы о будущем конкуренции и сотрудничества в области ИИ в глобальном масштабе. Хотя конкурентная динамика, несомненно, существует, особенно между США и Китаем, есть также потенциальные выгоды от сотрудничества и обмена знаниями.
Открытый исходный код против закрытого исходного кода: Решение Alibaba выпустить QwQ-32B как модель с открытыми весами имеет большое значение. Это контрастирует с подходом, принятым некоторыми западными компаниями, занимающимися ИИ, которые сохраняют свои модели как проприетарные системы с закрытым исходным кодом. Модели с открытым исходным кодом могут способствовать более тесному сотрудничеству и ускорению инноваций, позволяя исследователям и разработчикам по всему миру опираться на существующие наработки.
Обмен данными и стандартизация: Разработка надежных и достоверных систем ИИ требует огромных объемов данных. Международное сотрудничество в области обмена данными и установление общих стандартов может принести пользу всему сообществу ИИ.
Этические соображения: По мере того как системы ИИ становятся все более мощными, этические соображения становятся все более важными. Глобальный диалог и сотрудничество необходимы для обеспечения того, чтобы ИИ разрабатывался и внедрялся ответственно, с соответствующими гарантиями для смягчения потенциальных рисков.
Обмен талантами: Область ИИ выигрывает от разнообразного и глобально распределенного пула талантов. Содействие обмену исследователями и инженерами между странами может способствовать передаче знаний и ускорению прогресса.
Появление QwQ-32B и других передовых китайских моделей ИИ представляет собой важную веху в продолжающейся эволюции искусственного интеллекта. Оно подчеркивает растущие возможности технологической экосистемы Китая и подчеркивает глобальные последствия достижений в области ИИ. В ближайшие годы, вероятно, будет наблюдаться дальнейший быстрый прогресс, интенсивная конкуренция и растущие призывы к международному сотрудничеству, чтобы гарантировать, что ИИ принесет пользу всему человечеству.