Китайский стартап DeepSeek бросает вызов лидерству США в области ИИ | ru

Вызов американскому лидерству в области ИИ

В высококонкурентной сфере искусственного интеллекта разворачивается повествование о Давиде против Голиафа. Соединенные Штаты, с их амбициозным проектом “Stargate” и колоссальными инвестициями в 500 миллиардов долларов, стремятся закрепить свои позиции в качестве мирового лидера в области ИИ. Эти монументальные усилия, поддерживаемые технологическими титанами, направлены на создание сети передовых центров обработки данных по всей стране. Однако, проворный китайский стартап, работающий с тем, что некоторые могли бы назвать “шуточным бюджетом”, стал грозным соперником, бросая тень на стремления США.

DeepSeek, компания из Ханчжоу, недавно представила серию моделей ИИ с открытым исходным кодом, которые не только соответствуют, но в некоторых случаях и превосходят производительность моделей OpenAI. Более того, они достигли этого с замечательной эффективностью и за небольшую часть стоимости. Это событие вызвало волнение в сообществе ИИ, поднимая вопросы об эффективности стратегии США и будущем доминирования в области ИИ.

Смена динамики в сфере ИИ

В настоящее время в сфере ИИ доминируют несколько крупных игроков, в основном базирующихся в США. Эти компании, располагающие значительным финансированием и ресурсами, находятся на переднем крае инноваций в области ИИ, разрабатывая мощные модели, лежащие в основе широкого спектра приложений. Однако появление DeepSeek сигнализирует о потенциальном сдвиге в этой динамике, демонстрируя, что новаторский ИИ может быть разработан со значительно меньшими ресурсами.

Модель DeepSeek R1, выпущенная ранее на этой неделе, является ярким примером этого прорыва. По данным компании, эта модель соответствует и даже превосходит производительность модели o1 от OpenAI, которая была выпущена в прошлом году и предназначена для решения сложных задач рассуждения и математических задач. Тот факт, что модель DeepSeek является открытым исходным кодом и легко доступна для общественности, еще больше усиливает ее влияние, позволяя исследователям и разработчикам по всему миру использовать ее возможности. Рецензенты высоко оценили способность модели R1 справляться с такими задачами, как кодирование и рассуждение, ставя ее в прямую конкуренцию с самыми передовыми моделями на рынке.

Эффективность DeepSeek при ограниченных ресурсах

Это достижение тем более примечательно, если учесть ресурсы, которыми располагает DeepSeek. Сообщается, что большая языковая модель V3 компании, анонсированная в декабре, была обучена с использованием вычислительной мощности всего на 5,6 миллиона долларов. Это резко контрастирует с более чем 100 миллионами долларов, которые, как сообщается, были использованы для обучения GPT-4 от OpenAI. Модель V3 от DeepSeek была протестирована по сравнению с моделями от OpenAI и Anthropic, при этом DeepSeek заявляет о паритете в производительности. Анджей Карпати, известный исследователь в области ИИ, ранее работавший в Tesla и OpenAI, назвал способность DeepSeek обучать свой передовой ИИ на “шуточном бюджете” весьма впечатляющей.

Поддержка китайского правительства и технологический прорыв

Возвышение DeepSeek в конкурентном секторе ИИ Китая не случайно. 40-летний основатель компании Лян Вэньфэн недавно встретился с премьером Госсовета КНР Ли Цяном, подчеркнув значимость достижений DeepSeek в стране. Эта встреча, в которой приняли участие другие ведущие эксперты отрасли, подчеркивает приверженность Китая развитию технологических инноваций и его амбиции в области ИИ. Успех DeepSeek служит свидетельством изобретательности и находчивости китайского технологического сектора, демонстрируя его способность конкурировать на мировой арене, несмотря на ограничения доступа к определенным технологиям.

История DeepSeek и стратегическое преимущество

Истоки DeepSeek восходят к HighFlyer, китайскому количественному хедж-фонду, который по состоянию на 2019 год управлял активами на сумму около 1,4 миллиарда долларов. HighFlyer выделил DeepSeek в 2023 году, создав его как специализированный стартап в области ИИ, ориентированный на разработку моделей и создание продуктов ИИ. Лян Вэньфэн, имеющий опыт работы в области ИИ в Чжэцзянском университете, стал соучредителем HighFlyer и использовал его финансовые ресурсы для приобретения тысяч чипов Nvidia AI до введения ограничений США в 2022 году. Этот стратегический шаг обеспечил DeepSeek значительное преимущество перед другими стартапами в области ИИ, позволив ему продолжить свои исследования и разработки, в то время как другие изо всех сил пытались обеспечить вычислительную мощность.

Производительность и открытость моделей DeepSeek

Хотя мнения экспертов о производительности DeepSeek по сравнению с ChatGPT от OpenAI и Claude от Anthropic разнятся, общее мнение заключается в том, что модели DeepSeek исключительно хорошо работают при определенных конфигурациях оборудования. Однако они могут столкнуться с проблемами в других сценариях. DeepSeek сосредоточен на повышении эффективности и снижении затрат, что очевидно в его инновационной модели “смеси экспертов”. Эта модель использует различные части ИИ для обработки конкретных вопросов, оптимизируя производительность и использование ресурсов.

Еще одним ключевым отличием моделей DeepSeek является их открытый исходный код, позволяющий использовать их на различных аппаратных платформах. Что еще более важно, модели DeepSeek обеспечивают прозрачность, раскрывая, как они приходят к своим ответам, в отличие от o1 от OpenAI. Эта прозрачность является ключевым преимуществом для клиентов, которые ищут экономически эффективные решения в области ИИ, особенно для тех, кто исключен из рынка дорогостоящих моделей, разработанных в США, и тех, кто ограничен в доступе к американской вычислительной мощности.

Ограничения США и альтернативные стратегии Китая

Обеспокоенность США по поводу прогресса Китая в области ИИ не является необоснованной. Правительство США активно пытается сдержать развитие ИИ в Китае путем экспортного контроля над передовыми чипами ИИ с 2022 года. Это фактически помешало китайским компаниям приобрести необходимые процессоры для обучения передовых моделей ИИ. Несмотря на эти ограничения, производители чипов, такие как Nvidia и Intel, попытались создать процессоры, соответствующие требованиям США для китайского рынка, но столкнулись с дальнейшим ужесточением правил со стороны Вашингтона.

Эти ограничения вынудили китайские компании в области ИИ изучить альтернативные стратегии. Некоторые полагаются на чипы американского производства, которые были импортированы до введения запретов, в то время как другие обращаются к контрабандным сетям, которые поставляют чипы из третьих стран. Некоторые изучают центры обработки данных за пределами Китая, в то время как другие полагаются на китайские альтернативы от таких компаний, как Huawei. Хотя Huawei утверждает, что ее чипы ИИ превосходят процессор A100 от Nvidia, она столкнулась с проблемами в их надежном производстве в масштабе.

Проблемы и амбиции Китая в области ИИ

Лян Вэньфэн заявил, что “деньги никогда не были для нас проблемой; проблема - это запреты на поставки передовых чипов”. Это заявление подчеркивает значительные препятствия, с которыми сталкиваются китайские компании в своем стремлении к лидерству в области ИИ. В дополнение к запретам на экспорт чипов администрация Байдена также запретила инвестиции США в китайский ИИ, что еще больше усложняет ситуацию.

Несмотря на эти проблемы, Китай создал процветающую экосистему ИИ. Крупные технологические компании, такие как Baidu, Alibaba и ByteDance, разрабатывают свои собственные базовые модели и предлагают услуги на основе ИИ. Китайские стартапы в области ИИ, такие как MiniMax и Moonshot AI, запустили ориентированные на потребителя услуги, которые добились успеха даже на рынке США.

Ценовая война и конкуренция в китайском секторе ИИ

Интенсивная конкуренция в китайском секторе ИИ привела к ценовой войне, когда компании резко снизили цены на целых 90% в течение 2024 года, чтобы получить конкурентное преимущество. Эта ценовая война еще раз подчеркивает находчивость и адаптивность китайского сектора ИИ.

Обеспокоенность США и ответные меры

США все больше обеспокоены успехами Китая в области ИИ, поскольку это означает, что меры, принятые для защиты лидерства США в области ИИ, не работают. Бывший генеральный директор Google Эрик Шмидт выразил свое удивление прогрессом Китая, заявив, что он “думал, что ограничения, которые мы наложили на чипы, сдержат их”.

OpenAI, разработчик ChatGPT, также выразил обеспокоенность по поводу достижений Китая в области ИИ. В недавнем политическом документе OpenAI заявил, что существует около 175 миллиардов долларов глобальных средств, ожидающих инвестиций в проекты ИИ. Компания предупредила, что “если США не привлекут эти средства, они потекут в проекты, поддерживаемые Китаем, усиливая глобальное влияние Коммунистической партии Китая”.

В ответ на эти опасения генеральный директор OpenAI Сэм Альтман, генеральный директор SoftBank Масаёси Сон и соучредитель Oracle Ларри Эллисон объявили о проекте Stargate, который предусматривает инвестиции в размере 500 миллиардов долларов в инфраструктуру ИИ в США. Этот проект является явным свидетельством приверженности США сохранению своего лидерства в области ИИ.

Инновации и адаптивность как ключевые факторы

Однако появление таких компаний, как DeepSeek, говорит о том, что путь к доминированию в области ИИ может быть не таким простым, как просто вложение огромных сумм денег. Способность к инновациям, адаптации и достижению прорывов при ограниченных ресурсах является критическим фактором в современной сфере ИИ. По мере того как гонка ИИ продолжает усиливаться, мир будет внимательно следить за тем, как США и Китай справляются с этими сложными проблемами. Результат будет иметь далеко идущие последствия для будущего технологий и глобальной динамики власти. История DeepSeek служит напоминанием о том, что изобретательность и находчивость могут быть мощными силами в гонке за превосходство в области ИИ. В то время как США вкладывают значительные средства для сохранения своего лидерства, вызов со стороны Китая, особенно со стороны инновационных стартапов, таких как DeepSeek, является серьезным. Ближайшие годы будут иметь решающее значение для определения окончательного победителя в этом соревновании с высокими ставками. Сфера ИИ быстро развивается, и динамика между этими двумя мировыми державами будет продолжать формировать будущее этой преобразующей технологии.

обновлено 2025-01-25

# AGI # DeepSeek