DeepSeek: Взлет китайского AI-гиганта

DeepSeek, чье имя стремительно взлетело из относительной безвестности в центр глобальных дискуссий об ИИ, вызвало интенсивные дебаты и спекуляции в технологическом и финансовом секторах. Китайская AI-лаборатория, стоящая за этой растущей силой, нарушила установившийся порядок, побуждая аналитиков задаться вопросом об устойчивости доминирования США в гонке AI и долгосрочной жизнеспособности текущего спроса на AI-чипы. Но какие ключевые факторы продвинули DeepSeek к ее нынешней известности?

Происхождение DeepSeek: От хедж-фонда к AI-лаборатории

Происхождение DeepSeek тесно переплетено с миром количественных финансов. Она поддерживается High-Flyer Capital Management, китайским хедж-фондом, известным своим использованием AI в принятии торговых решений на основе данных.

Лян Вэньфэн, энтузиаст AI с опытом торговли во время учебы в Чжэцзянском университете, стал соучредителем High-Flyer в 2015 году. В 2019 году он запустил High-Flyer Capital Management в качестве хедж-фонда с особым акцентом на разработку и внедрение AI-алгоритмов для финансовых приложений.

В 2023 году High-Flyer инкубировал DeepSeek как специализированную AI-исследовательскую лабораторию, работающую независимо от своего основного финансового бизнеса. Впоследствии, при поддержке High-Flyer в качестве ключевого инвестора, лаборатория была выделена в отдельную структуру, сохранив название DeepSeek.

С момента своего создания DeepSeek уделяла приоритетное внимание созданию собственных кластеров центров обработки данных для облегчения обучения моделей. Однако, как и другие AI-компании, работающие в Китае, DeepSeek столкнулась с проблемами из-за экспортных ограничений США на передовое оборудование. Следовательно, для обучения своих последних моделей компании пришлось прибегнуть к использованию чипов Nvidia H800, менее мощному варианту чипов H100, которые легко доступны американским компаниям.

Техническая команда DeepSeek известна своей молодостью и динамизмом. Компания активно набирает исследователей AI, имеющих докторскую степень, из ведущих китайских университетов. Кроме того, DeepSeek нанимает людей из разных слоев общества, даже тех, кто не имеет опыта в области компьютерных наук, чтобы обеспечить эффективное понимание ее технологиями широкого круга вопросов и удовлетворение потребностей широкого круга субъектов, как сообщает The New York Times.

AI-модели DeepSeek: Бросая вызов статус-кво

DeepSeek представила свой первоначальный набор моделей – DeepSeek Coder, DeepSeek LLM и DeepSeek Chat – в ноябре 2023 года. Однако именно выпуск семейства моделей DeepSeek-V2 следующего поколения весной действительно привлек внимание AI-индустрии.

DeepSeek-V2, универсальная система, способная анализировать как текст, так и изображения, продемонстрировала впечатляющую производительность по различным AI-бенчмаркам. Примечательно, что она достигла этой производительности при значительно более низкой стоимости по сравнению с конкурирующими моделями, доступными в то время. Это побудило внутренних конкурентов DeepSeek, включая ByteDance и Alibaba, снизить цены на некоторыеиз своих моделей и предложить другие совершенно бесплатно.

DeepSeek V3 продемонстрировала превосходную производительность по сравнению как с загружаемыми моделями с открытым исходным кодом, такими как Meta’s Llama, так и с “закрытыми” моделями, доступными только через API, такими как OpenAI’s GPT-4o.

Столь же примечательна модель DeepSeek R1 “reasoning”. Запущенная в январе, DeepSeek утверждает, что R1 достигает сопоставимой производительности с моделью OpenAI o1 по ключевым бенчмаркам.

Будучи моделью “reasoning”, R1 включает в себя механизмы самопроверки, смягчающие некоторые из распространенных недостатков, связанных со стандартными моделями. Хотя моделям “reasoning” может потребоваться немного больше времени обработки для получения решений (от секунд до минут), они, как правило, демонстрируют большую надежность в таких областях, как физика, наука и математика.

Однако модели DeepSeek, включая R1 и DeepSeek V3, подлежат надзору со стороны китайского интернет-регулятора, который гарантирует, что их ответы соответствуют “основным социалистическим ценностям”. Например, в приложении чат-бота DeepSeek R1 не будет отвечать на вопросы, касающиеся площади Тяньаньмэнь или автономии Тайваня.

В марте трафик на веб-сайт DeepSeek превысил 16,5 миллиона посещений. Несмотря на снижение трафика на 25% по сравнению с февралем, DeepSeek занимала второе место по количеству ежедневных посещений, по данным Дэвида Карра, редактора Similarweb. Однако эта цифра по-прежнему бледнеет по сравнению с ChatGPT, который в марте превысил 500 миллионов активных пользователей в неделю.

Подрывной подход к AI-ландшафту

Бизнес-модель DeepSeek остается несколько загадочной. Компания оценивает свои продукты и услуги значительно ниже рыночной стоимости и даже предлагает некоторые бесплатно. Кроме того, она сопротивлялась внешнему финансированию, несмотря на значительный интерес со стороны фирм венчурного капитала.

DeepSeek объясняет свою исключительную конкурентоспособность по затратам прорывами в эффективности. Однако некоторые эксперты поставили под сомнение точность цифр, предоставленных компанией.

В любом случае, разработчики приняли модели DeepSeek, которые, хотя и не являются открытыми в традиционном смысле, доступны по разрешительным лицензиям, допускающим коммерческое использование. По словам Клема Деланга, генерального директора Hugging Face, разработчики на платформе создали более 500 производных моделей R1, накопив в общей сложности 2,5 миллиона загрузок.

Успех DeepSeek против более крупных и авторитетных конкурентов был назван как “подрывом AI”, так и “переоцененным”. Достижения компании частично стали причиной падения акций Nvidia на 18% в январе и вызвали публичный ответ генерального директора OpenAI Сэма Альтмана. В марте бюро Министерства торговли США, как сообщается, запретили DeepSeek на государственных устройствах, согласно Reuters.

Microsoft интегрировала DeepSeek в свою службу Azure AI Foundry, платформу, которая объединяет AI-сервисы для предприятий. Во время отчета Meta о прибылях и убытках за первый квартал генеральный директор Марк Цукерберг заявил, что инвестиции в AI-инфраструктуру будут и впредь являться “стратегическим преимуществом” для компании, когда его спросили о потенциальном влиянии DeepSeek на расходы Meta на AI. В марте OpenAI назвала DeepSeek “субсидируемой государством” и “контролируемой государством”, рекомендовав правительству США рассмотреть вопрос о запрете ее моделей.

Во время отчета Nvidia о прибылях и убытках за четвертый квартал генеральный директор Дженсен Хуанг отметил “превосходные инновации” DeepSeek, отметив, что ее модели “reasoning” требуют значительно большей вычислительной мощности, что идет на пользу Nvidia.

И наоборот, некоторые компании, страны и правительства, включая Южную Корею и штат Нью-Йорк, запретили использование DeepSeek на государственных устройствах.

В мае вице-председатель и президент Microsoft Брэд Смит заявил перед Сенатом, что сотрудникам Microsoft запрещено использовать DeepSeek из-за опасений по поводу безопасности данных и потенциальной пропаганды.

Неопределенное будущее DeepSeek

Будущая траектория DeepSeek остается неопределенной. Хотя ожидаются дальнейшие улучшения модели, правительство США, по-видимому, все больше опасается предполагаемого вредного иностранного влияния. В марте The Wall Street Journal сообщила, что США, вероятно, запретят DeepSeek на государственных устройствах.

Стремительный взлет DeepSeek, несомненно, поколебал основы AI-индустрии, вызвав переоценку конкурентной динамики и потенциала для подрывных инноваций. Сможет ли она сохранить свой нынешний импульс перед лицом растущего контроля и регуляторных проблем, еще предстоит увидеть. Ближайшие годы будут иметь решающее значение в определении долгосрочного воздействия DeepSeek на глобальный AI-ландшафт. Ее способность ориентироваться в сложном взаимодействии технологического прогресса, геополитических соображений и этических проблем в конечном итоге определит ее наследие. Мир AI будет внимательно наблюдать.

История DeepSeek – это напоминание о том, что в быстро развивающемся мире искусственного интеллекта новые игроки могут появляться быстро и бросать вызов установленному порядку. Успех компании, обусловленный инновационными технологиями и готовностью разрушить традиционные бизнес-модели, заставил индустрию обратить на себя внимание. По мере того как DeepSeek продолжает развиваться и расширять свое влияние, она, несомненно, будет играть важную роль в формировании будущего AI.