Переход от больших планов к стратегическим поворотам
В недавнем внутреннем письме генеральный директор одной из китайских компаний “AI Little Tigers” - Baichuan Intelligent - отметил вторую годовщину компании и подчеркнул стратегический сдвиг. Основное внимание будет уделено медицинским приложениям. Это резко контрастировало с ее первоначальной миссией по созданию новаторской базовой модели, подобной OpenAI, в комплекте с инновационными приложениями.
Аналогично, Ли Кайфу, основатель еще одного “Little Tiger” - 01.AI, - объявил в январе, что его компания примет подход “маленький, но красивый”. Это был заметный отход от грандиозного видения построения платформы AI 2.0 для ускорения прибытия AGI.
Эти стратегические отступления подпитывают спекуляции, и некоторые наблюдатели предполагают, что эти “Little Tigers” становятся больше похожими на “больных кошек”. Как в условиях постоянных изменений эти компании могут обеспечить себе будущее?
Чтобы ответить на этот вопрос, редакционная группа Zhiwei обратилась к различным экспертам, включая специалистов по технологиям крупных моделей, экспертов по ИИ в области финансов и здравоохранения, а также экспертов по ИИ из ведущих компаний.
Эффект DeepSeek и изменение стратегий
Ландшафт ИИ резко изменился после взрывной популярности DeepSeek, модели, которая потрясла рынок. Подобно грозному воину, DeepSeek разрушил ландшафт, заставив многие компании, занимающиеся ИИ, пересмотреть свои позиции и пойти разными путями.
Однако эта трансформация началась даже раньше, чем многие осознавали. По словам Ван Вэньгуана, эксперта по технологиям крупных моделей, некоторые китайские компании, занимающиеся ИИ, начали отказываться от разработки больших моделей еще до выпуска DeepSeek V3 и R1. Затраты были просто слишком высокими, и эти компании чувствовали, что не могут конкурировать со свободно доступными и открытыми альтернативами, такими как DeepSeek V2.5 и Qwen 70B от Alibaba.
Лян Хэ, эксперт из предприятия по предоставлению технологических услуг в области ИИ, добавил, что, хотя большинство “Little Tigers” все еще обучали большие модели в середине 2024 года, их инвестиции уже значительно сократились. К январю 2025 года, с выпуском DeepSeek R1, многие небольшие компании поняли, что не могут угнаться за этим.
Этот резкий сдвиг вызвал серьезное изменение направления для “Little Tigers”, отходя от разработки AGI к более специализированным подходам.
Baichuan и 01.AI отказались от предварительного обучения больших моделей, сосредоточившись на медицинском ИИ и отраслевом применении соответственно. MiniMax сокращает свои операции B2B и фокусируется на зарубежных рынках с видеогенерацией C-end и другими приложениями. Zhipu, Moonshot AI и StepUp все еще активны в сообществе с открытым исходным кодом, но не выпустили никаких новых моделей, которые превзошли бы DeepSeek R1. Zhipu обеспечил значительное финансирование и партнерские отношения между правительством и предприятиями, обеспечив свое выживание. Основному продукту Moonshot AI, Kimi, угрожает Yuanbao, что делает его позиционирование все более неловким.
В целом, “Little Tigers” все больше сближаются с рынком B2B SaaS, который некоторые считают “неинтересным”.
Привлекательность и ограничения рынка B2B
01.AI недавно объявила о своем намерении полностью интегрировать DeepSeek для создания универсальной корпоративной платформы больших моделей для различных отраслей. Однако этот шаг был встречен со скептицизмом.
Цзян Шао, эксперт по финансовому ИИ, считает, что будущее 01.AI неопределенно из-за ее широкой направленности, отсутствия технологической конкурентоспособности после появления DeepSeek и ограниченных возможностей коммерциализации.
Ван Вэньгуан поддержал это мнение, отметив, что технический барьер для входа на универсальную платформу больших моделей относительно низок.
Ван поделился своим опытом самостоятельной разработки такой платформы примерно за шесть месяцев, продавая ее через личные каналы. Он утверждал, что, хотя получить прибыль от этого продукта как компании сложно, это может быть прибыльно как для сольного предприятия.
Ван сотрудничает с несколькими компаниями B2B, которые предлагают услуги больших моделей, но не имеют технической платформы. Он предоставляет свою платформу по низкой цене, около 40 000 - 50 000 юаней за лицензию, значительно занижая цены более крупных компаний.
Его платформа KAF (Knowledge-based Agent Factory) использует графы знаний, векторные базы данных и поисковые системы для предоставления больших моделей и приложений Agent. Это позволяет пользователям создавать пользовательских помощников по знаниям или агентов без кодирования с помощью управления подсказками и моделями. Ванотметил распространенность аналогичных платформ на рынке, что облегчает их воспроизведение.
По словам Вана, компания, стремящаяся разработать приложение большой модели B2B, может быстро создать продукт, наняв небольшую команду квалифицированных людей или сотрудничая с внешней компанией, занимающейся ИИ. Этот подход значительно дешевле, чем обучение большой модели.
В дополнение к модели платформы интегрированные решения предоставляют оборудование, программное обеспечение и среды выполнения, предлагая готовые функциональные возможности. Чжан Сэнсэн, руководитель группы технологической платформы в Ping An Insurance, считает, что интегрированные решения имеют жизнеспособный рынок, особенно среди правительственных и образовательных учреждений с ограниченными возможностями технического развертывания. Эти решения отдают приоритет простоте использования и технической автономии, предлагая такие преимущества, как безопасность данных, соответствие требованиям конфиденциальности и оптимизация аппаратного и программного обеспечения. Они также могут использовать отечественные чипы, обходя ограничения и повышая эффективность. Компании, чувствительные к затратам и ориентированные на рентабельность инвестиций, могут найти интегрированные решения привлекательными из-за их более длительного жизненного цикла.
Внутренний рынок SaaS исторически сталкивался с такими проблемами, как высокие требования к настройке, общие и однородные продукты, интенсивная конкуренция, низкие стратегии ценообразования и ориентация на краткосрочную монетизацию. Клиенты на этом рынке часто имеют низкий уровень цифровизации и ограниченное желание платить.
В отличие от этого, международный рынок SaaS подчеркивает специализацию, когда компании концентрируются на конкретных областях и предоставляют углубленные услуги крупным и средним клиентам с большей готовностью платить.
Область больших моделей отражает эти тенденции. Недавние события на международном рынке SaaS демонстрируют это:
- В феврале 2025 года MongoDB приобрела Voyage AI, 17-месячный стартап в области ИИ, специализирующийся на моделях встраивания и повторного ранжирования, за 220 миллионов долларов.
- В 2024 году Amazon объявила о соглашении о лицензировании технологий с Adept, двухлетним стартапом AI Agent, и некоторые члены Adept присоединились к команде Amazon AGI.
Эти стартапы добились успеха, сосредоточившись на конкретной нише в рамках технологии больших моделей. Такие примеры редки в Китае. Многие малые и средние предприятия должны постоянно защищаться от выхода более крупных компаний в свое пространство.
Ван Вэньгуан, опираясь на свой обширный опыт работы на рынке B2B, описал его суровые реалии. Он отметил, что, хотя существует большой рынок для универсальных платформ, он фрагментирован. Небольшие компании с более низкими эксплуатационными расходами могут предлагать конкурентоспособные цены, подрывая позиции более крупных компаний. Это снижает цену на прикладные услуги. Даже крупные компании сталкиваются с конкуренцией со стороны других стартапов и традиционных интеграторов. У крупных компаний могут быть свои большие модели и преимущества бренда, но они сталкиваются с аналогичными бизнес-стратегиями B2B.
Какзаявил Ван: “Я также использую DeepSeek, и многие другие компании используют DeepSeek, поэтому нет никакой дифференциации. В Китае так много поставщиков облачных услуг, поэтому будет по крайней мере столько же конкурентов. Внутренний рынок B2B всегда был таким; чтобы выжить, у вас должны быть либо прочные связи, либо хорошее обслуживание, либо низкие цены”.
Лян Хэ дал краткую оценку текущему выбору и будущим перспективам 01.AI:
- Решение Ли Кайфу полностью перевести бизнес 01.AI на приложения B2B и продвигать универсальную корпоративную платформу больших моделей коммерчески обосновано, но приведет к интенсивной конкуренции.
- Необходимость для 01.AI предлагать более дешевые продукты больших моделей, чем более крупные компании, является результатом отсутствия у нее уникальных преимуществ на уровне приложений.
- Переход 01.AI к B2B сигнализирует о потере воображения и менее “сексуальных” проектах. Это похоже на судьбу многих компаний, занимающихся компьютерным зрением, из предыдущей волны ИИ в 2017 году.
- У 01.AI могут быть возможности, если она будет изучать зарубежные рынки.
По сравнению с 01.AI, мнения о будущем Baichuan менее пессимистичны.
Однако у выхода Baichuan в медицинскую сферу нет уникальных преимуществ, особенно в данных.
Цзян Шао сказал, что переход Baichuan в медицину - это просто способ выжить. Однако, по сравнению с 01.AI, Baichuan, по крайней мере, пытается выйти на нишевый рынок.
Чжан Сэнсэн заявила, что она более оптимистично настроена в отношении компаний, у которых есть медицинские данные, разрабатывающих медицинские большие модели, чем в отношении технологических компаний. Это относится к любой компании, стремящейся создать отраслевую большую модель. Основная проблема при создании медицинских больших моделей заключается в данных, а не в самой модели. В Китае есть много отличных больниц, которые могут точно настроить большую модель с помощью DeepSeek для своего собственного использования.
Как можно эффективно получить медицинские данные? Цзян Шао сказал, что у стартапов, занимающихся технологиями ИИ, нет преимуществ в данных. Чтобы создавать медицинские большие модели, им может потребоваться сотрудничать с компаниями, которые уже предоставляют ИТ-услуги больницам.
Сообщается, что один из “Little Tigers” заключил эксклюзивное партнерство с крупным отечественным форумом обмена опытом для врачей для обучения моделей с использованием огромного количества случаев, сгенерированных в результате обмена опытом между врачами.
В дополнение к более оптимистичному взгляду на нишевые рынки, у отраслевых экспертов есть надежды на основателя Baichuan, Ван Сяочуаня.
Лян Хэ считает, что успех Ван Сяочуаня в специализации в медицине зависит от того, хочет ли он преследовать идеал или зарабатывать деньги. Он считает, что Ван больше склонен к преследованию идеала, создавая новаторские результаты медицинских исследований в области ИИ.
Ван Вэньгуан подчеркнул устаревший характер этого рынка. Он заявил, что, если цель - краткосрочная коммерциализация, медицинская сфера также является очень конкурентной, как и общий рынок B2B. Многие компании могут использовать графы знаний, векторный поиск и большие модели для медицинских приложений.
Согласно обсуждениям Zhiwei с экспертами по медицинскому ИИ, в самих медицинских исследованиях есть значительные пробелы в знаниях, и новые знания быстро растут. Поэтому существует значительный потенциал для использования больших моделей для проведения медицинских фундаментальных исследований. Например, модель AlphaFold для прогнозирования структуры белков используется более чем 1,8 миллионами ученых по всему миру для ускорения исследований, включая разработку био-возобновляемых материалов и развитие генетических исследований, по данным Meis Medical.
В дополнение к стремлению к идеалу или зарабатыванию денег, медицинский стартап, занимающийся ИИ, также сталкивается с вопросом о создании общей медицинской большой модели.
Чжан Сэнсэн заявила, что на внутреннем рынке не было прорыва в общих медицинских больших моделях, прежде всего из-за зависимости от мощного медицинского оборудования для сбора и применения данных в больших масштабах. Многие медицинские учреждения в Китае не получили широкого распространения, что затрудняет для ИИ выполнение точной диагностики. Тем не менее, некоторые сильные больницы, такие как клиника Майо, начали изучать возможность запуска собственных больших моделей. Хотя трудно увидеть возможности для получения прибыли в краткосрочной перспективе, эти типы больших моделей могут оказать глубокое влияние на медицинскую отрасль в долгосрочной перспективе.
Медицинская отрасль также сталкивается с проблемой полностью автоматизированной диагностики, особенно на внутреннем рынке, где оборудование неадекватно, и ИИ не может полностью заменить традиционные методы диагностики. Отсутствие широко распространенного медицинского оборудования, особенно в отдаленных районах, затрудняет полное охват медицинских технологий, поэтому полностью автоматизированная диагностика остается серьезной проблемой.
Медицинская отрасль предъявляет строгие требования к лицензированию и соответствию требованиям, и большие модели должны решать вопросы соответствия требованиям при выходе в медицинскую сферу. Будущие медицинские услуги C-end могут сочетать в себе методы врачей и ИИ для повышения эффективности диагностики и лечения, особенно для молодого поколения.
Наконец, даже не обращая внимания на характеристики внутреннего рынка B2B, конкуренция в приложениях больших моделей затрудняет выживание на рынке To B. Ван Вэньгуан заявил, что, хотя модели проектирования для больших модельных продуктов To B все еще изучаются, они в конечном итоге сойдутся. Это верно не только в Китае, но и в технологических компаниях Кремниевой долины, таких как OpenAI, Anthropic и Google. До тех пор, пока нет существенной разницы в производительности самих моделей, невозможно заработать деньги на этом рынке, и в конечном итоге все будут на одном уровне.
Именно поэтому DeepSeek R1 оказал наибольшее влияние не в Китае, а за рубежом, особенно на технологические компании Кремниевой долины. Фондовый рынок США начал испытывать высокую волатильность, а затем и снижение после выпуска R1. Основная логика проста: большие модели Кремниевой долины были пойманы Китаем. Хотя и не превзойдя их, невозможность расширить разрыв сделала невозможным поддержание таких высоких оценок, что привело к падению цен на акции.
Конечно, есть еще один способ для рынка To B привлечь клиентов: открытый исходный код. Основные модели прибыли для открытого исходного кода включают предоставление платных функций, облачный хостинг и дополнительные услуги, такие как консультации и обучение на уровне предприятия на основе технологий с открытым исходным кодом.
Наиболее прямым эффектом больших моделей с открытым исходным кодом является продвижение популяризации технологий. Чжан Сэнсэн заявила, что открытый исходный код DeepSeek значительно ускорил применение компаниями больших моделей. Высшее руководство очень поддерживает применение больших моделей. Поскольку большие модели хорошо работают в практических приложениях, особенно в сокращении вмешательства человека и повышении эффективности, поддержка будет продолжать расти.
Финансовая отрасль, как отрасль с лучшим качеством данных, всегда имела богатые технические достижения в области ИИ и может быстро не отставать. Независимо от DeepSeek, финансы будут внедрять технологии ИИ. Однако с DeepSeek ИИ позволит не только основным предприятиям финансовой индустрии, но и будет использоваться в повседневных офисных задачах и операциях, которые ранее было трудно выполнить.
Операции раньше были очень дорогими. Например, анализ первопричин ранее требовал традиционного мониторинга операций и AIOps, а также обучения небольших моделей. Теперь DeepSeek можно использовать в сочетании с базами знаний для создания планов приложений для обработки мониторинга, аварийных сигналов, самообслуживания, анализа и отслеживания, автоматизированной обработки и повышения стабильности, что более гибко, чем AIOps.
Кроме того, охват операций ИИ стал шире, с большим вниманием к интерактивности и инициативе. Инициатива означает предоставление ИИ возможности активно выполнять операции. Переходя от опоры на правила, людей или даже личный опыт, где уровень человеческого опыта определял уровень операционных возможностей, теперь можно использовать более легкие модели ИИ для непосредственного достижения этого.
Хотя уровень галлюцинаций DeepSeek все еще высок, даже не сильно отличается от других подобных моделей, его рассуждения и возможности практического применения могут компенсировать негативные эффекты галлюцинаций. Эта проблема будет постепенно улучшаться за счет точной настройки и оптимизации с использованием RAG и других связанных технологий.
Эксперт по технологиям больших моделей Alibaba Гао Пэн считает, что влияние DeepSeek различается для крупных и малых компаний:
Большие модели, используемые внутри Alibaba, всегда были самыми передовыми в отрасли, поэтому появление DeepSeek не оказало существенного влияния. Alibaba использует DeepSeek для оценки и сравнения производительности, обеспечивая больше технического вдохновения. Реализация DeepSeek в Reasoning относительно быстрая, и технические детали более распространены. DeepSeek также находился под влиянием Цяньвэнь.
Напротив, DeepSeek оказывает большее влияние на малые и средние компании, поскольку ранее не было модели, которая могла бы достичь эффекта DeepSeek, обеспечивая при этом недорогое частное развертывание. После выпуска DeepSeek появилось много компаний, продающих интегрированные машины DeepSeek. Тем не менее, DeepSeek не является самым дешевым по сравнению со многими интегрированными машинами с открытым исходным кодом, в зависимости от конкретных стандартов.
В любом случае, отечественная большая модель с открытым исходным кодом сейчас процветает и может конкурировать на глобальном уровне. Тем не менее, основываясь на внедрении Ping An Insurance больших моделей, Чжан Сэнсэн считает, что большие модели с открытым исходным кодом все еще имеют непреодолимые ограничения:
Для нас DeepSeek в первую очередь имеет огромное преимущество в стоимости. С точки зрения возможностей, она может быть лучше, чем другие модели в операционных сценариях с точки зрения рассуждений, способности к обобщению и контекстуального понимания. Тем не менее, DeepSeek не очень хорошо работает в более сложных сценариях, таких как финансовый контроль рисков. Это связано с тем, что требуется более подробная точная настройка или даже оптимизация в сочетании с другими моделями. Поэтому для дальнейшего повышения производительности модели необходима целевая точная настройка на основе конкретных сценариев применения.
Самостоятельно разработанные Ping An большие модели разделены на два слоя: базовую большую модель и доменные модели, отвечающие за банковское дело, страхование и другие виды бизнеса. Большие модели, используемые внутри компании, работают лучше, чем DeepSeek, в области профессиональных знаний, особенно в конкретных областях, таких как финансы и медицина, где модели более точны. Тем не менее, DeepSeek по-прежнему имеет сильное преимущество в способности рассуждать. В некоторых сценариях мы хотим использовать DeepSeek для небольшой попытки, чтобы увидеть, можно ли ее запустить.
В этом отношении нет существенной разницы между Alibaba Qianwen, Baidu Wenxin и Zhipu ChatGLM и DeepSeek. Суждение основано на том факте, что эти модели не имеют существенной разницы с DeepSeek в способности рассуждать и структуре базы знаний.
В целом, влияние больших моделей с открытым исходным кодом в настоящее время ограничено, и темпы конкуренции между ними интенсивны.
Опасности рынка To C
Хотя конкуренция на рынке To B является жесткой, это не означает, что маршрут To C предлагает больше надежды.
Конкуренция на рынке To C для больших моделей также очень жесткая, но она сильно отличается от рынка To B.
Рыночный ландшафт постоянно меняется.
Монетизация To C затруднена.
Самые популярные приложения не обязательно приносят больше всего дохода. Например, у ChatGPT самый высокий доход, но OpenAI по-прежнему теряет 5 миллиардов долларов в год, в то время как многие “подражательные” приложения ChatGPT, вероятно, добились быстрой прибыльности; после того, как DeepSeek стал популярным, имитаторы и поддельщики приходили толпами.
Наблюдение за ситуацией с “Little Tigers” с рынка C-end также не является оптимистичным. Связь Zhiwei с отраслевыми экспертами, как правило, считает, что крупные производители принесут большое давление выживания.
Цзян Шао заявил, что лучшим из “Little Tigers” на потребительском рынке является Kimi от Moonshot AI. Но теперь Yuanbao от Tencent занимает первое место, DeepSeek - второе место, а Doubao - третье. Три ведущие компании почти занимают большую часть доли рынка. Yuanbao от Tencent получил большое количество клиентского трафика с помощью экосистемы WeChat, в то время как DeepSeek выделился благодаря своим технологическим инновациям и отличной производительности во многих сценариях.
Лян Хэ заявил, что технология большой модели Kimi не сильно отличается от ее конкурентов, поэтому она может быть только бесплатной, что очень затрудняет коммерциализацию Moonshot. Как приложение To C, неясно, чем оно отличается от Yuanbao и Doubao. Более того, Doubao может поддерживаться другими бизнесами Byte, а Yuanbao может поддерживаться другими бизнесами Tencent. Они могут инвестировать 100 миллиардов, чтобы поддержать эти приложения.
Цзян Шао добавил, что пользователи C-end больше озабочены простотой использования продукта, в чем Tencent и Byte лучше. Конечно, у Alibaba также есть возможности. Alibaba инкубирует приложение под названием “AI Listening”, которое использует AI для чата и взаимодействия, стремясь заменить Douyin на платформе коротких видео. Хотя Douyin привлекает большое количество создателей для создания высококачественного контента, приложения AI для чата имеют потенциал для привлечения групп пользователей, предоставляя более персонализированные и интерактивные возможности. Разница между двумя заключается в создании контента и взаимодействии. Если Alibaba сможет прорваться, у нее также есть шанс переломить ситуацию, но трудно сказать, последует ли Tencent этому примеру.
Что касается MiniMax, мнения в отрасли несколько отличаются.
Лян Хэ считает, что Conch AI от MiniMax в настоящее время приносит хорошую прибыль. Он нашел свой собственный путь, но пока не известно, позволит ли этот путь MiniMax достаточно повысить свою оценку. Благодаря своей ориентации на приложения MiniMax стал более расслабленным после выхода DeepSeek. Если они будут использовать модели DeepSeek, это сэкономит затраты на исследования и разработки модели, и ее приложения смогут продолжать зарабатывать деньги, даже больше.
Цзян Шао считает, что у MiniMax есть шанс, если он сможет создать популярное приложение позже, но Alibaba может превзойти его и создать популярное приложение первым, поэтому, даже если у MiniMax есть шанс, вероятность невелика.
В конечном счете, дифференциация продукта по-прежнему является прорывной точкой для приложений C-end.
Согласно последнему отчету a16z “Top 100 Gen AI Consumer Apps”, многие приложения с низкой степенью использования на самом деле достигают большего дохода. Некоторые продукты с плохой универсальностью, такие как идентификация растений и питание, привлекают платящих пользователей больше, чем общие продукты.
Трудно дифференцировать общие продукты AI. Пользователи мало готовы платить, цикл прибыли длинный, поэтому они не могут пережить крупные компании.
И если дифференциация недостаточно глубока по вертикали, ее также легко интернализировать базовой большой моделью за счет модернизации возможностей. Например, недавние возможности GPT-4o по генерации изображений нанесли удар с уменьшением размеров стартапам, занимающимся преобразованием текста в изображение, таким как Midjourney. Эта возможность покрытия часто является случайной и непредсказуемой, как говорится: “Уничтожение вас не имеет к вам никакого отношения”.
Попиксельное подражание конкурентам и быстрое обновление базовых больших моделей делают пейзаж AI-стартапов C-end почти всегда сохраняющимся лишь в течение короткого времени.
Что касается того, как воспользоваться чрезвычайно низкой вероятностью стать хитом, отраслевые эксперты единогласно считают, что “в основном нет опыта, которому можно следовать”.
“Little Tigers” попали в сегодняшнее затруднительное положение в основном потому, что они слишком много инвестировали в базовую большую модель и недооценили рабочую силу, финансовые ресурсы и материальные ресурсы, необходимые для выживания и преуспевания в этом направлении, что привело к тому, что трудно дифференцировать по направлению приложения.
Теперь “Little Tigers” все меньше и меньше полны решимости атаковать AGI, и Ли Кайфу публично заявил, что только DeepSeek, Ali и Byte останутся в отечественной базовой большой модели.
В связи с этим отраслевые эксперты, общавшиеся с Zhiwei, в основном согласны с этой точкой зрения.
Цзян Шао сказал, что AI-стартапы, которые все еще продолжают упорно работать над технологией больших моделей, в основном должны умереть. Самым многообещающим, безусловно, является DeepSeek, вторым - Alibaba, а третьим - ByteDance. Ожидается, что первое место получит 50%-80% трафика, а последние два - 10% трафика. Суть заключается в том, кто первым создаст AGI и кто является конечным победителем.
DeepSeek в настоящее время является наиболее конкурентоспособным в области больших моделей, и его технологические инновации и производительность в практических приложениях безупречны. Alibaba и ByteDance также обладают сильной конкурентоспособностью, особенно в кросс-платформенных приложениях и ресурсах данных. Рейтинг в основном основан на инновационных возможностях каждой компании в базовых технологиях, вычислительной мощности, ресурсах данных и практических приложениях.
Команды Zhipu и Kimi твердо верят, что дальнейшее расширение возможностей базовой модели - это будущее. В отличие от этого, я считаю, что с изменениями в рыночном спросе и диверсификацией сценариев применения маршрут простого усиления базовой модели может быть ограничен, и более гибкие и адаптируемые пути разработки моделей могут быть более конкурентоспособными на рынке.
Конкуренция в технологии больших моделей чрезвычайно жесткая, и компании с огромными инвестициями в конечном итоге должны иметь четкие прорывы в инновациях, вычислительной мощности, данных и оптимизации, чтобы поддерживать конкурентоспособность. Другие компании, которые не успевают за технологическим прогрессом или не могут справиться с рыночным спросом, будут постепенно вытеснены.
Лян Хэ сказал, что только DeepSeek, Ali и Byte останутся в отечественной компании по производству базовых больших моделей в будущем, исходя из того факта, что эти трое обладают силой и решимостью инвестировать сверхресурсы в исследования и разработки. Для Byte невозможно упустить возможность для больших моделей, иначе это окажет большое влияние на ее общую деятельность. И технология DeepSeek не будет иметь слишком много барьеров для Byte, но DeepSeek в настоящее время имеет большее преимущество в эффективности исследований и разработок. Открытая модель Qianwen от Alibaba сама по себе находится на высоком уровне. До того, как DeepSeek стал популярным, Qianwen и Llama в основном преследовали друг друга. Для Alibaba модель Qianwen может не приносить денег, но связанные с ней облачные бизнесы могут приносить деньги, и Byte аналогичен, и может продолжать использовать технологию больших моделей для непрерывной оптимизации опыта Douyin и других приложений. Для AI-стартапов, если сама модель не приносит денег, это затрагивает корень выживания.
Ван Вэньгуан сказал, что преимущество DeepSeek в основном заключается в технологическом идеализме. В течение двух-трех месяцев до и после Праздника весны трафик DeepSeek был огромен. Если бы он хотел коммерциализироваться, он скоро достиг бы вершины в мире, и у других больших моделей, таких как Doubao, не было бы никаких шансов. До тех пор, пока DeepSeek не откроет методы оптимизации, связанные с инфраструктурой, в недавнюю неделю открытого исходного кода, он может полагаться на это, чтобы зарабатывать деньги в будущем, так что у других не будет никаких шансов. DeepSeek не финансировался и не нуждается в том, чтобы находиться под влиянием инвесторов. Технологический идеализм и талант - самые большие барьеры. По сравнению с OpenAI, результаты, которые OpenAI может увидеть сейчас, в основном являются результатами исследований до спора между Альтманом и Ильей. По крайней мере, инновационные точки были определены. Теперь, после ухода первоначальной команды идеалистов, OpenAI сама по себе почти не имеет инноваций. В настоящее время инновации OpenAI больше находятся на уровне приложений, таких как Deep Research. Нет никаких барьеров для инноваций на уровне приложений, поэтому ей приходится конкурировать с конкурентами.
Ван Му, эксперт по технологиям AI на крупном заводе, сказал Zhiwei, что, если нет денег, талантов и оборудования, не нужно тратить усилия на предварительное обучение больших моделей. DeepSeek имел кластер из 10 000 карт еще в 2021 году и не испытывает недостатка в деньгах. Напротив, другим малым и средним компаниям трудно собрать это условие вместе.
Гао Пэн заявил, что AI-стартапы хотят выжить, они все равно должны обратиться к приложениям. Я думал так год или два назад, и теперь, возможно, слишком поздно поворачивать. Первой партией AI-компаний, которые будут ликвидированы следующими, будут те, которые делают базовые большие модели. Обучение большой модели на самом деле имеет много сложных деталей и очень зависит от накопления опыта. Внутренние детали архитектуры Transformer в целом хорошо поняты, но в статьях моделей с открытым или закрытым исходным кодом в основном не говорится, как готовятся данные, каковы детали данных, насколько велик масштаб данных и насколько хорошее качество данных. В отрасли нет единого стандарта.
Открытый исходный код всегда был типичной практикой в направлении больших моделей. В настоящее время существует очень мало больших моделей, которые будут полностью раскрывать код, веса, наборы данных и процесс обучения. Наиболее известные из них - OLMo, BLOOM и т. Д.
Тем не менее, даже если обращение к приложениям может выжить? Из предыдущего анализа направления To B и направления To C AI-стартапам почти трудно сформировать свои собственные отраслевые барьеры в приложениях. В связи с этим Гао Пэн заявил, что ключ к формированию ваших собственных отраслевых барьеров заключается в том, какие данные у вас есть. Модели могут использоваться кем угодно. Данные делятся на два аспекта: один - это полевой опыт предпринимателя, а другой - данные в руках.
С точки зрения корпоративной культуры Гао Пэн считает, что исследования и разработки базовых больших моделей требуют духа экспериментальной и инженерной тяжелой работы. “В течение долгого времени до этого многие отечественные AI-стартапы были слишком заметными. При разработке технологий вы должны сначала сделать это незаметно, а затем продвигать это на видном месте. Некоторые команды в основном состоят из научных кругов, но люди в академических кругах иногда изучают технологии слишком теоретически. С точки зрения таланта или команды, успех команды по разработке большой модели в основном зависит от того, понимает ли босс большие модели. Если босс не понимает технологию больших моделей или не имеет веры, чтобы упорствовать, потому что она не приносит денег, это вообще не будет работать. Успех DeepSeek больше зависит от режима организации сверху вниз. Босс очень хорошо понимает технические детали и ведет всех делать это вместе. Существует слишком мало отечественных моделей, которые соответствуют этой модели”.
Что касается оживленной дискуссии в отрасли о прогнозировании окончательного победителя отечественной базовой большой модели, Гао Пэн считает, что это суждение слишком рано. “В технических маршрутах игроков, которые могут участвовать в соревнованиях, не будет большой разницы. Просто следуйте архитектуре Transformer и сделайте подробную оптимизацию. У Mamba и RWKV также есть надежда. Ключ в том, чтобы делать вещи неуклонно, и время покажет все. Окончательного победителя и тройку лидеров нелегко сказать. Стек технологий большой модели - очень сложная вещь, и кто знает, есть ли много людей, которые молча делают одно дело, но время еще не пришло”.
В нынешней ситуации, когда трудно судить о победителе модели, данные стали самым важным рвом. Константин Булер, партнер Sequoia Capital, однажды сказал, что одной из ошибок, которую OpenAI допустила в ChatGPT, было то, что она не позволяла редактировать ответы, что могло бы предоставить данные более высокого качества в цикле обратной связи и построить более глубокий ров.
Очень важно, могут ли данные позволить той или иной отрасли развиваться дальше с помощью AI или приносить новые возможности для бизнеса в настоящее время. Чжан Сэнсэн сказал, что зрелость посадки AI ближе к финансовой и интернет-индустриям. Я более оптимистично настроен в отношении офиса AI, государственных дел AI и электронной коммерции AI. Это в основном основано на высокой степени оцифровки и высокой определенности производительности.
“Хотя электронная коммерция относительно зрелая, AI будет продолжать повышать эффективность электронной коммерции, особенно в рекомендациях товаров, обслуживании клиентов и оптимизации логистики. AI может повысить эффективность платформ электронной коммерции за счет более точного анализа рынка и оптимизации принятия решений. Это повышение эффективности будет не только продолжением оффлайн розничной торговли, но и принесет новые формы электронной коммерции, особенно в области трансграничной электронной коммерции, AI поможет ее взрывному росту”.
“Напротив, финансовая индустрия пережила взрыв производительности в 2024 году, и в 2025 году все еще есть много возможностей для роста по мере углубления бизнеса AI”.
“Глядя на те отрасли, где посадка AI не является зрелой, особенно на интеллектуальное производство, есть много настраиваемых вещей, и продукты, производимые каждым предприятием, различаются, и нет единого стандарта. Поэтому предприятиям трудно продвигать автоматизацию работы AI, цена данных очень высока, и требования к точности также очень высоки. Хотя промышленное программное обеспечение в основном является самым ранним направлением решения для интеллектуальной посадки, оно имеет лучший эффект. Тем не менее, обновление AI в обрабатывающей промышленности имеет историческое бремя. Уровень данных и информатизации большей части обрабатывающей промышленности недостаточен, что приводит к нехватке данных при выполнении AI, особенно сбор аномальных образцов почти отсутствует. Сложность также высока, например, большое количество типов оборудования и несогласованные стандарты данных, что приводит к плохой переносимости алгоритмов, часто игнорируя некоторые ключевые факторы, такие как температура, материалы или влияние некоторых непредсказуемых переменных. Кроме того, предприятия имеют отклонения в своем внимании к данным датчиков. Для различных данных об отказе датчиков предприятия в основном сосредоточены на данных, которые повлияют на результаты производства. На самом деле, эти периферийные данные датчиков, вероятно, станут точкой опоры для нас, чтобы использовать инновации и коммерциализацию всей обрабатывающей промышленности в будущем. AI может обнаруживать потенциальные возможности оптимизации за счет анализа этих данных, тем самым способствуя прогрессу всей отрасли”.
“Кроме того, требования к возможностям обрабатывающей промышленности также отличаются от других отраслей. Она требует