中国AI'小虎'の岐路:進化する現状を読み解く

戦略的転換:壮大なビジョンから現実へ

かつて野心的な目標を掲げていた中国のAIスタートアップ、いわゆる’AI小虎’たちは、競争の激化とリソース集約型の市場という厳しい現実を前に、戦略の見直しを迫られています。Baichuan IntelligentのCEOからの最近の社内レターは、創業2周年を記念し、戦略の転換を強調しました。その焦点は、医療アプリケーションを優先することに絞られます。これは、革新的なアプリケーションを備えたOpenAIのような画期的な基盤モデルを作成するという当初の使命とは対照的です。

同様に、別の’小虎’である01.AIの創業者、李開復(リ・カイフ)氏は、1月に同社が’小さくても美しい’アプローチを採用すると発表しました。これは、AGIの到来を加速するためのAI 2.0プラットフォームを構築するという壮大なビジョンからの注目すべき逸脱でした。

これらの戦略的撤退は憶測を呼び、一部のオブザーバーは、これらの’小虎’が’病気の猫’のようになっていると示唆しています。変化の絶えない環境の中で、これらの企業はどのようにして未来を確保できるのでしょうか?この疑問に答えるために、Zhiweiの編集チームは、大規模モデル技術の専門家、金融および医療分野のAI専門家、大手企業のAI技術専門家など、さまざまな専門家からの洞察を求めました。

DeepSeek効果と戦略シフト

AIの状況は、市場を揺るがすDeepSeekの爆発的な人気を受けて劇的に変化しました。手ごわい戦士のように、DeepSeekは状況を混乱させ、多くのAI企業に自社の立ち位置を再評価し、異なる道を追求することを強いました。

しかし、この変革は、多くの人が気づいたよりもさらに早く始まりました。大規模モデル技術の専門家である王文広(ワン・ウェングアン)氏によると、一部の中国のAI企業は、DeepSeek V3およびR1のリリース前から大規模モデルのトレーニングの追求を放棄し始めていました。コストがあまりにも高すぎたため、これらの企業はDeepSeek V2.5やAlibabaのQwen 70Bのような無料で利用可能なオープンソースの代替品と競争できないと感じていました。

AIテクノロジーサービス企業の専門家である梁赫(リャン・ハー)氏は、’小虎’のほとんどが2024年半ばにはまだ大規模モデルをトレーニングしていましたが、その投資はすでに大幅に減少していたと付け加えました。2025年1月までに、DeepSeek R1のリリースにより、多くの小規模企業は追いつけないことに気づきました。

この突然のシフトにより、’小虎’の方向性が大きく変わり、AGI開発からより専門的なアプローチへと移行しました。Baichuanと01.AIは、大規模モデルの事前トレーニングを放棄し、それぞれ医療AIと産業アプリケーションに焦点を当てています。MiniMaxは、B2Bオペレーションを縮小し、Cエンドのビデオ生成およびその他のアプリケーションで海外市場に焦点を当てています。Zhipu、Moonshot AI、StepUpはまだオープンソースコミュニティで活動していますが、DeepSeek R1を上回る新しいモデルは作成していません。Zhipuはかなりの資金調達と政府・企業パートナーシップを確保しており、その生存を確保しています。Moonshot AIの主要製品であるKimiは、Yuanbaoによってその地位が脅かされており、そのポジショニングはますます厄介になっています。

全体として、’小虎’はますますB2B SaaS市場に収束しており、一部の人々はこれを’想像力に欠ける’と考えています。

B2B市場の魅力と限界

01.AIは最近、DeepSeekを完全に統合して、さまざまな業界向けのワンストップエンタープライズ大規模モデルプラットフォームを作成する意向を発表しました。しかし、この動きは懐疑的な見方で迎えられています。

金融AI専門家の蒋紹(ジャン・シャオ)氏は、01.AIの将来は、その幅広い焦点、DeepSeekの出現後の技術的な競争力の欠如、および限られた商用化能力のために不確実であると考えています。

王文広氏は、ワンストップ大規模モデルプラットフォームへの参入障壁は比較的低いと指摘し、この感情に同意しました。王氏は、約6か月でそのようなプラットフォームを独自に開発し、個人的なチャネルを通じて販売した経験を共有しました。彼は、企業としてこの製品から利益を得ることは困難ですが、単独のベンチャーとして利益を上げることができると主張しました。

王氏は、大規模モデルサービスを提供するが、技術プラットフォームがないいくつかのB2B企業と協力しています。彼は、1ライセンスあたり約40,000〜50,000元という低コストで彼のプラットフォームを提供し、大企業を大幅にアンダーカットしています。

彼のプラットフォームであるKAF(Knowledge-based Agent Factory)は、ナレッジグラフ、ベクターデータベース、および検索エンジンを使用して、大規模モデルおよびAgentアプリケーションを提供します。これにより、ユーザーはプロンプトとモデル管理を通じてコーディングなしでカスタムナレッジアシスタントまたはAgentを作成できます。王氏は、同様のプラットフォームが市場に普及しており、複製が容易になっていると述べました。

王氏によると、B2B大規模モデルアプリケーションの開発を目指す企業は、熟練した個人の小規模チームを雇用するか、外部のAI企業と提携することで、迅速に製品を作成できます。このアプローチは、大規模モデルのトレーニングよりも大幅に安価です。

プラットフォームモデルに加えて、統合ソリューションはハードウェア、ソフトウェア、および実行環境を提供し、すぐに使用できる機能を提供します。Ping An Insuranceのテクノロジープラットフォームグループの責任者である張森森(ジャン・センセン)氏は、統合ソリューションは、技術的な展開能力が限られている政府および教育機関を中心に、実行可能な市場を持っていると考えています。これらのソリューションは、使いやすさと技術的な自律性を優先し、データセキュリティ、プライバシーコンプライアンス、ハードウェア-ソフトウェアの最適化などの利点を提供します。また、国内で製造されたチップを使用して、制限を回避し、効率を向上させることもできます。コストに敏感でROIに重点を置いている企業は、ライフサイクルが長いため、統合ソリューションが魅力的だと感じるかもしれません。

国内のSaaS市場は、歴史的に、高いカスタマイズ要件、一般的で均質な製品、激しい競争、低価格戦略、および短期的な収益化への焦点などの課題に直面してきました。この市場の顧客は、デジタル化のレベルが低く、支払い意欲が限られていることがよくあります。

対照的に、国際的なSaaS市場は専門化を重視しており、企業は特定の分野に集中し、支払い意欲の高い大規模および中規模のクライアントに詳細なサービスを提供しています。

大規模モデルの分野は、これらの傾向を反映しています。国際的なSaaS市場での最近の出来事は、これを示しています。

  • 2025年2月、MongoDBは、埋め込みモデルとリランキングモデルに焦点を当てた17か月のAIスタートアップであるVoyage AIを2億2000万ドルで買収しました。
  • 2024年、Amazonは、2年間のAI AgentスタートアップであるAdeptとの技術ライセンス契約を発表し、一部のAdeptメンバーがAmazonのAGIチームに参加しました。

これらのスタートアップは、大規模モデル技術内の特定のニッチに焦点を当てることで成功を収めました。そのような例は中国ではまれです。多くの中小企業は、大企業がそのスペースに参入することに対して常に警戒しなければなりません。

王文広氏は、B2B市場での豊富な経験から、その厳しい現実を説明しました。彼は、ワンストッププラットフォームの大きな市場はあるが、細分化されていると述べました。運営コストの低い小規模企業は、競争力のある価格を提供し、大企業をアンダーカットすることができます。これにより、アプリケーションサービスの価格が押し下げられます。大企業でさえ、他のスタートアップや従来のインテグレーターからの競争に直面しています。大企業は独自の大型モデルとブランドの利点を持っているかもしれませんが、同様のB2Bビジネス戦略に直面しています。

王氏が述べたように、’私もDeepSeekを使用しており、他の多くの企業もDeepSeekを使用しているため、差別化はありません。中国には非常に多くのクラウドベンダーがあるため、少なくともそれだけの数の競合他社が存在します。国内のB2B市場は常にこのようになってきました。生き残るためには、強力なつながり、優れたサービス、または低価格のいずれかが必要です。’

梁赫氏は、01.AIの現在の選択と将来の見通しについて簡潔な評価を提供しました。

  • 李開復氏が01.AIのビジネスを完全にB2Bアプリケーションに移行し、ワンストップエンタープライズ大規模モデルプラットフォームを推進するという決定は、商業的には理にかなっていますが、激しい競争につながります。
  • 01.AIがより大規模な企業よりも低価格の大規模モデル製品を提供する必要があるのは、アプリケーション層での独自の利点の欠如の結果です。
  • 01.AIのB2Bへの移行は、想像力の喪失と’セクシーさ’の低いプロジェクトを示しています。これは、2017年のAIの以前の波からの多くのコンピュータービジョン企業の運命と似ています。
  • 01.AIは、海外市場を開拓すれば機会があるかもしれません。

01.AIと比較して、Baichuanの将来についての意見はそれほど悲観的ではありません。ただし、Baichuanの医療分野への参入は、特にデータにおいて独自の利点がありません。

蒋紹氏は、Baichuanの医療へのシフトは単に生き残るための方法だと述べました。ただし、01.AIと比較して、Baichuanは少なくともニッチ市場に参入しようとしています。

張森森氏は、技術企業よりも医療データを保有している企業が医療大規模モデルを開発することについて、より楽観的であると述べました。これは、業界固有の大規模モデルを作成しようとしている企業に当てはまります。医療大規模モデルを作成する上での主な課題は、モデル自体ではなくデータにあります。中国には、DeepSeekを使用して独自の用途に合わせて大規模モデルを微調整できる優れた病院がたくさんあります。

医療データを効果的に取得するにはどうすればよいでしょうか?蒋紹氏は、AI技術のスタートアップはデータにおいて利点がないと述べました。医療大規模モデルを作成するには、すでに病院にITサービスを提供している企業と協力する必要があるかもしれません。

伝えられるところによると、’小虎’の1つは、国内の大手医師交流フォーラムと独占的に提携し、医師交流から生成された膨大な数の症例を使用してモデルをトレーニングしています。

ニッチ市場に対するより楽観的な見通しに加えて、業界の専門家はBaichuanの創業者である王小川(ワン・シャオチュアン)氏に期待を寄せています。

梁赫氏は、王小川氏が医療に特化して成功するかどうかは、彼が理想を追求したいのか、お金を稼ぎたいのかにかかっていると考えています。彼は、王氏が理想を追求し、画期的な医療AIの研究結果を生み出すことに傾倒していると考えています。

王文広氏は、この市場の時代遅れな性質を強調しました。彼が述べたように、短期的な商用化が目標である場合、医療分野もB2B市場全体と同様に競争が激しいです。多くの企業が、ナレッジグラフ、ベクター検索、および医療アプリケーション向けの大規模モデルを使用できます。

Zhiweiが医療AIの専門家と行った議論によると、医療研究自体には大きな知識のギャップがあり、新しい知識は急速に成長しています。したがって、大規模モデルを使用して医療基礎研究を行うための大きな可能性があります。たとえば、タンパク質構造予測のためのAlphaFoldモデルは、Meis Medicalによると、バイオリニューアブルマテリアルの開発や遺伝子研究の推進など、研究を加速するために世界中の180万人以上の科学者によって使用されています。

理想を追求するかお金を稼ぐかに加えて、医療AIのスタートアップは、一般的な医療大規模モデルを作成するかどうかという問題にも直面しています。

張森森氏は、国内市場では一般的な医療大規模モデルにブレークスルーがないと述べました。これは主に、大規模なデータ収集とアプリケーションのために強力な医療機器への依存に起因します。中国の多くの医療施設は広く普及していないため、AIが正確な診断を行うことは困難です。ただし、メイヨー・クリニックなどの一部の強力な病院は、独自の大規模モデルの立ち上げを検討し始めています。短期的には収益機会を見ることは困難ですが、これらのタイプの大きなモデルは、長期的には医療業界に大きな影響を与える可能性があります。

医療業界はまた、完全自動診断の課題に直面しており、特に国内市場では、機器が不十分であり、AIが従来の診断方法を完全に置き換えることができません。特に遠隔地では、医療機器が広く普及していないため、医療技術を完全にカバーすることは困難であるため、完全自動診断は依然として大きな課題です。

医療業界には厳格なライセンスおよびコンプライアンス要件があり、大規模モデルは医療分野に参入する際にコンプライアンスの問題に対処する必要があります。将来のCエンドの医療サービスは、医師の技術とAIを組み合わせて、特に若い世代にとって診断と治療の効率を向上させる可能性があります。

最後に、国内のB2B市場の特性を無視しても、大規模モデルアプリケーションでの競争により、To B市場で生き残ることは困難です。王文広氏は、大規模モデルTo B製品の設計モデルはまだ模索されていますが、最終的には収束すると述べました。これは中国だけでなく、OpenAI、Anthropic、Googleなどのシリコンバレーのテクノロジー企業にも当てはまります。モデル自体のパフォーマンスに大きな違いがない限り、この市場でお金を稼ぐことは不可能であり、最終的には誰もが同じレベルになります。

これが、DeepSeek R1が中国ではなく海外、特にシリコンバレーのテクノロジー企業に最大のインパクトを与えた理由です。米国株式市場は、R1のリリース後、大きな変動を経験し、その後下落し始めました。中核となるロジックは単純です。シリコンバレーの大規模モデルは中国に追いつかれました。それらを超えていないものの、ギャップを広げることができなかったため、そのような高い評価をサポートすることができなくなり、株価の下落につながりました。

もちろん、To B市場が顧客を引き付けるための別の方法があります。それはオープンソースです。オープンソースの主な収益モデルには、有料レベルの機能、クラウドホスティング、およびオープンソーステクノロジーに基づくエンタープライズレベルのコンサルティングやトレーニングなどの付加価値サービスの提供が含まれます。

オープンソース大規模モデルの最も直接的な効果は、テクノロジーの普及を促進することです。張森森氏は、DeepSeekのオープンソースにより、企業による大規模モデルの適用が大幅に加速したと述べました。経営陣は、大規模モデルの適用を非常に支持しています。大規模モデルが実際のアプリケーション、特に人間の介入を減らし、効率を高める上で優れたパフォーマンスを発揮するため、サポートは引き続き増加します。

データ品質が最も高い業界である金融業界は、常にAIで豊富な技術的蓄積があり、すぐに追いつくことができます。DeepSeekに関係なく、金融はAIテクノロジーを実装します。ただし、DeepSeekを使用すると、AIは金融業界の中核ビジネスを可能にするだけでなく、以前は困難だった日常のオフィスワークや運用にも使用されます。

以前は運用には非常に費用がかかりました。たとえば、根本原因分析では、以前は従来の運用監視とAIOps、および小規模モデルのトレーニングが必要でした。現在、DeepSeekをナレッジベースと組み合わせて使用して、監視、アラーム、セルフサービス分析、トレーサビリティ、自動処理、および安定性の向上を処理するためのアプリケーションプランを生成できます。これは、AIOpsよりも柔軟です。

さらに、AIの運用範囲は広くなり、インタラクティブ性とイニシアチブがより考慮されるようになりました。イニシアチブとは、AIが積極的に運用を実行できるようにすることを意味します。ルール、人間、または個人の経験に依存することから移行し、人間の経験レベルが運用能力のレベルを決定したため、より軽量なAIモデルを使用してこれを直接実現できるようになりました。

DeepSeekの幻覚率はいまだに高く、他の類似モデルと大幅に異ならないとしても、その推論と実際のアプリケーション能力は幻覚のマイナスの影響を相殺することができます。この問題は、RAGおよびその他の関連テクノロジーを使用した微調整と最適化を通じて徐々に改善されます。

Alibabaの大規模モデル技術専門家である高鵬(ガオ・ポン)氏は、DeepSeekの影響は大規模企業と小規模企業で異なると考えています。

Alibabaが社内で使用している大規模モデルは、常に業界で最も高度であるため、DeepSeekの登場は大きな影響を与えていません。AlibabaはDeepSeekをパフォーマンス評価と比較に使用し、技術的なインスピレーションをより多く提供しています。DeepSeekの推論の実装は比較的速く、技術的な詳細はより一般的です。DeepSeekはQianwenの影響も受けています。

対照的に、DeepSeekは中小企業に大きな影響を与えています。以前は、低コストのプライベート展開を提供しながら、DeepSeekの効果を実現できるモデルはありませんでした。DeepSeekのリリース後、DeepSeek統合マシンを販売する多くの企業が出現しました。ただし、DeepSeekは、特定の標準に応じて、多くのオープンソースモデル統合マシンと比較して最も安価ではありません。

いずれにせよ、国内のオープンソース大規模モデルは現在繁栄しており、グローバルに競争することができます。ただし、Ping An Insuranceの大規模モデルの実装に基づいて、張森森氏は、オープンソース大規模モデルには依然として克服できない制限があると信じています。

私たちにとって、DeepSeekには主に巨大なコスト上の利点があります。機能の面では、推論、一般化能力、および文脈理解の面で、運用シナリオでは他のモデルよりも優れている可能性があります。ただし、DeepSeekは、金融リスク管理などのより複雑なシナリオでは十分に機能しません。これは、より詳細な微調整、または他のモデルと組み合わせて最適化する必要があるためです。したがって、モデルのパフォーマンスをさらに向上させるには、特定のアプリケーションシナリオに基づいたターゲットを絞った微調整が必要です。

Ping Anの自己開発大規模モデルは、基盤となる基盤大規模モデルと、銀行、保険、およびその他のビジネスを担当するドメインモデルの2つのレイヤーに分かれています。社内で使用される大規模モデルは、専門知識の分野、特に金融や医療などの特定の分野でDeepSeekよりも優れたパフォーマンスを発揮し、モデルはより正確です。ただし、DeepSeekには依然として推論能力に強い利点があります。一部のシナリオでは、DeepSeekを使用して小規模な試みを行い、それが実行可能かどうかを確認したいと考えています。

Alibaba Qianwen、Baidu Wenxin、およびZhipu ChatGLMとDeepSeekの間に、この点で大きな違いはありません。判断は、これらのモデルが推論能力と知識ベース構造においてDeepSeekと大きな違いがないという事実に基づいています。

全体として、オープンソース大規模モデルの影響は現在限られており、それらの間の競争のペースは激しいです。

To C市場の危険

To B市場での競争は激しいですが、これはTo Cルートがより多くの希望を提供することを意味するものではありません。

大規模モデルのTo C市場での競争も非常に激しいですが、To B市場とは大きく異なります。

市場の状況は常に変化しています。

To Cの収益化は困難です。

最も人気のあるアプリケーションが必ずしも最大の収益を上げるわけではありません。たとえば、ChatGPTの収益は最も高いですが、OpenAIは依然として年間50億ドルの損失を出していますが、ChatGPTの多くの’コピーキャット’アプリケーションは迅速な収益性を達成している可能性があります。DeepSeekが人気になった後、模倣者と偽造者が殺到しました。

Cエンド市場から’小虎’の状況を観察することも楽観的ではありません。Zhiweiと業界の専門家とのコミュニケーションは、一般的に大手メーカーが大きな生存圧力をかけると考えています。

蒋紹氏は、消費者市場で最も優れたパフォーマンスを発揮している’小虎’はMoonshot AIのKimiであると述べました。しかし現在、TencentのYuanbaoが1位、DeepSeekが2位、Doubaoが3位です。上位3社はほぼ市場シェアの大部分を占めています。TencentのYuanbaoは、WeChatエコシステムの助けを借りて大量の顧客トラフィックを獲得し、DeepSeekは技術革新と複数のシナリオでの優れたパフォーマンスで際立っています。

梁赫氏は、Kimiの大規模モデル技術は競合他社と大きく異ならないため、無料にするしかないため、Moonshotが商業化することは非常に困難になると述べました。To Cアプリケーションとして、YuanbaoおよびDoubaoとどこが異なるかは不明です。さらに、DoubaoはByteの他のビジネスによってサポートされ、YuanbaoはTencentの他のビジネスによってサポートできます。彼らはこれらのアプリケーションをサポートするために1000億ドルを投資することができます。

蒋紹氏は、Cエンドユーザーは製品の使いやすさにもっと関心があり、TencentとByteが得意としていると付け加えました。もちろん、Alibabaにも機会があります。Alibabaは’AI Listening’というアプリケーションをインキュベートしており、AIをチャットとインタラクションに使用し、短編ビデオプラットフォームでDouyinを置き換えることを目指しています。Douyinは多数のクリエイターを引き付けて高品質のコンテンツを生成していますが、AIチャットアプリケーションは、よりパーソナライズされたインタラクティブなエクスペリエンスを提供することで、ユーザーグループを引き付ける可能性があります。2つの違いは、コンテンツの作成とインタラクションにあります。Alibabaがこれを突破できれば、状況を逆転させるチャンスもありますが、Tencentが追随するかどうかはわかりません。

MiniMaxに関して、業界の意見はわずかに異なります。

梁赫氏は、MiniMaxのConch AIは現在、良好な利益を上げていると考えています。それはそれ自身の方法を見つけましたが、このパスでMiniMaxが十分に評価を高めることができるかどうかはまだわかっていません。そのアプリケーション指向のために、MiniMaxはDeepSeekが登場した後、よりリラックスしています。DeepSeekのモデルを使用すると、モデルの研究開発コストを節約でき、そのアプリケーションはさらに収益を上げることができます。

蒋紹氏は、MiniMaxが後で人気のあるAPPを作成できればチャンスがあると信じていますが、Alibabaがそれを上回り、最初に人気のあるAPPを作成する可能性もあるため、MiniMaxにチャンスがあっても、その確率は高くありません。

最終的に、製品の差別化は依然としてCエンドアプリケーションのブレークスルーポイントです。

a16zの最新レポート’Top 100 Gen AI Consumer Apps’によると、多くの低使用アプリケーションは実際に優れた収益を上げています。植物の識別や栄養などの汎用性の低い一部の製品は、一般的な製品よりも支払うユーザーを引き付けます。

一般的なAI製品を差別化することは困難です。ユーザーは支払い意欲が低く、利益サイクルは長いため、大企業を生き残ることができません。

また、差別化が垂直方向に十分に深くない場合、容量アップグレードを通じて基本大規模モデルによって内部化されることも簡単です。たとえば、最近のGPT-4oの画像生成機能は、Midjourneyなどのテキストから画像へのスタートアップに次元削減の打撃を与えました。このカバレッジ機能は多くの場合ランダムで予測不可能であり、ことわざにあるように、’あなたを破壊することはあなたとは何の関係もありません。’

競合他社のピクセルレベルの模倣とベース大規模モデルの急速なアップグレードにより、CエンドAIスタートアップの風景はほとんど常に短期間しか維持されません。

ヒットになる可能性が非常に低い可能性をつかむ方法として、業界の専門家は全員一致で’従うべき経験は基本的にない’と信じています。

‘小虎’が今日の苦境に陥ったのは、主にベース大規模モデルに投資しすぎ、このトラックで生き残り、優れているために必要な人員、財源、および物的資源を過小評価したため、アプリケーショントラックで差別化することが困難になったためです。

現在、’小虎’はAGIを攻撃することをますます決意しておらず、李開復はDeepSeek、Ali、およびByteのみが国内のベース大規模モデルに残ると公に述べています。

この点で、Zhiweiとコミュニケーションをとった業界の専門家は、基本的にこの見解に同意しています。

蒋紹氏は、大規模モデルテクノロジーで引き続き懸命に取り組んでいるAIスタートアップは、基本的に死ぬはずだと述べました。最も有望なのは間違いなくDeepSeekであり、2番目はAlibaba、3番目はByteDanceです。最初の場所はトラフィックの50%〜80%を取得し、後者2つはトラフィックの10%を取得する可能性があります。コアは誰が最初にAGIを作るかにあり、誰が究極の勝者であるかにあります。

DeepSeekは現在、大規模モデルの分野で最も競争力があり、その技術革新と実際のアプリケーションでのパフォーマンスは申し分ありません。AlibabaとByteDanceも強力な競争力、特にクロスプラットフォームアプリケーションとデータリソースを持っています。ランキングは、主に各企業の基本的なテクノロジー、コンピューティングパワー、データリソース、および実際のアプリケーションの革新能力に基づいています。

ZhipuとKimiのチームは、ベースモデルの機能を強化し続けることが将来であると固く信じています。対照的に、市場の需要の変化とアプリケーションシナリオの多様化により、ベースモデルを単に強化するだけのルートは制限される可能性があり、より柔軟で適応可能なモデル開発パスが市場でより競争力が高くなると信じています。

大規模モデルテクノロジーの競争は非常に激しく、大規模な投資をしている企業は、最終的には革新、コンピューティングパワー、データ、および最適化において明確なブレークスルーを起こして競争力を維持する必要があります。テクノロジーの進歩に追いつくことができない、または市場の需要に対応できない他の企業は、徐々に排除されます。

梁赫氏は、これらの3つが研究開発にスーパーリソースを投資する力と決意を持っているという事実にに基づいて、DeepSeek、Ali、およびByteのみが将来国内のベース大規模モデル会社に残ると述べました。Byteにとって、大規模モデルの機会を逃すことは不可能であり、そうしないと全体に大きな影響を与えます。また、DeepSeekのテクノロジーはByteにとってあまりにも多くの障壁にはなりませんが、DeepSeekは現在、R&D効率において大きな利点があります。AlibabaのQianwenオープンソースモデル自体が高いレベルにあります。DeepSeekが人気になる前は、QianwenとLlamaは基本的に互いに追いかけ合っていました。Alibabaにとって、Qianwenモデルはお金を稼ぐことができないかもしれませんが、関連するクラウドビジネスはお金を稼ぐことができ、Byteも同様であり、大規模モデルテクノロジーを引き続き使用して、Douyinやその他のアプリのエクスペリエンスを継続的に最適化できます。AIスタートアップの場合、モデル自体がお金を稼ぐことができない場合、生存の根源に触れます。

王文広氏は、DeepSeekの利点は主に技術的な理想主義にあると述べました。春節の前後の2〜3か月以内に、DeepSeekのトラフィックは非常に大きかったです。商業化したい場合、すぐに世界でトップに達し、Doubaoなどの他の大規模モデルはまったくチャンスがありません。DeepSeekが最近のオープンソース週でインフラストラクチャ関連の最適化方法をオープンソースにしない限り、これに依存して将来お金を稼ぐことができるため、他の人はチャンスがありません。DeepSeekは資金提供されておらず、投資家の影響を受ける必要はありません。技術的な理想主義と才能が最大の障壁です。OpenAIと比較して、OpenAIが現在見ることができる結果は、基本的にAltmanとIlyaの間の紛争前の研究結果です。少なくとも、イノベーションポイントは決定されています。現在、理想主義者の元のチームの出発後、OpenAI自体はほとんどイノベーションを起こしていません。現在、OpenAIのイノベーションは、ディープリサーチなどのアプリケーションレベルでより多くあります。アプリケーションレベルでのイノベーションには障壁がないため、競合他社と競争する必要があります。

大手工場のAI技術専門家である王Mu(ワン・ムー)氏は、お金、才能、およびハードウェアがない限り、大規模モデルの事前トレーニングに労力を費やす必要はないとZhiweiに語りました。DeepSeekは2021年の早い段階で10,000カードのクラスターを持ち、お金に不足していません。対照的に、他の中小企業はほとんどこの条件をまとめることができません。

高鵬氏は、AIスタートアップは生き残りたい場合、アプリケーションに頼らなければならないと述べました。1〜2年前にそう思っていましたが、今では頼るのが遅すぎるかもしれません。次に排除されるAI企業は、ベース大規模モデルを作成する企業です。大規模モデルのトレーニングには、実際には多くの複雑な詳細があり、経験の蓄積に大きく依存しています。Transformerアーキテクチャの内部詳細は一般的に十分に理解されていますが、オープンソースまたはクローズドソースモデルの論文では、基本的にデータがどのように準備されているか、データ詳細が何であるか、データスケールがどれだけ大きいか、およびデータ品質がどれだけ優れているかはわかりません。業界には統一された標準はありません。

オープンソースオープンハーフは、常に大規模モデルトラックでの典型的な慣行でした。現在、コード、ウェイト、データセット、およびトレーニングプロセスを完全に開示する大規模モデルはほとんどありません。よりよく知られているのは、OLMo、BLOOMなどです。

ただし、アプリケーションに頼ることが生き残るために役立つとしても、以前のTo BトラックとTo Cトラックの分析から、AIスタートアップがアプリケーションで独自の業界障壁を形成することはほとんど困難です。この点に関して、高鵬氏は、独自の業界障壁を形成するための鍵は、どのようなデータを持っているかにあると述べました。モデルは誰でも使用できます。データは2つの側面に分けられます。1つは起業家の分野での経験であり、もう1つは手元のデータです。

企業文化の観点から、高鵬氏は、ベース大規模モデルの研究開発には、実験的およびエンジニアリングのハードワークの精神が必要であると考えています。’以前の長い間、多くの国内のAIスタートアップは過度に高調子でした。テクノロジーを行うときは、まず控えめに行い、次に高調子で宣伝する必要があります。一部のチームは学術界でより多く構成されていますが、学術界の人々はテクノロジーを理論的に研究しすぎることがあります。才能またはチームに関しては、大規模モデルチームの成功は主にボスが大規模モデルを理解しているかどうかにかかっています。ボスが大規模モデルテクノロジーを理解していないか、継続する信仰がない場合、お金を稼ぐことができないため、まったく機能しません。DeepSeekの成功は、トップダウンの組織モードに大きく依存しています。ボスは技術的な詳細を非常によく理解しており、全員を率いて一緒に実行します。このモデルを満たす国内モデルは少なすぎます。’

国内のベース大規模モデルの最終的な勝者の予測に関する業界の白熱した議論に関して、高鵬氏は、この判断は時期尚早であると考えています。’競争に参加できるプレイヤーの技術ルートに大きな違いはありません。Transformerアーキテクチャに従って詳細な最適化を行います。MambaとRWKVにも希望があります。鍵は着実に物事を行うことであり、時間がすべてを証明します。最終的な勝者と上位3人は言うのが簡単ではありません。大規模モデルテクノロジースタックは非常に複雑なものであり、静かに1つのことを行っている人がたくさんいるかどうかは誰にもわかりませんが、時間はまだ来ていません。’

モデルの勝者を判断するのが困難な現在の状況では、データが最も重要な堀になっています。セコイアキャピタルのパートナーであるKonstantine Buhlerはかつて、OpenAIがChatGPTで行った1つの間違いは、返信の編集を許可しなかったことでした。これにより、フィードバックループでより高品質のデータを提供し、より深い堀を構築できた可能性があります。

データがある業界がAIの助けを借りてさらに発展できるか、または現在新しいビジネスチャンスをもたらすかどうかも非常に重要です。張森森氏は、AIの着陸の成熟度は金融およびインターネット業界に近いと述べました。AIオフィス、AI政府事務、およびAI e-コマースについて、より楽観的です。これは主に、その高度なデジタル化とパフォーマンスの高い確実性に基づいています。

‘e-コマースは比較的成熟していますが、AIは特に商品推奨、顧客サービス、および物流の最適化において、e-コマースの効率を向上させ続けます。AIは、より正確な市場分析と意思決定の最適化を通じて、e-コマースプラットフォームの効率を向上させることができます。この効率の向上は、オフライン小売の継続だけでなく、新しい形式のe-コマース、特にクロスボーダーe-コマースの分野で、AIが爆発的な成長を支援します。’

‘対照的に、金融業界は2024年にパフォーマンスの爆発を経験し、AIビジネスが深まるにつれて、2025年にはまだ多くの成長の余地があります。’

‘AIの着陸が成熟していない業界、特にスマート製造を見ると、カスタマイズされたものがたくさんあり、各企業が製造する製品は異なり、統一された標準はありません。したがって、企業がAIワークの自動化を推進することは困難であり、データの価格は非常に高く、精度の要件も非常に高くなっています。産業用ソフトウェアは基本的にスマート製造着陸の最も初期のソリューションの方向性ですが、より効果があります。ただし、製造業のAIアップグレードには歴史的な負担があります。製造業のほとんどのデータと情報化レベルは十分ではないため、AIを行うときにデータが不足し、特に異常なサンプルの収集はほとんど存在しません。複雑さも高く、機器のタイプが多く、データ標準が一貫していないため、アルゴリズムの転送性が悪く、温度、材料、または予測不可能な変数の影響などのいくつかの重要な要素を無視することがよくあります。さらに、企業はセンサーデータへの注意に逸脱があります。さまざまなセンサーの故障データについて、企業は主に生産結果に影響を与えるデータに焦点を当てています。実際、これらのエッジセンサーデータは、将来私たちが製造業全体の革新と商業化を最大限に活用するための支点になる可能性があります。AIはこれらのデータの分析を通じて潜在的な最適化の機会を発見し、それによって業界全体の進歩を促進します。’

‘さらに、製造業の能力要件も他の業界とは異なります。問題のリアルタイム処理が必要であり、大規模モデルのレイテンシはここでは受け入れがたいです。したがって、スマート製造は短期的には投資収益率が得られません。もちろん、国はこの業界のAIを確実にサポートします。今後5年間で大規模な増加が発生する可能性があり、ロボットとAIは二重の組み合わせになります。’

最終的に、スタートアップにとって、ベース大規模モデルを作成する場合でも、To BまたはTo Cを行う場合でも、確固たる堀を見つけることは困難です。データの長期的な蓄積や技術的な経験がなければ、競争力のある障壁を形成することは不可能です。

したがって、スタートアップがある程度有名になったときにスノーボールを転がすことができなくなると、徐々に衰退し、最終的に生き残る理由を見つけることができなくなるのは簡単です。

彼らがどこかの時点で黄金のリンゴを選ぶとき、それは運命の女神が短い昼寝をしているだけです。