DeepSeek超え:中国のオープンソース'軍'、AIの勢力図を塗り替える

中国のオープンソース運動は、無視できない勢力として急速に統合されつつあります。 DeepSeekやAlibabaのQwenのような基礎モデルが先頭に立って、中国のオープンソース能力の新たなベンチマークを設定し、中小企業(SME)の数は増え続けており、これらの進歩を活用して、より小型でありながら、より強力な垂直モデルを開発しています。このイノベーションの急増は、中国における大規模モデルのアップデートのペースを加速させ、常に新鮮でエキサイティングな開発を提供しています。米国で主流となっている主にクローズドソースのアプローチとは対照的に、中国企業はオープンソースを採用し、技術的な自信を示し、技術的な包括性とグローバルコラボレーションに向けた新しい道を切り開き、継続的に海外市場に拡大し、「一極覇権」から「多極共存」へとグローバルなAIの勢力図をシフトさせています。

中国のオープンソースの収束

2月上旬、中国のオープンソース大規模モデルDeepSeekが世界140の国と地域でアプリ市場のダウンロードチャートのトップになったとき、OpenAIはDeepSeekがChatGPTからの蒸留データを許可なく使用したと公に非難しました。

この非難は、OpenAIの評判を挽回するどころか、世界中の研究者から広範囲にわたる嘲笑を受けました。

現在、「蒸留」バフを全面的に採用した別の競争相手が登場しています。

4月13日、昆侖万維はSkywork-OR1(Open Reasoner 1)シリーズモデルを発表し、同じスケールでAlibabaのQwen-32Bを上回り、DeepSeek-R1と連携しました。

資金力が限られている昆侖万維が、どのようにSOTAレベルの大規模モデルを作成できるのでしょうか?公式の説明では、彼らのモデルはDeepSeek-R1-Distill-Qwen-7BとDeepSeek-R1-Distill-Qwen-32Bに基づいているとのことです。

名前が示すように、DeepSeekのモデルはAlibabaのQwenシリーズモデルを蒸留しました。

優れたオープンソースモデルを活用しながら、昆侖万維はオープンソースコミュニティにも貢献しています。モデルの重みのみをオープンソース化したDeepSeekとは異なり、昆侖万維はデータセットとトレーニングコードもオープンソース化しており、「真のオープンソース」の概念により近いものとなっています。これは、どのユーザーでも彼らのモデルトレーニングプロセスを再現できることを意味します。

昆侖万維の成果は、オープンソースの最も重要な側面を示しています。それは、ユーザーに無料で手軽に利用できる製品を提供するだけでなく、より多くの開発者が先人の肩の上に立ち、迅速かつ費用対効果の高い方法で技術を進歩させることを可能にするということです。

実際、昨年の大規模モデルの事前トレーニングにおけるボトルネックに関する業界の議論の中で、中国の大規模モデルのイテレーションのペースは今年加速しており、ますます多くの企業がオープンソースに投資しています。

Alibaba CloudのTongyi Qianwenは、中国の旧正月に新しいビジュアルモデルQwen2.5-VLをオープンソース化し、3月上旬に新しい推論モデルQwQ-32Bをリリースしてオープンソース化し、オープンソース化された日にグローバルな主流AIオープンソースコミュニティHugging Faceのトレンドリストのトップになりました。

Stepwiseは、約1か月で3つのマルチモーダル大規模モデルをオープンソース化しました。最新のものは、制御可能なモーション振幅とレンズの動きを備えたビデオの生成をサポートし、特定の特殊効果生成機能も備えた画像からビデオへのモデルStep-Video-TI2Vです。

Zhipuは4月に、ベース、推論、および熟考モデルをカバーする32B/9BシリーズのGLMモデルをすべてMITライセンス契約の下でオープンソース化すると発表しました。

かつてはクローズドソースだったBaiduでさえ、6月30日にWenxin大規模モデルを完全にオープンソース化すると発表しました。

国内のオープンソースエコシステムの成長と比較して、アメリカの大規模モデル企業は依然として主にクローズドソースに焦点を当てており、中国の大規模モデルに海外に進出するまれな機会を与えています。DeepSeekは、インドネシアの教育会社Ruangguruが低コストで教育モデルを最適化することを可能にしました。シンガポールのB2B旅行技術会社Atlasは、Qwenをインテリジェントな顧客サービスシステムに統合し、24時間年中無休の多言語サポートを実現しました。

なぜ米国はクローズドソースで、中国はオープンソースなのか?

米国のAI業界におけるクローズドソースの傾向と、中国のAIのオープン化が進んでいるのは、両国のAI開発環境の違いから必然的に生じる結果です。

米国のAI業界は、主にテクノロジー大手とVC(ベンチャーキャピタリスト)が主導しており、彼らはAIからの資本収益に大きな期待を寄せています。したがって、米国のAIモデル企業は一般的に技術に対する強い信念を持っており、つまり、技術的なリーダーシップを追求し、ある程度の市場独占を達成し、それから巨額の利益を生み出すことであり、彼らのエコシステムは当然クローズドソースに傾倒しています。

OpenAIの開発の歴史を例にとると、設立当初は非営利団体としてスタートしましたが、それ以来、ますます閉鎖的になっています。GPT-1は完全にオープンソース、GPT-2は部分的にオープンソースで、完全にオープンソース化される前に反対に遭い、GPT-3は正式にクローズドソース化され、GPT-4はクローズドソース戦略をさらに強化し、モデルアーキテクチャとトレーニングデータは完全に機密であり、企業ユーザーのAPI呼び出し頻度さえも制限しています。

OpenAIは、ソースを閉じることはコンプライアンスと技術の乱用を制御することに基づいていると述べていますが、市場は一般的に、OpenAIがクローズドソースに移行した画期的な出来事は、Microsoftとの数千億ドル規模の協力関係に達し、GPT-3をAzureクラウドサービスに組み込んで「技術資本」の閉ループを形成したことであると考えています。

Microsoftが昨年10月の財務報告書でOpenAIへの投資を最初に開示したとき、次のように述べています。「OpenAIGlobal, LLCに総投資額130億ドルを投資しており、この投資は持分法を使用して会計処理されています。」

いわゆる持分法は、MicrosoftのOpenAIへの投資は純粋な慈善研究ではなく、収益を得ることを目的としていると理解することもできます。明らかに、OpenAIがクローズドソースエコシステムを通じて高価なAPIを販売することは、現在の最大の収益源であり、OpenAIがオープンソース化を嫌がる最大の障害となっています。

OpenAIの「スプリット」から設立されたAnthropicは、当初からクローズドソースルートをたどることを決意しており、その大規模モデル製品Claudeはクローズドソースモデルを完全に採用しています。

米国で唯一のオープンソースリーダーであるMETAのLlamaでさえ、オープンソース化の際に2つのアンチフレンド条項を追加しました。

  1. METAが承認する前に、オープンソースモデルを月間アクティブユーザー数が7億人を超える製品およびサービスに使用することはできません。
  2. Llamaモデルの出力コンテンツを他の大規模言語モデルのトレーニングおよび改善に使用することはできません。

オープンソースモデルであっても、Metaの主な目的は、技術的な包括性ではなく、独自のAIエコシステムを構築することであることがわかります。

米国は、資本レベルでオープンソースを補完としてクローズドソースに基づいたAI戦略を選択しており、これは純粋に商業的な考慮事項と言えます。対照的に、中国のトップダウンのトップレベル設計は、当初からオープンソースを重視しており、独立した制御の概念の下で業界優先の道を反映しています。

早くも2017年に、中国政府は「新世代人工知能開発計画」を発表し、AIと経済社会の深い統合を加速し、AI開発の先行者利益を構築するために展開することを明確に提案しました。2021年、オープンソース関連のコンテンツが中国の「第14次5カ年計画」に明示的に含まれ、地方政府による技術革新の積極的な推進につながりました。

中国科学院の学者であるMei Hong氏は、かつて、言語モデルの将来の発展はオープンソースプラットフォームに依存する必要があると述べています。オープンな環境でのみ、さまざまな業界のユーザーのデータアップロードとビジネス統合のセキュリティと信頼性を確保できます。

工業情報化部およびその他の4つの部門が昨年12月に発行した「中小企業のデジタルエンパワーメントのための特別行動計画(2025-2027)」は、Open Atom Open Source Foundationが「中小企業AIオープンソース特別プロジェクト」を設立し、再現可能で推進しやすいトレーニングフレームワーク、テストツール、およびその他のリソースを提供して、企業の技術的ハードルを下げることを明確にサポートしています。

より現実的な問題は、米国による潜在的な技術封鎖のため、中国はAI分野の単なるフォロワーになることはできず、独立した国内エコシステムを構築する必要があります。米国がクローズドソースを主要な焦点として構築したエコシステムの下で別のクローズドソースエコシステムを構築することは、ドアの後ろで車を構築するのと同じです。オープンソースのエコシステムのみが、AI業界の発展を迅速に支援できます。

トップレベルのサポートに加えて、さまざまな地方政府もオープンソースエコシステムに実際のお金を投資しています。

大規模モデルのエコシステム投資に焦点を当てたZhipuとBeijing State-owned Assetsが共同で設立したZファンドは、AIオープンソースコミュニティの開発を世界中でサポートするために3億元を投資すると発表しました。オープンソースモデル(Zhipuオープンソースモデルに限定されません)に基づくスタートアッププロジェクトはすべて申請できます。

AI業界におけるオープンソース戦略とクローズドソース戦略における中国と米国の間の乖離は、本質的に開発ロジックの根本的な違いです。米国は資本によって推進され、テクノロジー大手とVCの利益追求の要求が「技術独占-高価格実現」のクローズドソースエコシステムを生み出しました。Metaがオープンソース化を試みても、商業的な障壁の束縛から逃れることは困難です。中国はトップレベルの設計に依存しており、「技術エクイティ+産業連携」をその中核概念として、政策エンパワーメントを通じてオープンエコシステムを構築し、オープンソースを技術的ハードルを下げ、実体経済の統合を促進するための基本的なインフラストラクチャにしています。この戦略的選択は、両国のAI業界の異なる道を形作るだけでなく、「独占競争」から「オープンでWin-Win」へのグローバルAIエコシステムの加速も告げています。

十分であることは十分である

中国のAIオープンソースエコシステムは、中国と世界におけるAI産業化の開発を加速させているだけでなく、米国が信じる技術第一主義を厄介な罠に陥れています。

DeepSeek効果によってもたらされる圧力の増大に直面して、Metaは4月5日にLlama4をリリースし、歴史上最強のマルチモーダル大規模モデルであると主張しました。

しかし、実際のテストの後、これは期待外れのモデルです。10mトークンのコンテキストの長さはしばしば間違って認識し、初期のボールテストは完了が難しく、9.11>9.9の比較サイズエラーが発生します。モデルの発売から数日以内に、役員辞任やテスト不正行為などのスキャンダルも内部従業員によって確認されました。

より多くのニュースは、Llama4はZuckerbergが急いで棚に上げた製品であると言えると証明しています。では、Zuckerbergが4月にそれを立ち上げなければならなかったのはなぜでしょうか?

前述のように、米国のAI業界は技術に対する不可解な信念を持っており、自社の製品は最強で最も高度であると信じているため、軍拡競争を開始しました。しかし、AIトレーニングの限界効果が薄れているため、大手メーカーは膨大なコストを消費しており、技術的なハードルが構築されていないだけでなく、コンピューティング能力のボトルネックの泥沼に陥っています。

OpenAIがGPT-4oの画像生成機能をリリースした後、Altmanは数日後に、彼らのGPUが「燃え尽きている」とツイートしました。Gemini2.5がリリースされてから1週間も経たないうちに、GoogleAIStudioの責任者は、彼らがまだ「レート制限」に悩まされており、開発者は1分あたり20件のリクエストしか送信できないと述べました。どの企業も、超大規模モデルの推論ニーズに対応できないようです。

実際、米国は誤解に陥っています。Zhiyuan Research Instituteの担当者は、次のように述べています。「新しいモデルが10ポイントのベンチマークスコアの向上を実行するために100倍のコストを使用する場合、この新しいモデルは、コストパフォーマンスがないため、80%以上のアプリケーションシナリオでは意味がありません。」

中国の大規模モデル企業は、オープンソースエコシステムを加速しています。彼らはもはやトップの座を争っているのではなく、「十分」なアプローチでより多くの顧客、特に産業顧客を獲得しているようです。

政府および企業顧客向けの数千万の予算と比較して、多くの企業や機関は緊急のAIニーズを持っていますが、既存のソリューションはそれほど多くありません。オープンソースモデルを使用して独自のソリューションを開発することは、ほとんど唯一の選択肢となっています。

  • Baosteelは、生産設備のインテリジェントな早期警告のために、主要な冶金工学プロセスに「大規模モデル+小規模モデル」を使用しています。
  • China Coal Science and Industry Groupの「Coal Science Guardian Large Model ChinamjGPT」は、設備のダウンタイムとメンテナンスコストをそれぞれ30%と20%削減します。
  • 上海孟波インテリジェントIoTテクノロジーは、軽量の大規模モデルに基づいて、エッジカッティング検出および連続焼鈍炉プロセス最適化アプリケーションプラットフォームを作成しました。
  • Mifei Technologyは、大規模モデル技術に基づいて、半導体ウェーハファブにおける自動マテリアルハンドリングシステムのインテリジェントな予測、メンテナンス、および管理を実現しました。

これらはすべて、オープンソースモデルが産業シナリオで実装されている代表的な事例です。

産業用途に加えて、オープンソースエコシステムはより多くの公益事業を支援することもできます。

Shanshui Nature Conservation Centerは、ユキヒョウと高原生態系の保護に取り組んでいます。それが設置する赤外線カメラは、四半期ごとに多数の写真やビデオを撮影します。手動でユキヒョウの痕跡を特定することに依存することは、非常に非効率的で時間がかかります。Huawei Ascendは、ユキヒョウの痕跡を特定するために、Shanshui Nature Conservation Centerと協力しています。Huaweiは、Sanjiangyuanにおける赤外線画像種認識に関連するモデルとツールをオープンソース化し、AI開発への参加の敷居を下げ、モデルを使用するより多くの研究および保護機関が恩恵を受けることを可能にしています。人々は、データセット、データ処理、およびデータクリーニングの観点からモデルを最適化するために協力することができます。

オープンソースの「バザール」効果

オープンソースソフトウェア運動の旗手であるEric Raymondは、1999年の著書「The Cathedral and the Bazaar」で比喩を提案しました。従来のクローズドソースソフトウェア開発モデルは、大聖堂を建てるようなものです。ソフトウェアは、孤立した環境で少数の専門家(建築家)によって慎重に設計および構築され、最終的に完成した後にのみユーザーにリリースされます。オープンソース開発モデルは、活気に満ちた、一見混沌としているが活気に満ちたバザールのようなものです。ソフトウェア開発はオープン、分散型、進化型です。

この本は、多くの種類のソフトウェアプロジェクト、特に複雑なシステムレベルのソフトウェア(オペレーティングシステムカーネルなど)にとって、オープン、共同、分散型の「バザール」開発モデルは、混沌としているように見えるかもしれませんが、実際にはより効率的で、より高品質で、より堅牢なソフトウェアを従来のクローズド、集中型の「大聖堂」モデルよりも効率的に生成できると考えています。エラーをより迅速かつ修正し、大規模なピアレビュー(「十分な眼球」)を利用して「早期リリース、頻繁なリリース」などのメカニズムを通じてユーザーのフィードバックとコミュニティの貢献をより良く吸収することで、ソフトウェアの迅速な反復と革新を促進できます。

Linuxなどのオープンソースプロジェクトの大きな成功は、Raymondのポイントを検証しました。

オープンソース運動は、米国と世界に独自の投資をはるかに超える大きな価値をもたらしました。ハーバード大学の2024年の調査レポートでは、次のように述べています。「オープンソースは41億5000万ドルを投資し、企業に8兆8000億ドルの価値を創出しました(つまり、1ドル投資するごとに2000ドルの価値が生まれます)。オープンソースがなければ、ソフトウェアへの企業の支出は現在の3.5倍になるでしょう。」

今日、中国企業はこれを学びました。アメリカのAI企業はそれを忘れてしまったようです。

実際、中国の大規模モデル企業にとって、社会的利益を考慮しない場合でも、オープンソースエコシステムを受け入れることを選択することは、企業自体にとって無駄ではありません。

多くの大規模モデル企業はObserver.comに、オープンソースは商業化を放棄することを意味するものではないと語っています。オープンソースには依然としてオープンソースの利益ロジックがあります。オープンソースであるかどうかと比較して、技術的に顧客により良いサービスを提供する方法が重要な問題です。

Zhipu AIを例にとると、中国で唯一OpenAIを完全にベンチマークする企業であると主張していますが、OpenAIのクローズドソース戦略と比較して、業界で最もオープンソース戦略を実践している企業の1つです。

Zhipuは、2023年に中国初のChat大規模モデルChatGLM-6Bをオープンソース化しました。設立から6年近くが経過したZhipuは、55を超えるモデルをオープンソース化しており、国際的なオープンソースコミュニティでの累積ダウンロード数は約4000万回に達しています。

ZhipuはObserver.comに、Zhipuのオープンソース戦略が北京を人工知能の「グローバルオープンソース首都」に構築するのに貢献することを願っていると語っています。

具体的には、商業レベルでは、Zhipuはオープンソースを通じて開発者エコシステムを引き付け、BエンドおよびGエンドの顧客に有料のカスタマイズソリューションを提供することを選択しました。

ソリューションの販売に加えて、APIの販売も重要な収益リンクです。

DeepSeekを例にとると、オープンソースモデルの最初のビジネスは、高性能APIの販売です。基本的なサービスは無料ですが、企業は高性能APIサービスを提供し、使用量に基づいて課金できます。DeepSeek-R1のAPI価格は、100万入力トークンあたり1元、100万出力トークンあたり16元です。無料のトークンクォータが使い果たされた場合、または基本的なAPIがニーズを満たせない場合、ユーザーはビジネスプロセスの安定性を維持するために有料版を使用する傾向があります。

モデルサービスのみを提供する企業と比較して、Alibabaは別のオープンソース収益化モデルであるエコシステムバンドルを選択しました。

AlibabaのQwenシリーズは、オープンソースの先駆者として、フルモーダルオープンソースを通じてクラウドコンピューティングやその他のインフラストラクチャを使用するように開発者を引き付け、クローズドループシナリオを形成します。彼らのモデルは初期段階の紹介にすぎず、価格が表示された商品は実際にはクラウドサービスです。

中国のオープンソース大規模モデルのグローバル化アプリケーションは、「技術追従」から「エコシステム支配」へと移行しました。米国が「クローズドソース独占」と「オープンソース制御不能」のジレンマに陥っているとき、中国は「契約革新+シナリオ育成」を通じて、グローバルAIオープンソースエコシステムの根本的なロジックを再構築しています。このゲームの最終的な戦場は、パラメータスケールの競争ではなく、AI技術と実体経済の深い統合という数兆ドル規模の市場にあります。