2025年の幕開けは、人工知能の領域において地殻変動のような出来事を目撃することになった。それは、中国のDeepSeekチームによるDeepSeek-R1の発表である。このオープンソース、6710億パラメータの言語モデルは、数学、プログラミング、論理的推論といった重要な分野でOpenAIの主要モデルに匹敵する、手ごわい競争相手としての地位を確立した。DeepSeek-R1が複雑な問題に取り組む能力は、特に強化学習の利用によって注目に値した。モデルのMITライセンスは、商業的な障壁を取り除くことで、状況をさらに混乱させた。DeepSeek-R1のデビューの反響は、テクノロジー業界全体、さらには金融市場にも広がり、そのリリースから1週間以内にAI株に大きな低迷を引き起こしたと伝えられている。
DeepSeek-R1は、中国のハイエンド言語モデルの領域におけるオープンソースAI運動にとって、大きな飛躍を意味した。この予期せぬ挑戦は、米国と中国からの世界のAIリーダーに、技術と市場ポジショニングの両方で彼らの戦略を明らかにし、彼らのイニシアチブを加速させた。これはDeepSeek-R1モデルを巡るAIレースを開始した。
AI分野の主要なプレーヤーであるMeta、Google、OpenAI、Anthropic、Alibaba、Baiduが、この新たな競争にどのように対応してきたかを見てみよう。
Meta: LLaMA 4によるスケールと効率の活用
オープンソースモデルコミュニティの最前線に立つMetaは、DeepSeek R1に対応してLLaMA 4を導入した。2025年4月、Metaはこれまでで最も強力なモデルであるLLaMA 4を発表し、Cloudflareなどのプラットフォームを介してAPIアクセスを提供した。LLaMA 4は、モデルをサブモデルに分割し、各推論中にその一部のみをアクティブにするMixture-of-Experts(MoE)アーキテクチャを使用する。この設計は、大規模なパラメータと推論効率のバランスを取る。
LLaMA 4シリーズは、1090億の総パラメータと170億のアクティブパラメータを持つ"Scout"を含む、いくつかのサブモデルを備えており、単一のH100カードで実行できる。"Maverick"モデルは4000億の総パラメータ(128人の専門家)を持っているが、アクティブなパラメータは依然として170億しかなく、DGXクラスターが必要である。この設計により、LLaMA 4は最大1000万トークンのコンテキストウィンドウをサポートでき、この機能を提供する最初のオープンソースモデルの1つとなっている。これは、長いドキュメントを要約したり、大規模なコードリポジトリを分析したりするのに特に役立つ。
LLaMA 4は、そのMoEアーキテクチャのおかげで、迅速な応答時間を維持し、画像、音声、およびビデオのマルチモーダル入力をサポートしている。Metaは、DeepSeekが推論機能に焦点を当てている一方で、オープンソースセクターでの地位を強化するために、効率の戦略を選択し、マルチモーダル機能を強化し、運用を合理化している。
Google: 自律型インテリジェントエージェントに向けたGeminiの進化
OpenAIとDeepSeekからの複合的な圧力に直面して、Googleは技術革新の戦略を選択した。2025年2月、GoogleはFlash、Pro、Liteバージョンを備えたGemini 2.0シリーズを発表し、「インテリジェントエージェント」機能への移行を示した。
Gemini 2.0のエージェント機能は、大きな進歩を表している。モデルは複数のモダリティを理解し、検索エンジン、コードサンドボックス、およびWebブラウジングを積極的に使用できる。GoogleのProject Marinerを使用すると、AI駆動のChromeブラウザ操作が可能になり、AIがフォームに記入してボタンをクリックできるようになる。
Googleは、エージェントエコシステムをサポートするために、異なるインテリジェントエージェントが通信して協力できるAgent2Agentプロトコルも導入した。さらに、サードパーティの開発者が参加できるようにするためのツールと開発キットであるAgent Gardenを作成した。
Googleは、DeepSeekとOpenAIとのパラメータ競争に焦点を当てるのではなく、AIがツールベースおよび自律的な機能に向けて進化するにつれて、インテリジェントエージェントのコラボレーションに集中することで、次の時代のコアシナリオを再定義している。Geminiの進化は、単なるモデルのアップグレードではなく、戦略的なシフトを表している。
OpenAI: 信頼性とリーダーシップのためのモデルの反復とエコシステムの統合
OpenAIは、DeepSeek R1に対応して、モデルの反復と製品の展開を加速させている。2025年2月、OpenAIはGPT-4の中間バージョンであるGPT-4.5をリリースし、論理的な一貫性と事実の正確さを向上させながら、GPT-5への道を開いた。
GPT-4.5は、思考の連鎖推論を含まない最後の主要なモデルと見なされている。GPT-5は、実験的な推論モデルo3-miniとGPTシリーズの機能を組み合わせて、統一された「一般的な認知モデル」を作成する。OpenAIはまた、GPT-5が高度に調整可能なインテリジェンスレベルとツールの使用能力を持つと述べている。
OpenAIは、ユーザーがオープンソースの代替手段に切り替えるリスクを軽減するために、ChatGPTの無料ユーザーがGPT-5の基本バージョンを使用できるようにし、有料ユーザーはより高度な機能にアクセスできるようにすることにした。この戦略は、幅広いカバレッジでユーザーを引き付け続けることを目指している。
OpenAIはまた、プラグイン、ブラウザ、コードエグゼキューターなどの機能を個別に保持するのではなく、GPTコアモデルに統合して、「フル機能のAI」を作成している。OpenAIは、体系的に統合し、インテリジェンス密度を高めることで、R1の課題に対応している。
Anthropic: 混合推論と思考予算によるロバストなインテリジェンスの深化
Anthropicは2025年2月にClaude 3.7 Sonnetを導入し、これは「混合推論」と「思考予算」に焦点を当てている。ユーザーは、迅速な応答のために「標準モード」を選択するか、より深く、段階的な思考のために「拡張モード」を有効にすることができる。
この方法は、人々が困難なタスクに直面したときに「もっと考える」のと同様に、AIが精度を向上させるために推論に時間がかかるようにすることができる。Anthropicでは、推論の深さと通話コストのバランスを取るために、「思考時間」を設定することもできる。
Claude 3.7は、プログラミングや推論などの困難なタスクで前任者の3.5を上回り、推論プロセスの透明性に焦点を当てている業界でも数少ないモデルの1つである。そのコード機能はまた、最新の評価で70.3%の精度を達成した。
Claude 3.7は、パラメータのスタックを追求するのではなく、説明可能で、安定しており、カスタマイズ可能な思考パターンを備えたモデルを作成することに焦点を当てることで、Anthropicの「制御可能なインテリジェンス」へのコミットメントを示している。Anthropicは、R1駆動の「推論競争」で独自のペースで着実に進歩している。
Alibaba: Qwenによる中国のオープンソースエコシステムの構築
AlibabaのDamo Academyは、DeepSeek R1がリリースされたわずか1週間後にQwenモデルファミリーを迅速に更新し、2025年2月にQwen 2.5シリーズ、4月下旬に新しいQwen 3シリーズをリリースし、強力な製品対応力と戦略的ビジョンを示した。
Qwen 3シリーズには、6億から2350億のパラメータ範囲のモデルバージョンが含まれている。MoEアーキテクチャを使用して、より少ないコンピューティングリソースを使用しながらモデルのパフォーマンスを維持する。フラッグシップモデルであるQwen3-235B-A22Bは、アクティベーションパラメータを最適化することで、デプロイに4つの高性能GPUしか必要とせず、企業が大規模モデルを実装するための参入障壁を大幅に下げている。いくつかの標準テストでは、Qwen 3の全体的なパフォーマンスは、DeepSeek R1、OpenAI o1、Gemini 2.5 Proなどのトップ国際モデルを上回っている。
Alibabaは、技術的な競争力に加えて、オープンソースエコシステムの構築を重視している。Qwen 3は、Apache 2.0ライセンスの下で完全にオープンソース化されており、オープンウェイト、トレーニングコード、およびデプロイメントツールを備えており、多言語(119言語)およびマルチモーダルアプリケーションをサポートしており、グローバルな開発者が直接使用およびカスタマイズできる基盤モデルを作成することを目標としている。
Alibabaの「テクノロジー+エコシステム」戦略は、DeepSeekの軽量なブレークスルーのスタイルを補完する。1つは迅速な反復と主要な推論を強調し、もう1つはエコシステムの構築とスケールと多様性のバランスを強調する。Qwenは、DeepSeekによって引き起こされた業界の混乱に対する着実な対応として、国内市場におけるオープンソース大規模モデルの「エコシステムハブ」としての地位を徐々に確立している。
Baidu: ERNIE Botのアップグレードによるマルチモーダリティとプラグインツールの強化
Baiduは3月に主力モデルであるERNIE Botを大幅にアップグレードし、ERNIE Bot 4.5とERNIE X1を公開テスト用にリリースした。ERNIE X1は「深い思考モデル」として位置付けられており、複雑なタスクを理解、計画、実行するAIの能力の向上に焦点を当てている。
ERNIE 4.5は、テキスト、画像、オーディオ、およびビデオの共同モデリングをサポートするBaidu初のネイティブマルチモーダル大規模モデルである。このバージョンでは、幻覚の生成も大幅に削減され、コードの理解と論理的な推論が向上し、複数の中国のシナリオタスクでGPT-4.5レベルを上回っている。
Baiduは、より有用な「AIツールエコシステム」を構築している。X1モデルは、検索、ドキュメントQ&A、PDFの読み取り、コードの実行、画像認識、Webアクセス、およびビジネス情報のクエリ機能を使用して、AIの「実践能力」を真に実現し、Google Geminiのエージェントルートを反映している。
Baiduはまた、2025年6月末までにERNIEモデルの一部のパラメータをオープンソース化し、エンタープライズレベルの顧客とのアプリケーション統合をさらに拡大することを発表した。ERNIEシリーズは、クローズドループ製品からプラットフォームエコシステムに移行し、APIとプラグインシステムを通じて開発者と企業を引き付けている。
Baiduは、オープンソーススペースでR1およびQwenと直接競合するのではなく、中国のコンテンツ、検索サービス、およびナレッジグラフにおける深い蓄積を活用して、モデルを検索、オフィス、情報フローなどの製品シナリオと深く統合し、よりローカライズされたAI製品ポートフォリオを作成している。
要するに、DeepSeek R1のリリースは、単なる技術的なブレークスルー以上のものだった。それは世界のAI分野における触媒だった。それは、巨人に推論パフォーマンスの向上を強制し、国内企業にオープンソースの競争を刺激し、アメリカの企業にエージェント、統合、およびマルチモーダリティの開発を加速させた。
中国とアメリカのAI巨人の対応は異なるが、彼らの目標は同じである。より強力で、より信頼性が高く、より柔軟な大規模モデルを作成し、テクノロジー、エコシステム、およびユーザーの三重の競争に勝つことである。このプロセスはまだ終わっていない。GPT-5、Gemini 3、Claude 4、さらにはDeepSeek R2とQwen 4が次々とリリースされるにつれて、グローバルAIは「スパイラル上昇」の新しい段階に入りつつある。
エンタープライズユーザーと開発者にとって、この競争はより多くの選択肢、より低いコスト、およびより強力な大規模モデルツールをもたらすだろう。グローバルなAI機能は、前例のない速度で普及および民主化されており、次の決定的な技術的ブレークスルーはすでに進行中かもしれない。