DeepSeekという名前は、比較的無名な存在から、グローバルなAIに関する議論の中心へと急速に浮上し、テクノロジーおよび金融セクター内で激しい議論と憶測を引き起こしています。この急成長する勢力の背後にある中国のAIラボは、既成秩序を破壊し、アナリストにAI競争における米国の支配の持続可能性と、現在のAIチップ需要の長期的な実現可能性について疑問を投げかけています。しかし、DeepSeekを現在の地位に押し上げた主な要因は何でしょうか。
DeepSeekの起源:ヘッジファンドからAIラボへ
DeepSeekの起源は、数量金融の世界と深く絡み合っています。データに基づいた取引の意思決定を行うためにAIを活用することで知られる中国のヘッジファンド、High-Flyer Capital Managementが支援しています。
浙江大学在学中に取引を経験したAI愛好家の梁文峰は、2015年にHigh-Flyerを共同設立しました。2019年には、金融アプリケーション向けのAIアルゴリズムの開発と実装に特化したヘッジファンドとして、High-Flyer Capital Managementを立ち上げました。
2023年、High-Flyerは、中核となる金融ビジネスから独立して運営される、専任のAI研究ラボとしてDeepSeekをインキュベートしました。その後、High-Flyerを主要投資家として、ラボはDeepSeekという名前を保持したまま、別のエンティティとしてスピンオフされました。
DeepSeekは設立当初から、モデルトレーニングを容易にするために独自のデータセンタークラスターの確立を優先しました。ただし、中国で事業を展開する他のAI企業と同様に、DeepSeekは高度なハードウェアに対する米国の輸出制限により課題に直面しています。その結果、より新しいモデルをトレーニングするために、同社は米国企業が容易に入手できるH100チップの性能を抑えたバリアントであるNvidia H800チップを使用せざるを得ませんでした。
DeepSeekの技術チームは、その若さと活力で知られています。同社は、中国の主要大学から博士号を持つAI研究者を積極的に採用しています。さらに、DeepSeekは、その技術が幅広い主題を効果的に理解し、対応できるようにするために、コンピューターサイエンスの専門知識を持たない人を含む、多様なバックグラウンドを持つ人々を雇用しています。これはニューヨーク・タイムズが報じています。
DeepSeekのAIモデル:現状への挑戦
DeepSeekは、最初のモデルスイートであるDeepSeek Coder、DeepSeek LLM、およびDeepSeek Chatを2023年11月に発表しました。しかし、AI業界の注目を集めたのは、春にリリースされた次世代のDeepSeek-V2ファミリーモデルでした。
テキストと画像の両方を分析できる汎用性の高いシステムであるDeepSeek-V2は、さまざまなAIベンチマークで目覚ましいパフォーマンスを発揮しました。特に、当時入手可能だった競合モデルと比較して、大幅に低いコストでこのパフォーマンスを達成しました。これにより、ByteDanceやAlibabaなどのDeepSeekの国内ライバルは、一部のモデルの価格を引き下げ、他のモデルを完全に無料で提供することを余儀なくされました。
DeepSeek V3は、MetaのLlamaのようなダウンロード可能なオープンソースモデルと、OpenAIのGPT-4oのようなAPIを介してのみアクセス可能な「クローズド」モデルの両方と比較して、優れたパフォーマンスを発揮しています。
同様に注目に値するのは、DeepSeekのR1「推論」モデルです。1月に発売されたDeepSeekは、R1が主要なベンチマークでOpenAIのo1モデルに匹敵するパフォーマンスを達成すると主張しています。
推論モデルとして、R1は自己チェックメカニズムを組み込んでおり、標準モデルに関連する一般的な落とし穴の一部を軽減します。推論モデルは、解決策に到達するまでにわずかに長い処理時間(数秒から数分)が必要になる場合がありますが、物理学、科学、数学などの分野でより高い信頼性を示す傾向があります。
ただし、R1やDeepSeek V3を含むDeepSeekのモデルは、その応答が「中核となる社会主義的価値観」と一致していることを保証する中国のインターネット規制当局の監督の対象となります。たとえば、DeepSeekのチャットボットアプリでは、R1は天安門広場や台湾の自治に関する質問には答えません。
3月には、DeepSeekのWebサイトへのアクセス数が1650万回を超えました。SimilarwebのエディターであるDavid Carrによると、2月のトラフィックと比較して25%減少したにもかかわらず、DeepSeekは1日のアクセス数で2位にランクインしました。ただし、この数字はChatGPTと比較するとまだ見劣りし、ChatGPTは3月に5億人を超える週間アクティブユーザーを超えました。
AIランドスケープへの破壊的なアプローチ
DeepSeekのビジネスモデルは、やや謎に包まれたままです。同社は、製品とサービスの価格を市場価値を大幅に下回る価格で設定し、一部は無料で提供しています。さらに、ベンチャーキャピタル企業からの多大な関心にもかかわらず、外部からの資金調達を拒否しています。
DeepSeekは、その極端なコスト競争力を効率の向上によるブレークスルーに起因させています。ただし、一部の専門家は、同社が提供する数値の正確性に疑問を呈しています。
いずれにせよ、開発者はDeepSeekのモデルを採用しており、従来の意味でのオープンソースではありませんが、商用利用を許可する許可的なライセンスの下で利用できます。Hugging FaceのCEOであるClem Delangueによると、プラットフォーム上の開発者は500を超えるR1の派生モデルを作成し、合計250万回のダウンロードを蓄積しています。
DeepSeekの、より大きく、より確立された競合他社に対する成功は、「AIを覆す」とも「過大評価されている」とも言われています。同社の業績は、1月にNvidiaの株価が18%下落した原因の一部であり、OpenAI CEOのSam Altmanから公式な回答を引き出しました。ロイターによると、3月には、米国商務省の局がDeepSeekを政府デバイスで使用することを禁止したと報じられています。
Microsoftは、企業向けのAIサービスを統合するプラットフォームであるAzure AI FoundryサービスにDeepSeekを統合しました。Metaの第1四半期の収益報告では、CEOのMark Zuckerbergは、AIインフラストラクチャへの投資は、DeepSeekがMetaのAI支出に与える潜在的な影響について質問された際、同社にとって「戦略的優位性」であり続けると述べました。3月、OpenAIはDeepSeekを「国家補助」および「国家管理」とラベル付けし、米国政府がそのモデルを禁止することを検討することを推奨しました。
Nvidiaの第4四半期の収益報告では、CEOのJensen HuangはDeepSeekの「優れたイノベーション」を強調し、その推論モデルがNvidiaに利益をもたらす、大幅に多くのコンピューティング能力を必要とすることに言及しました。
逆に、韓国やニューヨーク州を含む一部の企業、国、政府は、DeepSeekを政府デバイスで使用することを禁止しています。
5月、Microsoftの副会長兼社長であるBrad Smithは、上院で証言し、Microsoftの従業員はデータセキュリティと潜在的なプロパガンダに関する懸念から、DeepSeekの使用を禁止されていると述べました。
DeepSeekの不確実な未来
DeepSeekの将来の軌跡は不確実なままです。さらなるモデルの改善が予想される一方で、米国政府は、有害な外国の影響の認識にますます警戒しているようです。3月、ウォールストリートジャーナルは、米国がDeepSeekを政府デバイスで使用することを禁止する可能性が高いと報じました。
DeepSeekの急速な台頭は、競争力学と破壊的イノベーションの可能性の再評価を促し、AI業界の基盤を紛れもなく揺るがしました。増加する精査と規制上の課題に直面して、現在の勢いを維持できるかどうかはまだ分かりません。今後数年間は、グローバルなAIランドスケープに対するDeepSeekの長期的な影響を決定する上で極めて重要になります。技術的進歩、地政学的考慮事項、および倫理的懸念の複雑な相互作用を乗り越える能力が、最終的にその遺産を定義します。AIの世界は注意深く見守っています。
DeepSeekの物語は、急速に進化する人工知能の世界では、新しいプレーヤーが急速に台頭し、既成秩序に挑戦できることを思い出させます。革新的な技術と伝統的なビジネスモデルを破壊する意欲に牽引された同社の成功は、業界に注目を強いています。DeepSeekが開発とリーチを拡大し続けるにつれて、AIの未来を形作る上で重要な役割を果たすことは間違いありません。