DeepSeek Day Two: エンタープライズAI導入への転換
DeepSeekは、中国の新興AI企業であり、大幅に割引された基盤モデルで注目を集めています。この動きは、最も重要な障壁の一つであるコストに対処することで、企業向けのAI導入に革命を起こす可能性を秘めています。
AI導入の高コスト
BofAグローバルリサーチのアナリストであるブラッド・シルズとカーリー・リュウによると、AIアプリケーションに関連する費用は、その広範な実装を妨げる主な障害となっています。1月28日火曜日に発表された彼らのレポートでは、コスト削減のブレークスルーは価格をさらに引き下げ、採用率の向上につながる可能性があると示唆しています。
DeepSeekの1月27日月曜日の発表は、AI業界に衝撃を与え、いくつかのAI企業の株価の下落を引き起こしました。同社は、2,048個のNvidia H800チップを使用して、わずか558万ドルで基盤モデルをトレーニングできる能力を明らかにしました。この数字は、OpenAIとAnthropicの推定コストである1億ドルから10億ドルとは対照的であり、数千個のNvidiaのAIチップの使用が含まれています。
eSIMpleのCTOであるロイ・ベネシュは、DeepSeekの成果の変革の可能性を強調し、中小企業、個々の開発者、さらには研究者が、法外なコストをかけずにAIの力を活用できるようにすると述べました。このアクセシビリティの向上は、革新的なアイデアと技術の開発を促進し、分野での競争力を高めることができます。その結果、顧客は新しいオプションから利益を得ることができ、確立されたAI企業は価格を引き下げ、技術的な進歩を加速する可能性があります。
BofAのアナリストは、既存のAIアプリケーションに関連するコストの例を提供しました。Microsoftの365 Copilot Chatは、リクエストの複雑さによって、プロンプトごとに1セントから30セントの間で課金されます。SalesforceのAgentforce for Service Cloudは、コンバージョンごとに2ドルの定額料金を請求します。
BofAは、DeepSeekが提示した558万ドルの数字は、研究、実験、アーキテクチャ、アルゴリズム、データに関連するコストを除外しているため、やや誤解を招く可能性があることを認めましたが、アナリストは、より安価なトレーニング方法の実現可能性を示すスタートアップのイノベーションの重要性を強調しました。
事前トレーニングと推論:コストの理解
OpenAIのGPT-4oやGoogleのGeminiなどの基盤AIモデルは、事前トレーニングと呼ばれるプロセスを受けます。このプロセスでは、インターネット全体などの膨大な量のデータにさらされ、一般的な知識を開発します。ただし、これらのモデルを特定の企業や業界にとってより適切で有用なものにするには、企業は独自のデータを使用してさらにトレーニングまたは微調整する必要があります。
AIモデルが微調整されると、ユーザープロンプトを処理し、関連する応答を生成できます。ただし、モデルにプロンプトを送信して応答を取得するプロセスでは、推論コストが発生します。これは、新しいデータを使用してモデルを理解および分析するための料金です。
ほとんどの企業は基盤モデルのトレーニング費用を負担しないことに注意することが重要です。この責任は、OpenAI、Google、Meta、Amazon、Microsoft、Anthropic、Cohere、Hugging Face、Mistral AI、Stability AI、xAI、IBM、Nvidia、特定の研究機関、およびBaiduやAlibabaなどの中国のハイテク企業を含む、これらのモデルの開発者にあります。
企業は主にAIワークロードを処理するための推論コストを負担します。これは、AI関連の費用の大部分を占めています。
中国とのつながり:DeepSeekの推論コストとプライバシーに関する懸念
DeepSeekは、シリコンバレーの企業と比較して、大幅に低いコストで独自の推論サービスを提供しています。ただし、これらのサービスを使用する際には、留意すべき点がいくつかあります。
DeepSeekのプライバシーポリシーによると、ユーザー情報は中国にあるサーバーに保存されます。同社はまた、法的義務を遵守し、公共の利益のために、またはユーザーや他の人々の重大な利益を保護するためにタスクを実行すると述べています。
中国の国家情報法、特に第7条は、すべての組織と市民が法律に従って国家情報活動を支援、支援、協力し、知っている国家情報活動の秘密を保護することを義務付けています。
AppvanceのCEOであるケビン・スラースは、プライバシーについて懸念を表明し、ユーザーからのデータ収集は中国では一般的な慣行であると述べました。彼はユーザーに注意を払うようにアドバイスしました。
PYMNTSが実施した実験では、DeepSeekのチャットボットに、1989年の天安門広場での抗議活動が中国の政治にどのように影響を与えたかを説明するように求められました。チャットボットは、「申し訳ありませんが、この種の質問にどのようにアプローチすべきかわかりません」と答えました。
PresearchのCEOであるティム・エネキングは、DeepSeekは中国に拠点を置く100%中国所有の企業であると指摘しました。彼は、チャットボットが天安門広場または中国政府の要人に関する情報を提供できないことは、技術の客観性に限界があることを示唆していると述べました。エネキングは技術のエキサイティングな可能性を認めましたが、その制御について懸念を表明しました。
しかし、エネキングはまた、DeepSeekのモデルのオープンソースの性質を強調しました。これにより、政府や企業の制御を削除するために改訂を加えることができます。彼は、同社のエンジニアリングの創造性が、中小企業や国々が生成AIの状況に参加して成功する機会を生み出すと考えています。
すべての推論コストを下げるDeepSeekの可能性
DeepSeekの低コストで基盤モデルをトレーニングする革新的なアプローチは、Microsoftのような企業にプラスの影響を与えます。これにより、AIコンピューティングのコストを引き下げ、規模を拡大し続けることができます。シルズとリュウによると、コンピューティングコストの低下は、AI対応の製品の利益率の向上につながる可能性があります。
別の調査ノートで、BofAのアナリストであるアルケシュ・シャー、アンドリュー・モス、ブラッド・シルズは、AIコンピューティングコストの低下により、自動車からスマートフォンまで、さまざまな分野でより広範なAIサービスが可能になると示唆しました。
OpenAIのような基盤モデル開発者がDeepSeekと同じくらい低いトレーニングコストをすぐに達成する可能性は低いですが、アナリストは、DeepSeekの革新的なトレーニングおよびポストトレーニング技術が、効率を高めるために競合するフロンティアモデル開発者に採用されると信じています。ただし、彼らは、現在のモデルはAIエージェントの基盤となるため、依然として多額の投資が必要であると強調しています。
長期的には、アナリストは、チャットボット、コパイロット、エージェントがよりスマートで安価になるにつれて、企業によるAIの採用が加速すると予想しています。これは、ジェヴォンズのパラドックスとして知られる現象です。
MicrosoftのCEOであるサティア・ナデラは、Xでこの感情を繰り返し、AIがより効率的でアクセスしやすくなるにつれて、ジェヴォンズのパラドックスが作用していると述べました。彼は、これによりAIの使用が急増し、私たちが十分に得られない商品になると信じています。
基盤モデルとその影響に関する詳細な調査
最新のAIのバックボーンである基盤モデルは、企業がどのように運営され、テクノロジーと対話するかという方法に革命を起こしています。これらのモデルは、膨大なデータセットでトレーニングされており、自然言語処理から画像認識まで、幅広いタスクを実行できます。ただし、これらのモデルの開発と展開には、トレーニングコスト、推論コスト、データプライバシー、倫理的考慮事項など、さまざまな要因が複雑に絡み合っています。
基盤モデルの理解
基盤モデルの中核は、大規模なニューラルネットワークであり、膨大なデータセットでトレーニングされています。このトレーニングプロセスにより、データ内のパターンと関係を学習し、さまざまなタスクを驚くほど正確に実行できます。基盤モデルの例を次に示します。
- GPT-4o: OpenAIが開発した強力な言語モデルで、人間品質のテキストを生成したり、言語を翻訳したり、質問に包括的に回答したりできます。
- GoogleのGemini: テキスト、画像、オーディオなど、さまざまな種類のデータを処理および理解できるマルチモーダルAIモデル。
これらのモデルは特定のタスクに限定されず、幅広いアプリケーションに適応できるため、企業にとって汎用性の高いツールになります。
事前トレーニングと微調整の役割
基盤モデルの開発には、通常、事前トレーニングと微調整という2つの主要な段階が含まれます。
- 事前トレーニング: この段階では、モデルはインターネット全体などの膨大なデータセットでトレーニングされ、一般的な知識と言語スキルを学習します。このプロセスにより、モデルはテキストを理解および生成したり、言語を翻訳したり、その他の基本的なタスクを実行したりする能力を備えます。
- 微調整: この段階では、事前トレーニングされたモデルは、特定のタスクまたは業界に関連する、より小さく、より具体的なデータセットでさらにトレーニングされます。このプロセスにより、モデルは知識とスキルをアプリケーションの特定のニーズに適応させることができます。
たとえば、事前トレーニングされた言語モデルをカスタマーサービスインタラクションのデータセットで微調整して、顧客の問い合わせに効果的に対応できるチャットボットを作成できます。
トレーニングと推論のコスト
基盤モデルに関連するコストは、トレーニングコストと推論コストという2つの主要なカテゴリに分類できます。
- トレーニングコスト: これらのコストには、基盤モデルをトレーニングするために必要な計算リソース、データ、および専門知識が含まれます。大規模な基盤モデルをトレーニングするには非常に費用がかかる可能性があり、多くの場合、数百万ドルの投資が必要です。
- 推論コスト: これらのコストには、トレーニングされたモデルを使用して予測を行ったり、出力を生成したりするために必要な計算リソースが含まれます。推論コストは、モデルのサイズと複雑さ、処理されるデータ量、および使用されるインフラストラクチャによって異なります。
DeepSeekのイノベーションは、基盤モデルに関連するトレーニングコストを大幅に削減し、より幅広い企業や組織がアクセスできるようにする能力にあります。
プライバシーと倫理的懸念への対処
基盤モデルの使用は、データプライバシーと倫理的考慮事項に関する重要な問題を引き起こします。基盤モデルは、機密情報または個人情報が含まれている可能性のある膨大なデータセットでトレーニングされています。これらのモデルが責任ある倫理的な方法で使用され、ユーザーのプライバシーを尊重し、バイアスを回避するようにすることが重要です。
これらの懸念に対処するための戦略を次に示します。
- データの匿名化: ユーザーのプライバシーを保護するために、トレーニングデータから個人情報を削除またはマスクします。
- バイアスの検出と軽減: トレーニングデータのバイアスを特定して対処し、モデルが有害なステレオタイプや差別的な慣行を永続させないようにします。
- 透明性と説明責任: モデルの仕組みと使用方法に関する明確な情報を提供し、エラーまたは意図しない結果が発生した場合の説明責任のメカニズムを確立します。
基盤モデルがより普及するにつれて、これらのプライバシーと倫理的懸念に積極的に対処し、社会の利益のために使用されるようにすることが不可欠です。
基盤モデルの将来
基盤モデルは急速に進化しており、社会への潜在的な影響は絶大です。将来、次のようなことが予想されます。
- より強力で汎用性の高いモデル: 研究者が新しいアーキテクチャとトレーニング技術の開発を続けるにつれて、基盤モデルはさらに強力で汎用性が高まり、幅広いタスクをより正確に実行できるようになります。
- アクセシビリティの向上: トレーニングコストが低下し、クラウドベースのAIプラットフォームが普及するにつれて、基盤モデルはあらゆる規模の企業にとってアクセスしやすくなります。
- 新しいアプリケーションとユースケース: 基盤モデルは、医療から金融、教育まで、さまざまな業界で新しい革新的なユースケースに適用され続けます。
基盤モデルの台頭は、人工知能の分野におけるパラダイムシフトを表しています。それらの機能、コスト、および倫理的考慮事項を理解することにより、私たちはそれらの力を利用して、より良い未来を創造することができます。
AIの民主化に対するDeepSeekの貢献
DeepSeekの基盤モデルのトレーニングコストを大幅に削減するという成果は、AIの民主化における重要な瞬間を示しています。DeepSeekは、参入障壁を下げることで、より広範な組織や個人がAI革命に参加できるようにしています。
中小企業への影響
中小企業は、独自のAIモデルを開発および展開するためのリソースと専門知識が不足していることがよくあります。DeepSeekの費用対効果の高い基盤モデルは、以前は手の届かなかった最先端のAIテクノロジーへのアクセスをこれらの企業に提供します。これにより、競争条件を公平にし、中小企業が大企業やより確立された企業とより効果的に競争できるようになります。
たとえば、中小規模のeコマース企業は、DeepSeekのモデルを使用して、顧客向けの製品の推奨事項をパーソナライズしたり、カスタマーサービスを改善したり、マーケティングキャンペーンを自動化したりできます。
個々の開発者のエンパワーメント
DeepSeekのモデルはまた、個々の開発者や研究者が新しいAIアプリケーションとイノベーションを探索できるようにします。手頃な価格の基盤モデルへのアクセスにより、開発者はさまざまなアイデアを試し、新しいAI搭載ツールを開発し、AIテクノロジーの進歩に貢献できます。
これにより、より多くの人々がAIの開発に参加する機会を得るため、イノベーションが急増する可能性があります。
オープンソースコラボレーションの可能性
DeepSeekのオープンソースアプローチは、AIコミュニティにおけるコラボレーションとイノベーションをさらに促進します。DeepSeekは、モデルを一般に公開することで、開発者がモデルの改善に貢献し、バグを特定して修正し、新しい機能を開発することを奨励しています。
この共同アプローチにより、AIテクノロジーの開発を加速し、すべての人々の利益のために使用されるようにすることができます。
AI導入の加速
DeepSeekは、AIのコストを下げることで、さまざまな業界でのAIの導入を加速しています。AIがより手頃な価格でアクセスしやすくなるにつれて、より多くの企業がAIを運用に統合できるようになり、生産性、効率、イノベーションが向上します。
これは、世界経済に大きな影響を与え、成長を促進し、新しい機会を創出する可能性があります。
より包括的なAIエコシステム
AIを民主化するというDeepSeekの取り組みは、より包括的なAIエコシステムに貢献しており、より多くの人々がAIの開発と使用に参加する機会を得ています。これは、AIが社会の特定の人々だけでなく、すべてのメンバーに利益をもたらすように使用されるようにするのに役立ちます。
DeepSeekは、中小企業、個々の開発者、研究者をエンパワーメントすることで、より多様で革新的なAI環境を育成しています。