アント、中国製チップでAI開発を先導

AntのAIモデルトレーニングへの革新的なアプローチ

Jack Ma氏が出資するフィンテック大手Ant Groupは、中国製の半導体を利用することで人工知能(AI)分野で大きな進歩を遂げました。この革新的なアプローチにより、同社はAIモデルのトレーニング技術を開発し、コストを20%削減することに成功しました。事情に詳しい関係者によると、Antは、関連会社であるAlibaba Group Holding Ltd.やHuawei Technologies Co.のチップを含む国産チップを利用し、Mixture of Experts (MoE)機械学習アプローチを用いてモデルをトレーニングしました。

Antが達成した結果は、Nvidia Corp.のH800など、米国によって中国への輸出が制限されている高性能プロセッサを使用した結果に匹敵するものでした。AntはAI開発にNvidiaを引き続き使用していますが、最新モデルではAdvanced Micro Devices Inc. (AMD)や中国製チップを含む代替品への依存度を高めています。

AI競争への参入:中国 vs. 米国

AntのAIモデル開発への参入は、中国企業と米国企業の間の激しい競争の真っただ中に位置しています。この競争は、DeepSeekが、数十億ドルを投資してきたOpenAIやAlphabet Inc.のGoogleなどの業界大手と比較して、わずかなコストで非常に高性能なモデルをトレーニングできる可能性を示して以来、激化しています。Antの成果は、中国企業が最も先進的なNvidiaの半導体の代替品として、国内で調達された代替品を活用しようとする決意を明確に示しています。

コスト効率の高いAI推論の可能性

Antが今月発表した研究論文は、同社のモデルの可能性を強調しており、Meta Platforms Inc.と比較して特定のベンチマークで優れたパフォーマンスを発揮すると主張していますが、これらの主張はBloomberg Newsによって独自に検証されていません。それにもかかわらず、Antのプラットフォームが宣伝どおりに機能する場合、中国の人工知能開発における大きな進歩となる可能性があります。これは主に、AIサービスをサポートするプロセスである推論のコストを大幅に削減できるためです。

Mixture of Experts:AIにおけるゲームチェンジャー

企業がAIに多額のリソースを投入する中、MoEモデルは、人気があり効率的なアプローチとして注目を集めています。Googleや杭州を拠点とするスタートアップDeepSeekなどの企業が採用しているこの技術は、タスクをより小さなデータのセットに分割します。これは、専門家のチームがそれぞれ仕事の特定のセグメントに焦点を当て、それによってプロセス全体を最適化することに似ています。

GPUボトルネックの克服

従来、MoEモデルのトレーニングは、Nvidiaが製造するグラフィックスプロセッシングユニット(GPU)などの高性能チップに大きく依存してきました。これらのチップの法外なコストは、多くの小規模企業にとって大きな障害となっており、MoEモデルの普及を制限していました。しかし、Antは、大規模言語モデル(LLM)をより効率的にトレーニングする方法に熱心に取り組んでおり、この制約を事実上排除しています。’プレミアムGPUなしで’モデルをスケーリングすることを目標に設定した彼らの研究論文のタイトルは、この目的を明確に反映しています。

Nvidiaの優位性への挑戦

Antのアプローチは、NvidiaのCEOであるJensen Huang氏が提唱する一般的な戦略に真っ向から挑戦するものです。Huang氏は、DeepSeekのR1のようなより効率的なモデルが登場しても、計算需要は増え続けると一貫して主張してきました。彼は、企業はコストを削減するために安価なチップではなく、より高い収益を生み出すためにより優れたチップを必要とすると考えています。その結果、Nvidiaは、強化された処理コア、トランジスタ、および増加したメモリ容量を備えた大型GPUの構築に焦点を当て続けています。

コスト削減の定量化

Antは、最適化されたアプローチの費用対効果を示す具体的な数値を提供しています。同社は、高性能ハードウェアを使用して1兆トークンをトレーニングするには、約635万元(88万ドル)の費用がかかると述べています。しかし、低スペックのハードウェアと最適化された技術を利用することで、Antはこのコストを510万元に削減できます。トークンは、モデルが世界について学び、ユーザーのクエリに関連する応答を提供するために処理する情報の単位を表します。

産業ソリューションのためのAIブレークスルーの活用

Antは、Ling-PlusおよびLing-Liteという大規模言語モデルにおける最近の進歩を活用して、ヘルスケアや金融などの分野向けの産業用AIソリューションを開発する予定です。これらのモデルは、特定の業界のニーズに対応し、カスタマイズされたソリューションを提供するように設計されています。

ヘルスケアにおけるAIアプリケーションの拡大

Antのヘルスケアへの取り組みは、中国のオンラインプラットフォームHaodf.comを人工知能サービスに統合したことからも明らかです。AI Doctor Assistantの作成を通じて、Antは、医療記録管理などのタスクを支援することにより、Haodfの29万人の医師の広範なネットワークをサポートすることを目指しています。このAIの応用は、ヘルスケア提供の効率と精度を大幅に向上させる可能性があります。

日常生活のためのAIを活用したアシスタンス

ヘルスケア以外にも、AntはZhixiaobaoと呼ばれるAI’ライフアシスタント’アプリとMaxiaocaiという金融アドバイザリーAIサービスを開発しました。これらのアプリケーションは、AIを日常生活のさまざまな側面に統合し、ユーザーにパーソナライズされたインテリジェントなアシスタンスを提供するというAntの野心を示しています。

パフォーマンスのベンチマーク:Lingモデル vs. 競合他社

Antは研究論文の中で、Ling-Liteモデルが英語理解の主要なベンチマークでMetaのLlamaモデルの1つを上回ったと主張しています。さらに、Ling-LiteモデルとLing-Plusモデルの両方が、中国語のベンチマークでDeepSeekの同等モデルと比較して優れたパフォーマンスを示しました。これは、AI分野におけるAntの競争力を示しています。

北京を拠点とするAIソリューションプロバイダーShengshang Tech Co.の最高技術責任者であるRobin Yu氏が適切に述べているように、’世界最高のカンフーマスターを打ち負かすための1つの攻撃ポイントを見つければ、それでも彼らを打ち負かしたと言うことができます。それが、実際のアプリケーションが重要である理由です。’

コラボレーションとイノベーションのためのオープンソース化

AntはLingモデルをオープンソース化し、AIコミュニティ内でのコラボレーションとイノベーションを促進しています。Ling-Liteは168億個のパラメータで構成されており、これらはモデルのパフォーマンスを制御する調整可能な設定です。一方、Ling-Plusは、はるかに大きい2900億個のパラメータを誇り、大規模言語モデルの1つに位置付けられています。参考までに、専門家はChatGPTのGPT-4.5は約1兆8000億個のパラメータを持ち、DeepSeek-R1は6710億個のパラメータを持つと推定しています。

モデルトレーニングにおける課題への対処

これらのモデルを開発するAntの道のりは、課題がなかったわけではありません。同社は、トレーニングの特定の分野、特に安定性に関して困難に遭遇しました。ハードウェアやモデルの構造にわずかな変更を加えただけでも、モデルのエラー率の変動などの問題が発生する可能性がありました。これは、高度なAIモデルのトレーニングに関わる複雑さと感度を示しています。

ヘルスケアにおける実際の展開

Antの実用的なアプリケーションへの取り組みは、ヘルスケアに焦点を当てた大規模モデルマシンの展開によってさらに実証されています。これらのマシンは現在、北京や上海などの主要都市の7つの病院と医療提供者によって利用されています。大規模モデルは、DeepSeek R1、AlibabaのQwen、およびAnt独自のLLMを活用して、医療コンサルティングサービスを提供します。

ヘルスケアサービスを強化するためのAIエージェント

大規模モデルマシンに加えて、AntはAngelとYibaoerという2つの医療AIエージェントを導入しました。Angelはすでに1,000を超える医療施設にサービスを提供しており、Yibaoerは医療保険サービスのサポートを提供しています。さらに、昨年の9月、AntはAlipay決済アプリ内でAI Healthcare Managerサービスを開始し、ヘルスケア分野でのリーチをさらに拡大しました。これらの取り組みは、AIを活用してヘルスケアの提供を変革し、改善するというAntの献身を示しています。