RISC-V:AIネイティブコンピューティングアーキテクチャとしての台頭
DeepSeekの最近の爆発的な人気は、AI業界全体に波紋を広げており、その影響は人工知能の領域にとどまりません。 特に半導体業界は注目しています。 中国の旧正月中に、AlibabaのDAMO Academy Xuantieは、DeepSeek-R1シリーズ蒸留モデルの適応を発表し、新興のオープンソース命令セットアーキテクチャであるRISC-VのAIドメインにおける強力な勢いを示しました。
最近のXuantie RISC-V Ecosystem Conferenceで、エキサイティングなニュースが発表されました。RISC-Vは、高性能コンピューティングとAIの両方でブレークスルーを達成しました。 DAMO Academyの最初のサーバーグレードCPUであるXuantie C930は、来月出荷を開始する予定です。 大幅に強化されたAIコンピューティングパワーにより、「高性能+ AI」RISC-Vエコシステムの展開が加速されます。
オープンソースコンピューティングアーキテクチャRISC-Vは、オープンソースAIの理想的なパートナーになり得るでしょうか?
AIモデルの変革がコンピューティングアーキテクチャの革新を促進
チップ業界のベテラン専門家は、DeepSeekの影響はAIサークルだけでなく、チップ業界内でも深く感じられていると説明しました。 DeepSeekは、高度に最適化された設計を通じて、大規模言語モデルのトレーニングと推論のコストを大幅に削減しました。 この変化は、コンピューティングパワー、メモリ、および相互接続の既存のバランスを劇的に変化させ、コンピューティングアーキテクチャのブレークスルーのための重要な機会を生み出しました。
従来、大規模なAIモデルは、コンピューティングとメモリの要件が厳しいため、エッジデバイスではなくクラウドでの展開に適していました。 しかし、DeepSeekの登場は、高いコンピューティングパワーへのこの依存に挑戦しました。 トレーニングと推論の両方のコストを削減することにより、大規模モデルがクラウドからエッジに移行するための道を開いています。
具体的には、DeepSeekの計算要求の削減により、単一マシンでの展開が可能になり、エッジデバイスおよびエンドサイドデバイスとの互換性が向上します。 AIが多様な産業やシナリオに浸透しようとするにつれて、クラウドからエッジに移行する必要性がますます重要になります。 このシフトは、データセキュリティ、パーソナライズされたカスタマイズ、プライベート展開などの多様なニーズを満たすために必要です。
DeepSeekテクノロジーの普及により、AIチップの状況が変化することは予測可能です。 クラウドインフラストラクチャに依存する大規模な並列コンピューティングから、AIチップは、エッジデバイスで独立して動作できる、多様化された効率的で低電力の設計に進化しています。
これにより、業界の多くの人々が、AIに最適なコンピューティングアーキテクチャは何かを考えるようになりました。
並列処理機能を備えたGPUは、唯一のソリューションではない可能性があります。 シリアルコンピューティング(汎用コンピューティング)も、AIコンピューティングの実行可能な基盤として浮上しています。 業界の経験から、DeepSeekはさまざまなコンピューティングシステムとの良好な互換性を示しています。 CPUに迅速に展開し、効果的な推論を実行できるため、CPUが再び脚光を浴びています。 専用GPUと比較して、CPUは汎用性、スケジューリングの簡素化、コンピューティングパワー要件の大幅な削減、および同種コンピューティングの利点を提供します。
CPUの中で、新星であるRISC-Vは、大きな注目を集めています。
旧正月中に、DAMO Academyは、RISC-VプロセッサXuantie C920を搭載したチップでDeepSeek-R1シリーズ蒸留モデルを適応させました。 プロセス全体はわずか1時間しかかからず、迅速でシームレスなエクスペリエンスを示しました。 これは、DeepSeekシリーズモデルが、Xuantie CPUプラットフォームの全範囲およびRISC-Vアーキテクチャチップを搭載した他のAIエンドサイドデバイスにスムーズに展開および実行できることを意味します。
RISC-Vの卓越性は、いくつかの要因に起因します。 第一に、新興の命令セットアーキテクチャとして、x86およびARMのクローズドまたは有料ライセンスモデルとは異なり、オープンソースアプローチを採用しています。 このオープンソースの精神は、AIと自然に一致しています。 そのオープンな性質は、世界中の1,000を超える企業の参加を集め、ハードウェア設計からソフトウェアツールチェーンまで、エコシステムの急速な成長を促進しています。 RISC-V International Foundationによると、80を超える異なるRISC-Vチップ製品がすでに市場に参入しています。
第二に、RISC-Vは卓越した柔軟性とスケーラビリティを提供します。 これにより、開発者は特定のニーズに応じて命令セットをカスタマイズできます。 その命令セットのモジュール性により、さまざまなアプリケーションシナリオに合わせてカスタマイズできます。これは、従来のアーキテクチャでは比類のないレベルの柔軟性です。
技術的には、RISC-Vは新しいタイプのAIコンピューティングにも適しています。 そのベクトル拡張(V-extension)は、大規模な並列操作を効果的に処理でき、AI計算の効率要件を満たします。 RISC-Vのオープンアーキテクチャは、ハードウェアアクセラレーションモジュールと連携して、AIタスクの実行効率を高めることができます。 AIアルゴリズムとの緊密な統合を通じて、RISC-Vアーキテクチャを使用して専用のハードウェアアクセラレーションユニットを設計し、特定のAIモデルのパフォーマンスを最適化できます。
したがって、チップ業界の多くのベテラン専門家は、RISC-VがAI時代のネイティブコンピューティングアーキテクチャになると予想しています。
AlibabaのDAMO Academyが主催する第3回Xuantie RISC-V Ecosystem Conferenceで、この期待がついに実現しました。
Xuantieの最初のサーバーグレードCPUが出荷予定:高性能とAIの融合
会議で、中国工程院の学者であるNi Guangnanは、「オープンソースRISC-Vは単なる技術革新ではなく、コンピューティングアーキテクチャの未来に影響を与えるグローバルな変革でもあります」と述べました。 「オープンソースで生まれた」チップ命令セットアーキテクチャとして、RISC-Vはこの半導体業界サイクルで目覚ましいパフォーマンスを示しました。 組み込みシステムから高性能コンピューティングなどの複雑なシナリオへの進歩を加速し、AIコンピューティングパワーに新しいオプションを提供しています。
2024年にRISC-V International Foundationによって承認された25の標準のうち、半分以上が高性能またはAIに関連しています。 RISC-V International Foundationの取締役会長であるLu Daiは、会議で、RISC-V命令セットの最もエキサイティングな進歩の1つはMatrix extensionであり、これによりRISC-VはAI分野で強力な力になると述べました。
2030年までに、RISC-Vの全体的な市場シェアは20%に達し、AIアクセラレータのシェアは50%を超える可能性があると予測されています。
会議で、DAMO Academyは、次世代のフラッグシッププロセッサであり、最初のサーバーグレードプロセッサであるC930を発表しました。
C930は、SPECint2006ベンチマークテストで15/GHzの汎用コンピューティングパワーベンチマークを達成しています。 これはどういう意味ですか? Ni Guangnan学者は、RISC-Vが高性能コンピューティング市場に真に参入するためには、SPECint 2006ソフトウェアテストで15を超える高性能スコアを達成する必要があると指摘しました。 したがって、C930はRISC-Vのマイルストーンステップを表しています。
さらに、C930にはデュアルエンジンが搭載されています:512ビットRVV1.0および8 TOPS Matrix。 これにより、汎用の高性能コンピューティングパワーとAIコンピューティングパワーがネイティブに統合されます。 また、オープンなDSA拡張インターフェースを提供して、より多くの機能要件をサポートします。
同時に、DAMO Academyは、C908X、R908A、XL200など、Xuantieプロセッサファミリーの新しいメンバーの開発計画を開示し、AIアクセラレーション、自動車アプリケーション、高速相互接続などの方向に進化し続けています。 具体的には、C908XはXuantieの最初の専用AIプロセッサとして位置付けられており、4096ビットの超長データビット幅RVV1.0ベクトル拡張をサポートしています。 R908Aは、車載グレードチップの高信頼性要件を対象としています。 XL200は、より大規模で高性能なマルチクラスターコヒーレント相互接続を提供します。
Xuantieプロセッサの機能を補完するために、DAMO Academyは、Linux、Android、RTOSの3つの主流オペレーティングシステムに基づいて、3つのXuantie SDKもリリースしました。 これらのSDKは、長年にわたって蓄積されたXuantieのソフトウェア機能を包括的に統合し、より完全で便利で安定した方法で業界に提供します。 その中でも、Xuantie Linux SDKは、ハイパーバイザー仮想化、CoVEセキュリティフレームワーク、Xuantie AIフレームワーク、高性能オペレーターライブラリなど、豊富なサブシステムのセットを提供し、高性能およびAIシナリオでのRISC-Vの開発を促進します。
高性能ハードウェアおよびソフトウェアテクノロジーを開発する一方で、Xuantieは、上流および下流の業界パートナー間の共同イノベーションを積極的に推進し、包括的なRISC-V「高性能+ AI」エコシステムの展開を加速しています。
Alibabaの献身:RISC-V Xuantieが国際オープンソースコミュニティをリード
Xuantieに馴染みのない方のために、簡単な紹介をします。
2018年、AlibabaはXuantieブランドを設立し、RISC-Vの方向に焦点を当てました。 1年後、最初のプロセッサであるC910が、当時最も強力なRISC-Vプロセッサとして登場しました。 それ以来、Xuantieは国際的なRISC-Vエコシステムのリーダーであり、国際的なオープンソースコミュニティへの最大の中国の貢献者の1つです。 現在、財団の技術委員会および10を超える技術小委員会で会長または副会長の職を務め、AI関連技術の標準化を積極的に推進しています。
2019年以来、Xuantieは、高性能、高エネルギー効率、低消費電力など、さまざまなシナリオをカバーする13のRISC-Vプロセッサを発売しました。 これらには以下が含まれます:
- Cシリーズ(コンピューティング):主にハイエンドサーバー、ハイエンドエッジコンピューティング、および産業/消費者グレードのIPCを対象としています。
- Eシリーズ(組み込み):主にハイエンドMPUおよびさまざまなMCUで使用されます。
- Rシリーズ(信頼性とリアルタイム):ハイエンドSSD、通信、ハイエンド産業用制御、自動車、およびその他のシナリオを対象としています。
- XT-Link:CPUマルチクラスター相互接続IP。
現在までに、Xuantieプロセッサの出荷台数は40億台を超えており、国内のRISC-V分野で最も影響力があり、市場をリードするプロセッサ製品シリーズの1つとなっています。
Xuantieは、その開発を通じて、RISC-Vのパフォーマンスの限界を一貫して押し上げ、これまで以上に高いパフォーマンスを目指してきました。 同時に、AIを積極的に採用し、RISC-VをネイティブAIコンピューティングアーキテクチャとして確立することを目指しています。
命令セットアーキテクチャテクノロジーレベルでは、RISC-Vアーキテクチャの優れたオープン性と柔軟性を活用して、XuantieはAIアプリケーション向けに命令セット拡張を長い間カスタマイズしてきました。 提案されたMatrix拡張命令セットと、大規模モデル向けのGEMMコアオペレーターの最適化により、AIの推論とトレーニングを加速し、エッジデバイスでのAIのエネルギー効率を向上させることができます。
プロセッサに関しては、Xuantie C907が最初にMatrix拡張を実装し、従来のソリューションと比較して15倍の高速化を達成しました。 アップグレードされたC920は、Vector 1.0およびVector Cryptoテクノロジーをサポートし、GEMMパフォーマンスを7倍以上、Transformerオペレーターパフォーマンスを17倍以上向上させます。 最新のフラッグシッププロセッサであるC930は、ベクトルエンジンとマトリックスエンジンの両方を備えており、エッジデバイス上の大規模AIモデルの有望なパートナーとして位置付けられています。
ソフトウェアスタックレベルでは、XuantieはエンドツーエンドのRISC-V AIフルスタックソフトウェアおよびハードウェアプラットフォームを作成しました。 このプラットフォームは、チップメーカーに汎用で効率的なAIコンピューティングインフラストラクチャを提供し、ビジネスニーズに向けたパイプライン設計を形成し、基盤となるハードウェア設計から上位層のソフトウェアツールチェーンまで、便利で深い最適化を真に可能にします。 このプラットフォームは、クラウドビデオトランスコーディングカード、AIエッジコンピューティングボックス、RISC-Vラップトップなどの端末製品に適用されています。
DAMO Academy RISC-Vチームは、独自のテクノロジーに加えて、上流および下流の業界パートナーと一貫して連携して、RISC-Vの「高性能+ AI」エコシステムを強化してきました。
昨年の会議では、RISC-Vオープンソースラップトップ「Ruyi BOOK Jia Chen Edition」がサプライズ登場し、大規模な商用ソフトウェアの安定したスムーズな動作を実証しました。 今年、中国科学院ソフトウェア研究所は、さらに「Ruyi BOOK Yi Si Edition」、インテリジェントロボット、AI PC、およびその他のRISC-V高性能アプリケーションを発表しました。
その中でも、C920をベースにしたAI PCプロトタイプは、Llama、Qwen、DeepSeekなどのオープンソースモデルの実行に成功し、AIパーソナルアシスタント、AIプログラミング、視覚認識などのAIアプリケーションをサポートしています。 これは、オープンソースのハードウェアアーキテクチャからオープンソースのオペレーティングシステム、オープンソースのAIモデルまで、完全な「オープンソースAIフルチェーン」を示し、同時に単位コンピューティングのエネルギー消費を30%削減します。
さらに、Xuantieはパートナーと協力して、RISC-Vビデオコーデックソリューションやクラウドデスクトップソリューションなどの実用的なソリューションを構築しました。 より多くの業界のアプリケーションをサポートするために、Xuantieは、オールインワンPC、産業用制御AI、ロボット、およびその他の分野にもRISC-Vコンピューティングパワーを展開しています。
Ni Guangnan学者は、Xuantieの実用的な投資とイノベーションは、RISC-Vエコシステムの健全な発展にとって重要な推進力であると述べました。
オープンソースの未来
DeepSeekの成功は、オープンソースの力の証です。 10年以上前の設立以来、オープンソースの命令セットアーキテクチャRISC-Vは、クローズドなx86およびライセンスされたARMモデルとは異なる開発パスをたどってきました。 より簡潔でオープンな方法でアーキテクチャを革新する機会を業界に提示し、ますます認識されるようになっています。
AI時代のネイティブアーキテクチャの最良の候補として浮上しています。 一方で、RISC-Vは、オープン性と継続的な進化へのコミットメントにより、AIの急速な変化に対応できます。 一方、RISC-Vの強力な拡張性により、移植と適応を通じて既存のアーキテクチャエコシステムと互換性を持たせながら、新しいシナリオをサポートするネイティブアーキテクチャとしても機能できます。
中国科学院ソフトウェア研究所のRISC-V責任者であるGuo Songliuが述べたように、「AIソフトウェアスタックはまだ急速に進化しています。 3つの主流の命令セットアーキテクチャの中で最も柔軟でオープンなRISC-Vは、間違いなくAI時代の技術革新のペースに最も適しています。」