Ryzen AI Max+ 395 vs. Core Ultra 7 258V:直接対決
AMDはRyzen AI Max+ 395の性能を示すために、Intel’のCore Ultra 7 258V (Arc 140Vグラフィックス搭載)との一連のテストを実施しました。ベンチマークは、DeepSeek R1やLlamaなどの主要な大規模言語モデル(LLM)とLLM構成に焦点を当てています。
メモリ構成に関する注記:
公平な比較を保証するため、モデルサイズは16GBに制限されました。この制約は、Lunar Lake搭載ラップトップのメモリ制限(現在最大32GBのメモリが利用可能)を考慮して実装されました。使用されたテストシステムは次のとおりです。
- Ryzen AI Max+ 395: Asus ROG Flow Z13、64GBメモリ搭載。
- Core Ultra 7 258V: Asus Zenbook S14、32GBメモリ搭載。
DeepSeek R1のパフォーマンス:大幅なリード
DeepSeek R1ベンチマークでは、Ryzenチップが圧倒的なリードを示しました。結果はトークン/秒で測定され、次のとおりです。
- Distill Qwen 1.5b: Intelの競合製品よりも最大2.1倍高速。
- Distill Qwen 7b: 最大2.2倍高速。
- Distill Llama 8b: 最大2.1倍高速。
- Distill Qwen 14b: 最大2.2倍高速。
Phi 4およびLlama 3.2ベンチマーク:優位性を維持
Ryzen AI Max+ 395は、Phi 4およびLlama 3.2モデルを使用したテストでもCore Ultra 7 258Vを上回り続けました。
- Phi 4 Mini Instruct 3.8b: 最大2.1倍高速。
- Phi 4 14b: 最大2.2倍高速。
- Llama 3.2 3b Instruct: 最大2.1倍高速。
Time to First Token:重要な指標
AMDは、AIアプリケーションの応答性の重要な指標である「Time to the first token」にも焦点を当てました。これらのベンチマークでは、Ryzen AI Max+ 395はさらに大幅なリードを示しました。
- DeepSeek R1 Distill Qwen 14b: 最大12.2倍高速。
- Zen 5チップのパフォーマンス上の優位性が最も低いシナリオ(Phi 4 Mini Instruct 3.8bおよびLlama 3.2 3b Instruct)でも、AMDチップはCore Ultra 7 258Vに対して4倍の速度優位性を維持しました。
AI Visionモデル:さらにリードを拡大
Ryzen AI Max+ 395のパフォーマンスの優位性は、AI Visionモデルにも及び、「Time to the first token」ベンチマークアプローチを再度使用しました。
- IBM Granite Vision 3.2 2B: 258Vよりも最大7倍高速。
- Google Gemma 3.4b: 最大4.6倍高速。
- Google Gemma 3 12b: 最大6倍高速。
アーキテクチャの利点:優れたパフォーマンスの源
AMD’のRyzen AI Max+ 395によって示された印象的なパフォーマンス数値は、主にいくつかの主要なアーキテクチャ上の利点に起因します。
- 強力な統合グラフィックス: Ryzen AI Max CPU内の統合グラフィックスチップは、40個のRDNA 3.5コンピュートユニット(CU)を誇り、ディスクリートグラフィックスソリューションに匹敵するパフォーマンスを提供します。
- より高いコア数: Ryzen AI Max+ 395は、Core Ultra 7 258Vよりも8つ多いCPUコアを備えており、処理能力の向上に貢献しています。
- 構成可能なTDP: Ryzenチップは、最大120Wの定格で、大幅に高い構成可能なTDP(熱設計電力)を備えており、より大きなパフォーマンスヘッドルームを可能にします。
消費電力に関する考慮事項:
Ryzen AI Max+ 395は、最大ターボ電力が37WのCore Ultra 7 258Vよりも大幅に多くの電力を消費することを認識することが重要です。ただし、この違いにもかかわらず、両方のチップは同じ市場セグメントをターゲットにしており、薄型軽量のラップトップPC向けに設計されています。
今後の展望:NVIDIA’のRTX 50シリーズとの競争
モバイルコンピューティングの状況は絶えず進化しており、AMD’の新しいモバイルAPUの次の課題は、NVIDIA’のRTX 50シリーズモバイルGPUから来る可能性があります。レポートによると、これらのGPUの発売にはサプライチェーンの問題と遅延の可能性があることが示唆されていますが、今後のRTX 50シリーズゲーミングラップトップでは、フォームファクターの違いに関係なく、間違いなくAMD’の主要な競争相手となるでしょう。
ディスクリートGPUに対する初期の兆候:
興味深いことに、AMDはすでにRyzen AI Max+ 395のAIパフォーマンスがNVIDIA’のRTX 4090ラップトップGPUよりも優れていると主張しており、ディスクリートグラフィックスソリューションに対しても強力な競争力を示唆しています。これは先制的な声明であり、独立したレビューを待っている人々を非常に興奮させることは間違いありません。
ベンチマーク結果の詳細
提供されたベンチマークデータは、AMD’のAIパフォーマンスへの焦点を明確に示しています。モデルと構成の選択は、最新のコンピューティングタスクにおける効率的で応答性の高いAI処理の重要性の高まりを浮き彫りにしています。
大規模言語モデル(LLM):
DeepSeek R1とLlamaという2つの主要なLLMの使用は、Ryzen AI Max+ 395が複雑な自然言語処理タスクを処理できることを示しています。 「トークン/秒」メトリックは、この分野でのパフォーマンスの標準的な尺度であり、プロセッサがテキストを生成したり、言語ベースの入力を処理したりする速度を示します。
蒸留(Distillation):
モデルの「Distill」バージョン(例:Distill Qwen 1.5b)を含めることは、モデルの効率に焦点を当てていることを示唆しています。蒸留は、大規模モデルの精度を大幅に維持しながら、より小さく、より高速なバージョンを作成するために使用される技術です。これは、消費電力とメモリの制約が重要なモバイルデバイスに特に関連します。
Phi 4およびLlama 3.2:
Phi 4およびLlama 3.2モデルを追加することで、さまざまなAIアーキテクチャとモデルサイズにわたるチップのパフォーマンスに関するより広い視野が得られます。
Time to First Token (TTFT):
「Time to the first token」の重視は特に注目に値します。TTFTは、ユーザー’の入力とAIモデルからの最初の応答との間の遅延を測定します。TTFTが低いほど、応答性が高くインタラクティブなユーザーエクスペリエンスが実現します。これは、チャットボット、リアルタイム翻訳、コード補完などのアプリケーションにとって非常に重要です。
AI Visionモデル:
AI Visionモデル(IBM Granite VisionおよびGoogle Gemma)を含めることで、Ryzen AI Max+ 395の汎用性が実証されます。これらのモデルは、画像認識、オブジェクト検出、ビデオ分析などのタスクに使用されます。これらのベンチマークでの強力なパフォーマンスは、言語処理以外のアプリケーションに対するチップ’の適合性を示唆しています。
アーキテクチャ上の利点の重要性
AMD’のアーキテクチャ上の決定は、観察されたパフォーマンスの違いに重要な役割を果たします。
統合グラフィックス(RDNA 3.5):
強力な統合グラフィックスユニットは重要な差別化要因です。要求の厳しいワークロードに苦労することが多い従来の統合グラフィックスソリューションとは異なり、RDNA 3.5アーキテクチャはパフォーマンスを大幅に向上させ、Ryzen AI Max+ 395がAIタスクをより効果的に処理できるようにします。40個のCUは、かなりの計算能力を表しています。
コア数:
より高いコア数(Core Ultra 7 258Vよりも8コア多い)は、マルチスレッドワークロードで一般的な利点を提供します。AI処理はGPUに大きく依存することが多いですが、CPUは依然としてタスクの管理と計算の特定の側面の処理において役割を果たします。
構成可能なTDP:
より高いTDPにより、電力管理の柔軟性が向上します。これはより高い消費電力を意味しますが、特に要求の厳しいAIワークロードでは、チップがより高いクロック速度で動作し、パフォーマンスをより長く維持することも可能にします。TDPを最大120Wまで構成できる機能は、Core Ultra 7 258Vのより制約された37Wの最大ターボ電力よりも大幅な利点を提供します。これは、観察されたパフォーマンスリードを達成するための重要な要素です。
モバイルコンピューティングの状況:変化する戦場
モバイル分野におけるAMDとIntelの競争は近年激化しており、両社はパフォーマンスと効率の限界を押し広げています。Lunar Lakeの導入はIntel’の電力効率への焦点を表していましたが、AMD’のRyzen AI Max+ 395は、特にAIワークロードにおいて、パフォーマンスを明確に優先しています。
NVIDIA’のRTX 50シリーズモバイルGPUとの今後の戦いは、AMDにとって重要なテストになるでしょう。NVIDIAは伝統的にハイエンドモバイルグラフィックス市場を支配してきましたが、AMD’の統合グラフィックスとAI処理機能の進歩により、AMDは強力な競争相手としての地位を確立しています。NVIDIAが直面していると報告されているサプライチェーンの問題は、可用性と市場浸透の点でAMDに有利になる可能性があります。
RTX 4090ラップトップGPUよりも優れたAIパフォーマンスの主張は大胆ですが、実証されれば、競争環境の大きな変化を表すでしょう。これは、AMD’の統合ソリューションが、特定のAIに焦点を当てたアプリケーションでディスクリートグラフィックスソリューションと競争し、場合によってはそれを上回ることができることを示しています。これは大きな成果であり、モバイルコンピューティングの将来に大きな影響を与える可能性があります。AIパフォーマンスの重視は、業界が進んでいる方向を明確に示しています。AIが日常のアプリケーションにますます統合されるにつれて、これらのワークロードを効率的かつ効果的に処理できるプロセッサの需要は増え続けるでしょう。