AMD Ryzen AI 对比 Apple M4 Pro:出乎意料

深入了解 AMD 的基准测试方法

AMD 最近发布了 AI 性能基准测试,展示了其强大的 Ryzen AI Max+ 395 芯片组(如 Asus ROG Flow Z13 (2025) 中所使用的)。这些基准测试将 Ryzen 芯片与 Intel 的 Core Ultra 7 258V(Asus Zenbook S14 (UX5406) 中采用)进行了对比。不出所料,英特尔的中端 Lunar Lake 处理器难以匹敌 Ryzen AI Max Strix Halo APU 的强大性能,特别是在以 GPU 为中心的 AI 任务中。

然而,这些比较仅关注 AMD 与英特尔之间的竞争,忽略了一个更相关的竞争对手:Apple。为了提供更全面的视角,我们进行了详细分析,将这些处理器与 Apple 的芯片进行了比较。

AMD 的方法不同于标准的行业基准测试。相反,它采用“每秒令牌数”指标来评估 Lunar Lake 和 Strix Halo 如何处理各种大型语言模型 (LLM) 和小型语言模型 (SLM) AI 框架,包括 DeepSeek 和 Microsoft 的 Phi 4。

正如预期的那样,Ryzen AI Max+ 395 中强大的 GPU 组件明显优于 Lunar Lake 中较小的 Intel Arc 140V 集成显卡。考虑到英特尔的 Lunar Lake 芯片是专为超便携式 AI PC 笔记本电脑设计的,其功耗远低于 Ryzen AI Max+,这一结果并不令人惊讶。此外,期望超薄笔记本电脑与 Flow Z13 这样的游戏型机器具有相当的 GPU 性能是不现实的。

不匹配的比较?

虽然 AMD Ryzen AI Max+ 395 和 Intel Core Ultra 200V 系列都是能够处理 AI 工作负载的 x86 CPU,但 Zenbook S14 和 ROG Flow Z13 之间的比较类似于评估 Asus ROG Ally X 与 ROG Strix Scar 18 的游戏性能。它们代表了根本不同的设备,包含不同的硬件,并且设计用于完全不同的用例。

同样值得注意的是,AMD 已经提供了 Strix Point 和Krackan Point Ryzen AI 300 系列,它们是 Lunar Lake 的直接竞争对手。

验证 AMD 的说法并将 Apple 纳入其中

由于 AMD 的性能基准测试中缺少标准化测试和硬性分数,我们将他们的发现与我们自己的实验室基准测试进行了交叉参考。

AMD 声称的“用于 LLM 的最强大的 x86 处理器”对于 Strix Halo 来说是正确的。然而,重要的是要认识到 Strix Halo 不同于传统的移动 CPU 设计。它与 Apple 基于 Arm 的 M4 Max 或 M3 Ultra 有更多相似之处。这创建了一个 x86 与 Arm 的比较,其中 Apple 的高端芯片组属于与 Ryzen AI Max 相当的 CPU 类别,而 Lunar Lake 根本不属于这一类别。

虽然我们目前缺乏 M4 Max 或 M3 Ultra 的基准测试数据,但我们确实拥有来自“我们测试过的最强大的 Apple 笔记本电脑”MacBook Pro 16(配备 M4 Pro 芯片组)的测试结果。

更恰当的比较:HP ZBook 14 Ultra 与 MacBook Pro 16

理想情况下,为了进行更直接的芯片和产品比较,Ryzen AI Max APU 的另一个发布系统 HP ZBook 14 Ultra 将是与 MacBook Pro 更合适的竞争对手。Apple 的高端笔记本电脑长期以来一直是设计专业人士的基准,这使得 HP ZBook 14 Ultra 成为与 MacBook Pro 16 对比的理想测试对象。

不幸的是,我们还没有机会测试 ZBook 14 Ultra G1a。因此,我们在此比较中使用了 Flow Z13。

使用 Asus Zenbook S14 验证 AMD 的说法

我们在比较中保留了搭载 Intel Core Ultra 7 258V 的 Asus Zenbook S14,以验证 AMD 的说法。正如预期的那样,与 Apple 和 AMD 的强大产品相比,Zenbook S14 处于性能范围的低端。

Geekbench AI 基准测试:跨平台视角

虽然 ROG Flow Z13 中的 Ryzen AI Max+ 395 在游戏性能方面表现出明显的优势,但 M4 Pro 在 GPU 密集型 AI 任务中提供了令人惊讶的强大竞争力,Geekbench AI 基准测试证明了这一点。

尽管 Geekbench AI 基准测试在衡量 AI 性能方面存在局限性,但它是一个用于比较 CPU 和 GPU 的跨平台基准测试。这与 AMD 报告的“每秒令牌数”基准测试形成对比,后者在独立测试中更难复制。

Ryzen AI Max+ 395:不容小觑的力量

Apple MacBook Pro 16 在我们的基准测试中与 Flow Z13 的强劲表现并没有削弱 Ryzen AI Max+ 395 是一款极其强大的芯片组这一事实。它是一款高性能、多功能的芯片,在创意和游戏工作负载中都表现出令人印象深刻的结果。它代表了一种新颖的 x86 处理器设计方法,并且理所当然地获得了我们在 CES 2025 上的最佳展示奖。

它在 ROG Flow Z13 中的表现给我们留下了深刻的印象,我们热切期待在 HP ZBook 14 Ultra 中测试 PRO 版本。我们还希望看到 AMD 将 Ryzen AI Max 集成到更广泛的系统中,从而提供更多基准测试比较的机会。

高端芯片组领域需要更激烈的竞争

像 Ryzen AI Max+ 395 这样的强大处理器的出现凸显了高端芯片组市场对激烈竞争的持续需求。Apple Silicon 虽然令人印象深刻,但肯定可以从更强大的竞争对手中受益,从而进一步推动性能和创新的界限。这些比较虽然复杂,但表明格局正在发生变化,传统的 x86 架构正在不断发展以满足 AI 驱动的工作负载的需求。随着这些技术的不断发展,未来将会有更多有趣的对决。

扩展特定领域并添加更多细节

让我们深入研究一些特定领域并提供更细致的见解:

1. “每秒令牌数”指标:

AMD 选择“每秒令牌数”作为主要指标值得进一步审查。虽然它提供了语言模型处理速度的衡量标准,但它并没有完全捕捉到 AI 性能的复杂性。模型准确性、延迟和功耗效率等因素同样至关重要。如果模型的输出不准确或消耗过多的功率,高“每秒令牌数”并不一定意味着更好的用户体验。

此外,AMD 测试中使用的特定语言模型(DeepSeek 和 Phi 4)并非普遍采用的基准。这些模型的性能可能无法代表其他流行的 LLM 和 SLM 的性能。更全面的评估将涉及更广泛的模型,反映不同的 AI 任务和应用。

2. 集成显卡的作用:

Ryzen AI Max+ 395 和 Intel Core Ultra 7 258V 之间的显着性能差距主要归因于集成显卡功能的差异。Ryzen 芯片拥有更强大的 GPU,这对于可以利用 GPU 加速的 AI 工作负载特别有利。

然而,重要的是要承认,即使在像 Ryzen AI Max+ 这样的高端芯片中,与独立 GPU 相比,集成显卡仍然存在局限性。对于要求最苛刻的 AI 任务,独立显卡仍然是首选解决方案。该比较突出了集成显卡对于 AI 处理日益增长的重要性,但不应将其解释为在所有情况下都可以替代独立 GPU。

3. x86 与 Arm 的争论:

Ryzen AI Max+ (x86) 和 Apple M4 Pro (Arm) 之间的比较触及了围绕这两种处理器架构的更广泛的争论。虽然 x86 传统上主导着 PC 市场,但 Arm 在移动设备中获得了显著的吸引力,并且在笔记本电脑甚至台式机中越来越多地挑战 x86。

Arm 处理器通常以其能效而著称,而 x86 芯片通常与更高的性能相关。然而,界限正变得越来越模糊。Ryzen AI Max+ 表明 x86 可以适应高能效设计,而 Apple 的 M 系列芯片已经证明 Arm 可以提供令人印象深刻的性能。

x86 和 Arm 之间的选择最终取决于具体的用例和优先级。对于电池寿命至关重要的超便携设备,Arm 可能具有优势。对于原始性能是主要关注点的高性能工作站,x86 仍然是一个强有力的竞争者。Ryzen AI Max+ 代表了一个引人注目的例子,说明 x86 如何发展以在不断变化的格局中竞争。

4. 软件优化的重要性:

硬件功能只是等式的一部分。软件优化在最大化 AI 性能方面起着至关重要的作用。AMD 和 Apple 都投入巨资开发针对各自硬件平台的软件生态系统。

AMD 的 ROCm 平台提供了一套工具和库,用于在 AMD GPU 上开发和部署 AI 应用程序。Apple 的 Core ML 框架为 Apple 芯片提供了类似的功能。这些软件堆栈的有效性可以显著影响实际的 AI 性能。

不同硬件平台之间的公平比较还应考虑每个平台可用的软件优化水平。如果性能较弱的芯片受益于卓越的软件支持,则它有可能胜过性能更强的芯片。

5. 未来方向:

AI 的快速发展正在推动处理器设计的持续创新。我们可以预期在未来的芯片中集成更多专用的 AI 加速器,进一步模糊 CPU、GPU 和专用 AI 处理单元之间的界限。

AMD、英特尔和 Apple 之间的竞争可能会加剧,从而产生更快、更节能、更具 AI 能力的处理器。这种竞争最终将使消费者受益,并推动 AI 在更广泛的应用中的采用。硬件和软件的演进对于塑造 AI 计算的未来至关重要。新基准和测试方法的持续开发对于准确评估这些日益复杂的系统的性能也至关重要。创造终极 AI 处理解决方案的竞赛已经开始,未来几年将会有令人兴奋的进步。神经处理和专用 AI 硬件的不断改进可能会导致我们与技术交互方式的范式转变。