深入探討 AMD 的基準測試方法
AMD 最近發布了 AI 效能基準測試,展示了其強大的 Ryzen AI Max+ 395 晶片組(搭載於 Asus ROG Flow Z13 (2025))。這些基準測試將 Ryzen 晶片與 Intel 的 Core Ultra 7 258V(搭載於 Asus Zenbook S14 (UX5406))進行了比較。不出所料,Intel 的中階 Lunar Lake 處理器難以匹敵 Ryzen AI Max Strix Halo APU 的強大效能,尤其是在以 GPU 為中心的 AI 任務中。
然而,這些比較僅關注 AMD 與 Intel 之間的競爭,忽略了一個更重要的競爭對手:Apple。為了提供更全面的視角,我們進行了詳細分析,將這些處理器與 Apple 的晶片進行了比較。
AMD 的方法與標準的業界基準測試不同。它採用「每秒 token 數」指標來評估 Lunar Lake 和 Strix Halo 如何處理各種大型語言模型 (LLM) 和小型語言模型 (SLM) AI 框架,包括 DeepSeek 和 Microsoft 的 Phi 4。
正如預期的那樣,Ryzen AI Max+ 395 中強大的 GPU 組件明顯優於 Lunar Lake 中較小的 Intel Arc 140V 集成顯卡。 考慮到 Intel 的 Lunar Lake 晶片是專為超便攜式 AI PC 筆記型電腦設計的,其功耗閾值遠低於 Ryzen AI Max+,這一結果並不令人驚訝。此外,期望超薄筆記型電腦與像 Flow Z13 這樣的遊戲型電腦具有相當的 GPU 效能是不現實的。
不匹配的比較?
雖然 AMD Ryzen AI Max+ 395 和 Intel Core Ultra 200V 系列都是能夠處理 AI 工作負載的 x86 CPU,但 Zenbook S14 和 ROG Flow Z13 之間的比較類似於評估 Asus ROG Ally X 與 ROG Strix Scar 18 的遊戲效能。它們代表了根本不同的設備,包含不同的硬體,並且是為完全不同的使用案例而設計的。
同樣值得注意的是,AMD 已經提供了 Strix Point 和 Krackan Point Ryzen AI 300 系列,這是 Lunar Lake 的直接競爭對手。
驗證 AMD 的說法並將 Apple 納入比較
由於 AMD 的效能基準測試中缺乏標準化測試和硬性分數,我們將他們的發現與我們自己的實驗室基準測試進行了交叉參考。
AMD 聲稱的「LLM 最強大的 x86 處理器」對於 Strix Halo 來說是正確的。然而,重要的是要認識到 Strix Halo 與傳統的移動 CPU 設計不同。它與 Apple 基於 Arm 的 M4 Max 或 M3 Ultra 有更多相似之處。這就產生了 x86 與 Arm 的比較,其中 Apple 的高階晶片組屬於與 Ryzen AI Max 相當的 CPU 類別,而 Lunar Lake 根本不屬於這一類別。
雖然我們目前沒有 M4 Max 或 M3 Ultra 的基準測試數據,但我們確實擁有來自「我們測試過的最強大的 Apple 筆記型電腦」——配備 M4 Pro 晶片組的 MacBook Pro 16 的測試結果。
更恰當的比較:HP ZBook 14 Ultra vs. MacBook Pro 16
理想情況下,為了進行更直接的晶片和產品比較,Ryzen AI Max APU 的另一個發布系統 HP ZBook 14 Ultra 將是與 MacBook Pro 更合適的競爭對手。Apple 的高階筆記型電腦長期以來一直是設計專業人士的基準,這使得 HP ZBook 14 Ultra 成為與 MacBook Pro 16 相比的一個引人注目的測試對象。
不幸的是,我們還沒有機會測試 ZBook 14 Ultra G1a。因此,我們在此比較中使用了 Flow Z13。
使用 Asus Zenbook S14 驗證 AMD 的說法
我們在比較中保留了搭載 Intel Core Ultra 7 258V 的 Asus Zenbook S14,以驗證 AMD 的說法。正如預期的那樣,與 Apple 和 AMD 的強大產品相比,Zenbook S14 處於效能譜的低端。
Geekbench AI 基準測試:跨平台視角
雖然 ROG Flow Z13 中的 Ryzen AI Max+ 395 在遊戲效能方面表現出明顯優勢,但 M4 Pro 在 GPU 密集型 AI 任務中提供了令人驚訝的強勁競爭力,Geekbench AI 基準測試證明了這一點。
儘管 Geekbench AI 基準測試在衡量 AI 效能方面存在局限性,但它是一個用於比較 CPU 和 GPU 的跨平台基準測試。這與 AMD 報告的「每秒 token 數」基準測試形成對比,後者在獨立測試中更難以複製。
Ryzen AI Max+ 395:不容小覷的力量
Apple MacBook Pro 16 在我們的基準測試中與 Flow Z13 的強勁表現並沒有削弱 Ryzen AI Max+ 395 是一款非常強大的晶片組這一事實。它是一款高效能、多功能的晶片,在創意和遊戲工作負載中都表現出令人印象深刻的結果。它代表了一種新穎的 x86 處理器設計方法,並且理所當然地在 CES 2025 上贏得了我們的最佳展示獎。
我們對它在 ROG Flow Z13 中的表現印象深刻,並且我們熱切期待在 HP ZBook 14 Ultra 中測試 PRO 版本。我們也希望看到 AMD 將 Ryzen AI Max 集成到更廣泛的系統中,為基準測試比較提供更多機會。
高階晶片組領域需要更激烈的競爭
像 Ryzen AI Max+ 395 這樣的強大處理器的出現凸顯了高階晶片組市場對強勁競爭的持續需求。Apple Silicon 雖然令人印象深刻,但肯定可以從更強大的競爭對手中受益,進一步推動效能和創新的界限。這些比較雖然複雜,但表明格局正在發生變化,傳統的 x86 架構正在不斷發展以滿足 AI 驅動的工作負載的需求。隨著這些技術的不斷發展,未來將會有更多有趣的對決。
擴展特定領域並添加更多細節
讓我們深入研究一些特定領域並提供更細緻的見解:
1. 「每秒 token 數」指標:
AMD 選擇「每秒 token 數」作為主要指標值得進一步審視。雖然它提供了語言模型處理速度的衡量標準,但它並不能完全反映 AI 效能的複雜性。模型準確性、延遲和電源效率等因素同樣至關重要。如果模型的輸出不準確或消耗過多電量,高「每秒 token 數」並不一定能轉化為卓越的用戶體驗。
此外,AMD 測試中使用的特定語言模型(DeepSeek 和 Phi 4)並非普遍採用的基準測試。這些模型的效能可能無法代表其他流行的 LLM 和 SLM 的效能。更全面的評估將涉及更廣泛的模型,反映不同的 AI 任務和應用。
2. 集成顯卡的角色:
Ryzen AI Max+ 395 和 Intel Core Ultra 7 258V 之間的顯著效能差距主要歸因於集成顯卡功能的差異。Ryzen 晶片擁有更強大的 GPU,這對於可以利用 GPU 加速的 AI 工作負載特別有利。
然而,重要的是要承認,即使在像 Ryzen AI Max+ 這樣的高階晶片中,與獨立 GPU 相比,集成顯卡仍然存在局限性。對於要求最苛刻的 AI 任務,獨立顯卡仍然是首選解決方案。比較突出了集成顯卡對於 AI 處理日益增長的重要性,但不應將其解釋為在所有情況下都可以取代獨立 GPU。
3. x86 與 Arm 的爭論:
Ryzen AI Max+ (x86) 和 Apple M4 Pro (Arm) 之間的比較觸及了圍繞這兩種處理器架構的更廣泛的爭論。雖然 x86 傳統上主導著 PC 市場,但 Arm 在移動設備中獲得了顯著的吸引力,並且越來越多地在筆記型電腦甚至桌上型電腦中挑戰 x86。
Arm 處理器通常以其電源效率而聞名,而 x86 晶片通常與更高的效能相關。然而,界限正變得越來越模糊。Ryzen AI Max+ 表明 x86 可以適應高能效設計,而 Apple 的 M 系列晶片已經證明 Arm 可以提供令人印象深刻的效能。
x86 和 Arm 之間的選擇最終取決於具體的使用案例和優先事項。對於電池壽命至關重要的超便攜設備,Arm 可能具有優勢。對於原始效能是主要關注點的高效能工作站,x86 仍然是一個強有力的競爭者。Ryzen AI Max+ 代表了一個引人注目的例子,說明 x86 如何能夠在不斷發展的格局中競爭。
4. 軟體優化的重要性:
硬體功能只是等式的一部分。軟體優化在最大化 AI 效能方面起著關鍵作用。AMD 和 Apple 都投入巨資開發針對各自硬體平台的軟體生態系統。
AMD 的 ROCm 平台提供了一套工具和庫,用於在 AMD GPU 上開發和部署 AI 應用程式。Apple 的 Core ML 框架為 Apple 晶片提供了類似的功能。這些軟體堆疊的有效性可以顯著影響實際的 AI 效能。
不同硬體平台之間的公平比較還應考慮每個平台可用的軟體優化水平。如果一個功能較弱的晶片受益於卓越的軟體支援,它有可能勝過功能更強大的晶片。
5. 未來方向:
AI 的快速發展正在推動處理器設計的持續創新。我們可以預期未來晶片中將集成更多專用的 AI 加速器,進一步模糊 CPU、GPU 和專用 AI 處理單元之間的界限。
AMD、Intel 和 Apple 之間的競爭可能會加劇,從而產生更快、更節能、更具 AI 能力的處理器。這種競爭最終將使消費者受益,並推動 AI 在更廣泛的應用中採用。硬體和軟體的發展對於塑造 AI 計算的未來至關重要。新基準和測試方法的持續開發對於準確評估這些日益複雜的系統的效能也至關重要。創造終極 AI 處理解決方案的競賽已經開始,未來幾年將會有令人興奮的進展。
神經處理和專用 AI 硬體的持續改進可能會導致我們與技術互動方式的範式轉變。