Ryzen AI Max+ 395 對決 Core Ultra 7 258V
為了展示 Ryzen AI Max+ 395 的強大效能,AMD 進行了一系列測試,將其與 Intel 的 Core Ultra 7 258V(配備 Arc 140V 顯示晶片)進行比較。基準測試著重於各種大型語言模型 (LLM) 和 LLM 配置,包括 DeepSeek R1 和 Llama 等知名模型。
記憶體配置說明:
為了確保公平比較,模型大小上限設定為 16GB。此限制是為了考慮 Lunar Lake 筆記型電腦的記憶體限制,目前最大記憶體容量為 32GB。使用的測試系統包括:
- **Ryzen AI Max+ 395:**Asus ROG Flow Z13,配備 64GB 記憶體。
- **Core Ultra 7 258V:**Asus Zenbook S14,配備 32GB 記憶體。
DeepSeek R1 效能:顯著領先
在 DeepSeek R1 基準測試中,Ryzen 晶片展現出壓倒性的領先優勢。結果以每秒 token 數衡量,如下所示:
- **Distill Qwen 1.5b:**比 Intel 同級產品快 2.1 倍。
- **Distill Qwen 7b:**快 2.2 倍。
- **Distill Llama 8b:**快 2.1 倍。
- **Distill Qwen 14b:**快 2.2 倍。
Phi 4 和 Llama 3.2 基準測試:保持領先
Ryzen AI Max+ 395 在使用 Phi 4 和 Llama 3.2 模型的測試中,持續超越 Core Ultra 7 258V:
- **Phi 4 Mini Instruct 3.8b:**快 2.1 倍。
- **Phi 4 14b:**快 2.2 倍。
- **Llama 3.2 3b Instruct:**快 2.1 倍。
首次 Token 生成時間:關鍵指標
AMD 還關注「首次 Token 生成時間」指標,這是 AI 應用程式反應速度的關鍵指標。在這些基準測試中,Ryzen AI Max+ 395 展現出更顯著的領先優勢:
- **DeepSeek R1 Distill Qwen 14b:**快 12.2 倍。
- 即使在 Zen 5 晶片效能優勢最不明顯的情況下(Phi 4 Mini Instruct 3.8b 和 Llama 3.2 3b Instruct),AMD 晶片仍然比 Core Ultra 7 258V 快 4 倍。
AI 視覺模型:進一步擴大領先優勢
Ryzen AI Max+ 395 的效能優勢延伸到 AI 視覺模型,同樣使用「首次 Token 生成時間」基準測試方法:
- **IBM Granite Vision 3.2 2B:**比 258V 快 7 倍。
- **Google Gemma 3.4b:**快 4.6 倍。
- **Google Gemma 3 12b:**快 6 倍。
架構優勢:卓越效能的來源
AMD Ryzen AI Max+ 395 展現出的驚人效能數據,主要歸功於以下幾個關鍵架構優勢:
- **強大的整合式顯示晶片:**Ryzen AI Max CPU 內的整合式顯示晶片擁有 40 個 RDNA 3.5 運算單元 (CU),提供媲美獨立顯示卡的效能。
- **更高的核心數量:**Ryzen AI Max+ 395 比 Core Ultra 7 258V 多八個 CPU 核心,有助於提升處理能力。
- **可配置的 TDP:**Ryzen 晶片具有顯著更高的可配置 TDP(熱設計功耗),最高可達 120W,提供更大的效能空間。
功耗考量:
需要注意的是,Ryzen AI Max+ 395 的功耗明顯高於 Core Ultra 7 258V,後者的最大渦輪功耗為 37W。然而,儘管存在這種差異,兩款晶片都針對相同的市場區隔,並且都設計用於輕薄型筆記型電腦。
展望未來:與 NVIDIA RTX 50 系列的競爭
行動運算領域不斷發展,AMD 新型行動 APU 的下一個挑戰可能來自 NVIDIA 的 RTX 50 系列行動 GPU。雖然有報導稱,這些 GPU 在即將推出的 RTX 50 系列遊戲筆記型電腦中的發佈可能存在供應鏈問題和延遲,但無論外形尺寸差異如何,它們無疑將成為 AMD 在原始效能方面的主要競爭對手。
早期對抗獨立 GPU 的跡象:
有趣的是,AMD 已經宣稱 Ryzen AI Max+ 395 的 AI 效能優於 NVIDIA 的 RTX 4090 筆記型電腦 GPU,這表明即使面對獨立顯示卡解決方案,它也具有強大的競爭力。這是一個先發制人的聲明,肯定會讓那些等待獨立評測的人非常興奮。
深入探討基準測試結果
提供的基準測試數據清楚地表明 AMD 對 AI 效能的重視。模型和配置的選擇突顯了高效且反應靈敏的 AI 處理在現代運算任務中日益增長的重要性。
大型語言模型 (LLM):
DeepSeek R1 和 Llama 這兩個著名的 LLM 的使用,展示了 Ryzen AI Max+ 395 處理複雜自然語言處理任務的能力。「每秒 token 數」是該領域效能的標準衡量標準,表示處理器生成文本或處理基於語言的輸入的速度。
蒸餾 (Distillation):
包含模型的「Distill」版本(例如 Distill Qwen 1.5b)表明對模型效率的關注。蒸餾是一種用於創建較大型模型更小、更快的版本,同時保留其大部分準確性的技術。這對於功耗和記憶體限制至關重要的行動裝置尤其重要。
Phi 4 和 Llama 3.2:
Phi 4 和 Llama 3.2 模型的加入,提供了晶片在不同 AI 架構和模型大小上的效能的更廣泛視角。
首次 Token 生成時間 (TTFT):
對「首次 Token 生成時間」的強調尤其值得注意。TTFT 衡量使用者輸入與 AI 模型初始回應之間的延遲。較低的 TTFT 意味著更靈敏和互動的使用者體驗,這對於聊天機器人、即時翻譯和程式碼完成等應用程式至關重要。
AI 視覺模型:
AI 視覺模型(IBM Granite Vision 和 Google Gemma)的加入,展示了 Ryzen AI Max+ 395 的多功能性。這些模型用於影像識別、物件偵測和視訊分析等任務。在這些基準測試中的強勁表現表明,該晶片不僅適用於語言處理,還適用於其他應用。
架構優勢的重要性
AMD 的架構決策在觀察到的效能差異中起著至關重要的作用。
整合式顯示晶片 (RDNA 3.5):
強大的整合式顯示單元是一個關鍵的差異化因素。與傳統的整合式顯示解決方案(通常難以應付要求嚴苛的工作負載)不同,RDNA 3.5 架構顯著提升了效能,使 Ryzen AI Max+ 395 能夠更有效地處理 AI 任務。40 個 CU 代表了強大的運算能力。
核心數量:
較高的核心數量(比 Core Ultra 7 258V 多八個核心)在多執行緒工作負載中提供了普遍優勢。雖然 AI 處理通常嚴重依賴 GPU,但 CPU 仍然在管理任務和處理運算的某些方面發揮作用。
可配置的 TDP:
較高的 TDP 允許在電源管理方面具有更大的靈活性。雖然這確實意味著更高的功耗,但它也使晶片能夠以更高的時脈速度運行並維持更長時間的效能,尤其是在要求嚴苛的 AI 工作負載中。能夠將 TDP 配置為最高 120W,這比 Core Ultra 7 258V 更受限制的 37W 最大渦輪功率提供了顯著優勢。這是實現觀察到的效能領先的關鍵因素。
行動運算領域:不斷變化的戰場
近年來,AMD 和 Intel 在行動領域的競爭日益激烈,兩家公司都在推動效能和效率的極限。Lunar Lake 的推出代表了 Intel 對電源效率的關注,而 AMD 的 Ryzen AI Max+ 395 顯然優先考慮效能,尤其是在 AI 工作負載方面。
與 NVIDIA RTX 50 系列行動 GPU 的即將到來的戰鬥將是對 AMD 的重大考驗。雖然 NVIDIA 傳統上主導著高階行動顯示卡市場,但 AMD 在整合式顯示卡和 AI 處理能力方面的進步使其成為強有力的競爭者。據報導,NVIDIA 面臨的供應鏈問題可能會讓 AMD 在可用性和市場滲透率方面佔據優勢。
聲稱 AI 效能優於 RTX 4090 筆記型電腦 GPU 是大膽的,但如果得到證實,這將代表競爭格局的重大轉變。這將表明 AMD 的整合解決方案可以在某些以 AI 為中心的應用程式中與獨立顯示卡解決方案競爭,甚至可能超越它們。這將是一項重大成就,並可能對行動運算的未來產生重大影響。對 AI 效能的強調清楚地表明了該行業的發展方向。隨著 AI 越來越多地整合到日常應用程式中,對能夠高效且有效地處理這些工作負載的處理器的需求將持續增長。