การเปรียบเทียบ: Ryzen AI Max+ 395 กับ Core Ultra 7 258V
เพื่อแสดงให้เห็นถึงความสามารถของ Ryzen AI Max+ 395, AMD ได้ทำการทดสอบหลายชุด โดยเปรียบเทียบกับ Intel’s Core Ultra 7 258V (ที่ติดตั้ง Arc 140V graphics) การทดสอบมุ่งเน้นไปที่ large language models (LLMs) และการกำหนดค่า LLM ต่างๆ รวมถึงโมเดลที่โดดเด่น เช่น DeepSeek R1 และ Llama
หมายเหตุเกี่ยวกับการกำหนดค่าหน่วยความจำ:
เพื่อให้แน่ใจว่าการเปรียบเทียบเป็นธรรม ขนาดของโมเดลจึงถูกจำกัดไว้ที่ 16GB ข้อจำกัดนี้ถูกนำมาใช้เพื่อพิจารณาถึงข้อจำกัดด้านหน่วยความจำของแล็ปท็อปที่ขับเคลื่อนด้วย Lunar Lake ซึ่งปัจจุบันมีหน่วยความจำสูงสุด 32GB ระบบทดสอบที่ใช้คือ:
- Ryzen AI Max+ 395: Asus ROG Flow Z13 พร้อมหน่วยความจำ 64GB
- Core Ultra 7 258V: Asus Zenbook S14 พร้อมหน่วยความจำ 32GB
ประสิทธิภาพ DeepSeek R1: ความได้เปรียบที่สำคัญ
ในการทดสอบ DeepSeek R1 ชิป Ryzen แสดงให้เห็นถึงความเป็นผู้นำที่โดดเด่น ผลลัพธ์ที่วัดเป็นโทเค็นต่อวินาที มีดังนี้:
- Distill Qwen 1.5b: เร็วกว่าคู่แข่ง Intel ถึง 2.1 เท่า
- Distill Qwen 7b: เร็วกว่า 2.2 เท่า
- Distill Llama 8b: เร็วกว่า 2.1 เท่า
- Distill Qwen 14b: เร็วกว่า 2.2 เท่า
การทดสอบ Phi 4 และ Llama 3.2: รักษาความเป็นผู้นำ
Ryzen AI Max+ 395 ยังคงมีประสิทธิภาพเหนือกว่า Core Ultra 7 258V ในการทดสอบโดยใช้โมเดล Phi 4 และ Llama 3.2:
- Phi 4 Mini Instruct 3.8b: เร็วกว่า 2.1 เท่า
- Phi 4 14b: เร็วกว่า 2.2 เท่า
- Llama 3.2 3b Instruct: เร็วกว่า 2.1 เท่า
เวลาถึงโทเค็นแรก: ตัวชี้วัดที่สำคัญ
AMD ยังมุ่งเน้นไปที่ตัวชี้วัด “เวลาถึงโทเค็นแรก” ซึ่งเป็นตัวบ่งชี้ที่สำคัญของการตอบสนองในแอปพลิเคชัน AI ในการทดสอบเหล่านี้ Ryzen AI Max+ 395 แสดงให้เห็นถึงความได้เปรียบที่มากยิ่งขึ้น:
- DeepSeek R1 Distill Qwen 14b: เร็วกว่าถึง 12.2 เท่า
- แม้ในสถานการณ์ที่ความได้เปรียบด้านประสิทธิภาพของชิป Zen 5 น้อยที่สุด (Phi 4 Mini Instruct 3.8b และ Llama 3.2 3b Instruct) ชิป AMD ก็ยังคงรักษาความเร็วที่เหนือกว่า Core Ultra 7 258V ถึง 4 เท่า
โมเดล AI Vision: ขยายความได้เปรียบ
ความโดดเด่นด้านประสิทธิภาพของ Ryzen AI Max+ 395 ขยายไปถึงโมเดล AI vision โดยใช้แนวทางการทดสอบ “เวลาถึงโทเค็นแรก” อีกครั้ง:
- IBM Granite Vision 3.2 2B: เร็วกว่า 258V ถึง 7 เท่า
- Google Gemma 3.4b: เร็วกว่า 4.6 เท่า
- Google Gemma 3 12b: เร็วกว่า 6 เท่า
ข้อได้เปรียบทางสถาปัตยกรรม: ที่มาของประสิทธิภาพที่เหนือกว่า
ตัวเลขประสิทธิภาพที่น่าประทับใจที่แสดงโดย Ryzen AI Max+ 395 ของ AMD ส่วนใหญ่มาจากข้อได้เปรียบทางสถาปัตยกรรมที่สำคัญหลายประการ:
- กราฟิกในตัวที่ทรงพลัง: ชิปกราฟิกในตัวภายใน Ryzen AI Max CPU มี 40 RDNA 3.5 compute units (CUs) ให้ประสิทธิภาพที่เทียบเท่ากับโซลูชันกราฟิกแบบแยก
- จำนวนคอร์ที่สูงกว่า: Ryzen AI Max+ 395 มีคอร์ CPU มากกว่า Core Ultra 7 258V ถึงแปดคอร์ ซึ่งมีส่วนช่วยเพิ่มความสามารถในการประมวลผล
- TDP ที่กำหนดค่าได้: ชิป Ryzen มี TDP (Thermal Design Power) ที่กำหนดค่าได้สูงกว่าอย่างมาก โดยมีพิกัดสูงสุด 120W ทำให้มี headroom ประสิทธิภาพที่มากขึ้น
ข้อควรพิจารณาเกี่ยวกับการใช้พลังงาน:
สิ่งสำคัญคือต้องรับทราบว่า Ryzen AI Max+ 395 ใช้พลังงานมากกว่า Core Ultra 7 258V อย่างมาก ซึ่งมีกำลังไฟเทอร์โบสูงสุด 37W อย่างไรก็ตาม แม้จะมีความแตกต่างนี้ ชิปทั้งสองก็มุ่งเป้าไปที่กลุ่มตลาดเดียวกันและได้รับการออกแบบมาสำหรับแล็ปท็อปพีซีที่บางและเบา
มองไปข้างหน้า: การแข่งขันกับ RTX 50-Series ของ NVIDIA
ภูมิทัศน์การประมวลผลแบบพกพามีการพัฒนาอย่างต่อเนื่อง และความท้าทายต่อไปสำหรับ APU แบบพกพาใหม่ของ AMD น่าจะมาจาก GPU แบบพกพา RTX 50-series ของ NVIDIA แม้ว่ารายงานจะแนะนำปัญหาห่วงโซ่อุปทานที่อาจเกิดขึ้นและความล่าช้าในการเปิดตัว GPU เหล่านี้ในแล็ปท็อปเกม RTX 50 series ที่กำลังจะมาถึง แต่ไม่ต้องสงสัยเลยว่า GPU เหล่านี้จะเป็นคู่แข่งหลักของ AMD ในแง่ของประสิทธิภาพดิบ โดยไม่คำนึงถึงความแตกต่างของฟอร์มแฟกเตอร์
ข้อบ่งชี้เบื้องต้นเมื่อเทียบกับ GPU แบบแยก:
ที่น่าสนใจคือ AMD ได้อ้างถึงประสิทธิภาพ AI ที่เหนือกว่าของ Ryzen AI Max+ 395 เมื่อเทียบกับ GPU แล็ปท็อป RTX 4090 ของ NVIDIA ซึ่งบ่งบอกถึงจุดยืนในการแข่งขันที่แข็งแกร่งแม้กระทั่งกับโซลูชันกราฟิกแบบแยก เป็นคำแถลงเชิงป้องกัน และเป็นคำแถลงที่แน่นอนว่าจะทำให้ผู้ที่รอคอยการรีวิวอิสระตื่นเต้นมาก
เจาะลึกผลการทดสอบ
ข้อมูลการทดสอบที่ให้มาแสดงให้เห็นภาพที่ชัดเจนของการมุ่งเน้นของ AMD ในด้านประสิทธิภาพ AI การเลือกโมเดลและการกำหนดค่าเน้นย้ำถึงความสำคัญที่เพิ่มขึ้นของการประมวลผล AI ที่มีประสิทธิภาพและตอบสนองได้ดีในงานคอมพิวเตอร์สมัยใหม่
Large Language Models (LLMs):
การใช้ DeepSeek R1 และ Llama ซึ่งเป็น LLM ที่โดดเด่นสองตัว แสดงให้เห็นถึงความสามารถของ Ryzen AI Max+ 395 ในการจัดการงานประมวลผลภาษาธรรมชาติที่ซับซ้อน เมตริก “โทเค็นต่อวินาที” เป็นหน่วยวัดประสิทธิภาพมาตรฐานในด้านนี้ ซึ่งบ่งชี้ว่าโปรเซสเซอร์สามารถสร้างข้อความหรือประมวลผลอินพุตตามภาษาได้เร็วเพียงใด
Distillation:
การรวมเวอร์ชัน “Distill” ของโมเดล (เช่น Distill Qwen 1.5b) บ่งบอกถึงการมุ่งเน้นไปที่ประสิทธิภาพของโมเดล Distillation เป็นเทคนิคที่ใช้ในการสร้างโมเดลขนาดใหญ่เวอร์ชันที่เล็กลงและเร็วขึ้น ในขณะที่ยังคงความแม่นยำไว้เป็นส่วนใหญ่ สิ่งนี้มีความเกี่ยวข้องอย่างยิ่งสำหรับอุปกรณ์พกพาที่การใช้พลังงานและข้อจำกัดด้านหน่วยความจำเป็นสิ่งสำคัญ
Phi 4 และ Llama 3.2:
การเพิ่มโมเดล Phi 4 และ Llama 3.2 ให้มุมมองที่กว้างขึ้นเกี่ยวกับประสิทธิภาพของชิปในสถาปัตยกรรม AI และขนาดโมเดลต่างๆ
Time to First Token (TTFT):
การเน้นที่ “เวลาถึงโทเค็นแรก” เป็นสิ่งที่น่าสังเกตเป็นพิเศษ TTFT วัดเวลาแฝงระหว่างอินพุตของผู้ใช้กับการตอบสนองเริ่มต้นจากโมเดล AI TTFT ที่ต่ำกว่าแปลเป็นประสบการณ์ผู้ใช้ที่ตอบสนองและโต้ตอบได้มากขึ้น ซึ่งมีความสำคัญอย่างยิ่งสำหรับแอปพลิเคชัน เช่น แชทบอท การแปลแบบเรียลไทม์ และการเติมโค้ดให้สมบูรณ์
โมเดล AI Vision:
การรวมโมเดล AI vision (IBM Granite Vision และ Google Gemma) แสดงให้เห็นถึงความสามารถรอบด้านของ Ryzen AI Max+ 395 โมเดลเหล่านี้ใช้สำหรับงานต่างๆ เช่น การจดจำภาพ การตรวจจับวัตถุ และการวิเคราะห์วิดีโอ ประสิทธิภาพที่แข็งแกร่งในการทดสอบเหล่านี้บ่งบอกถึงความเหมาะสมของชิปสำหรับแอปพลิเคชันนอกเหนือจากการประมวลผลภาษา
ความสำคัญของข้อได้เปรียบทางสถาปัตยกรรม
การตัดสินใจทางสถาปัตยกรรมของ AMD มีบทบาทสำคัญในความแตกต่างด้านประสิทธิภาพที่สังเกตได้
Integrated Graphics (RDNA 3.5):
หน่วยประมวลผลกราฟิกในตัวที่ทรงพลังเป็นตัวสร้างความแตกต่างที่สำคัญ แตกต่างจากโซลูชันกราฟิกในตัวแบบดั้งเดิม ซึ่งมักจะประสบปัญหากับเวิร์กโหลดที่มีความต้องการสูง สถาปัตยกรรม RDNA 3.5 ให้การเพิ่มประสิทธิภาพอย่างมาก ทำให้ Ryzen AI Max+ 395 สามารถจัดการงาน AI ได้อย่างมีประสิทธิภาพมากขึ้น 40 CUs แสดงถึงความสามารถในการคำนวณที่สำคัญ
จำนวนคอร์:
จำนวนคอร์ที่สูงกว่า (มากกว่า Core Ultra 7 258V แปดคอร์) ให้ข้อได้เปรียบโดยทั่วไปในเวิร์กโหลดแบบมัลติเธรด แม้ว่าการประมวลผล AI มักจะพึ่งพา GPU เป็นอย่างมาก แต่ CPU ก็ยังมีบทบาทในการจัดการงานและจัดการบางแง่มุมของการคำนวณ
TDP ที่กำหนดค่าได้:
TDP ที่สูงขึ้นช่วยให้มีความยืดหยุ่นในการจัดการพลังงานมากขึ้น แม้ว่าจะหมายถึงการใช้พลังงานที่สูงขึ้น แต่ก็ยังช่วยให้ชิปทำงานด้วยความเร็วสัญญาณนาฬิกาที่สูงขึ้นและรักษาประสิทธิภาพไว้ได้นานขึ้น โดยเฉพาะอย่างยิ่งในเวิร์กโหลด AI ที่มีความต้องการสูง ความสามารถในการกำหนดค่า TDP ได้สูงถึง 120W ให้ข้อได้เปรียบที่สำคัญเหนือพลังงานเทอร์โบสูงสุด 37W ที่จำกัดมากกว่าของ Core Ultra 7 258V นี่เป็นปัจจัยสำคัญในการบรรลุความเป็นผู้นำด้านประสิทธิภาพที่สังเกตได้
ภูมิทัศน์การประมวลผลแบบพกพา: สนามรบที่เปลี่ยนแปลง
การแข่งขันระหว่าง AMD และ Intel ในพื้นที่พกพาได้ทวีความรุนแรงขึ้นในช่วงไม่กี่ปีที่ผ่านมา โดยทั้งสองบริษัทต่างผลักดันขีดจำกัดของประสิทธิภาพและประสิทธิผล การเปิดตัว Lunar Lake แสดงถึงการมุ่งเน้นของ Intel ในด้านประสิทธิภาพการใช้พลังงาน ในขณะที่ Ryzen AI Max+ 395 ของ AMD ให้ความสำคัญกับประสิทธิภาพอย่างชัดเจน โดยเฉพาะอย่างยิ่งในเวิร์กโหลด AI
การต่อสู้ที่กำลังจะมาถึงกับ GPU แบบพกพา RTX 50-series ของ NVIDIA จะเป็นการทดสอบที่สำคัญสำหรับ AMD แม้ว่า NVIDIA จะครองตลาดกราฟิกพกพาระดับไฮเอนด์มาโดยตลอด แต่ความก้าวหน้าของ AMD ในด้านกราฟิกในตัวและความสามารถในการประมวลผล AI ทำให้ AMD เป็นคู่แข่งที่แข็งแกร่ง ปัญหาห่วงโซ่อุปทานที่รายงานซึ่ง NVIDIA เผชิญอยู่อาจทำให้ AMD ได้เปรียบในแง่ของความพร้อมใช้งานและการเจาะตลาด
การอ้างสิทธิ์ประสิทธิภาพ AI ที่เหนือกว่า GPU แล็ปท็อป RTX 4090 นั้นกล้าหาญ แต่หากได้รับการพิสูจน์แล้ว จะแสดงถึงการเปลี่ยนแปลงที่สำคัญในภูมิทัศน์การแข่งขัน มันจะบ่งบอกว่าโซลูชันแบบบูรณาการของ AMD สามารถแข่งขันกับ และอาจมีประสิทธิภาพเหนือกว่า โซลูชันกราฟิกแบบแยกในการใช้งานที่เน้น AI บางอย่าง นี่จะเป็นความสำเร็จครั้งสำคัญและอาจมีนัยสำคัญต่ออนาคตของการประมวลผลแบบพกพา การเน้นที่ประสิทธิภาพ AI เป็นข้อบ่งชี้ที่ชัดเจนถึงทิศทางที่อุตสาหกรรมกำลังมุ่งหน้าไป ในขณะที่ AI กลายเป็นส่วนหนึ่งของแอปพลิเคชันในชีวิตประจำวันมากขึ้น ความต้องการโปรเซสเซอร์ที่สามารถจัดการเวิร์กโหลดเหล่านี้ได้อย่างมีประสิทธิภาพและประสิทธิผลจะยังคงเติบโตต่อไป