Ryzen AI 395+ vượt trội so với Lunar Lake

Đối đầu trực tiếp: Ryzen AI Max+ 395 vs. Core Ultra 7 258V

Để chứng minh sức mạnh của Ryzen AI Max+ 395, AMD đã tiến hành một loạt các bài kiểm tra, so sánh nó với Core Ultra 7 258V của Intel (được trang bị đồ họa Arc 140V). Các bài kiểm tra tập trung vào các mô hình ngôn ngữ lớn (LLM) và cấu hình LLM khác nhau, bao gồm các mô hình nổi bật như DeepSeek R1 và Llama.

Lưu ý về cấu hình bộ nhớ:

Để đảm bảo so sánh công bằng, kích thước mô hình được giới hạn ở 16GB. Hạn chế này được áp dụng để tính đến giới hạn bộ nhớ của máy tính xách tay chạy Lunar Lake, hiện có sẵn với bộ nhớ tối đa 32GB. Các hệ thống thử nghiệm được sử dụng là:

  • Ryzen AI Max+ 395: Asus ROG Flow Z13 với 64GB bộ nhớ.
  • Core Ultra 7 258V: Asus Zenbook S14 với 32GB bộ nhớ.

Hiệu suất DeepSeek R1: Dẫn đầu đáng kể

Trong các bài kiểm tra DeepSeek R1, chip Ryzen đã thể hiện sự dẫn đầu vượt trội. Kết quả, được đo bằng số token mỗi giây, như sau:

  • Distill Qwen 1.5b: Nhanh hơn tới 2.1 lần so với đối thủ Intel.
  • Distill Qwen 7b: Nhanh hơn tới 2.2 lần.
  • Distill Llama 8b: Nhanh hơn tới 2.1 lần.
  • Distill Qwen 14b: Nhanh hơn tới 2.2 lần.

Điểm chuẩn Phi 4 và Llama 3.2: Duy trì sự thống trị

Ryzen AI Max+ 395 tiếp tục vượt trội hơn Core Ultra 7 258V trong các bài kiểm tra sử dụng mô hình Phi 4 và Llama 3.2:

  • Phi 4 Mini Instruct 3.8b: Nhanh hơn tới 2.1 lần.
  • Phi 4 14b: Nhanh hơn tới 2.2 lần.
  • Llama 3.2 3b Instruct: Nhanh hơn tới 2.1 lần.

Thời gian đến Token đầu tiên: Một chỉ số quan trọng

AMD cũng tập trung vào chỉ số ‘thời gian đến token đầu tiên’, một chỉ số quan trọng về khả năng phản hồi trong các ứng dụng AI. Trong các bài kiểm tra này, Ryzen AI Max+ 395 đã thể hiện sự dẫn đầu thậm chí còn đáng kể hơn:

  • DeepSeek R1 Distill Qwen 14b: Nhanh hơn tới 12.2 lần.
  • Ngay cả trong những trường hợp mà lợi thế hiệu suất của chip Zen 5 ít rõ rệt nhất (Phi 4 Mini Instruct 3.8b và Llama 3.2 3b Instruct), chip AMD vẫn duy trì lợi thế tốc độ gấp 4 lần so với Core Ultra 7 258V.

Mô hình AI Vision: Tiếp tục mở rộng vị trí dẫn đầu

Sự thống trị về hiệu suất của Ryzen AI Max+ 395 đã mở rộng sang các mô hình AI vision, một lần nữa sử dụng phương pháp đo điểm chuẩn ‘thời gian đến token đầu tiên’:

  • IBM Granite Vision 3.2 2B: Nhanh hơn tới 7 lần so với 258V.
  • Google Gemma 3.4b: Nhanh hơn tới 4.6 lần.
  • Google Gemma 3 12b: Nhanh hơn tới 6 lần.

Ưu điểm kiến trúc: Nguồn gốc của hiệu suất vượt trội

Các số liệu hiệu suất ấn tượng được thể hiện bởi Ryzen AI Max+ 395 của AMD phần lớn là nhờ một số ưu điểm kiến trúc chính:

  • Đồ họa tích hợp mạnh mẽ: Chip đồ họa tích hợp trong CPU Ryzen AI Max tự hào có 40 đơn vị tính toán (CU) RDNA 3.5, cung cấp hiệu suất ngang ngửa với các giải pháp đồ họa rời.
  • Số lượng lõi cao hơn: Ryzen AI Max+ 395 có nhiều hơn tám lõi CPU so với Core Ultra 7 258V, góp phần tăng cường khả năng xử lý.
  • TDP có thể định cấu hình: Chip Ryzen có TDP (Công suất thiết kế nhiệt) có thể định cấu hình cao hơn đáng kể, được đánh giá lên tới 120W, cho phép khoảng không hiệu suất lớn hơn.

Cân nhắc về mức tiêu thụ điện năng:

Điều quan trọng cần thừa nhận là Ryzen AI Max+ 395 tiêu thụ nhiều điện năng hơn đáng kể so với Core Ultra 7 258V, có công suất turbo tối đa là 37W. Tuy nhiên, bất chấp sự khác biệt này, cả hai chip đều nhắm mục tiêu cùng phân khúc thị trường và được thiết kế cho máy tính xách tay mỏng và nhẹ.

Hướng tới tương lai: Cạnh tranh với dòng RTX 50 của NVIDIA

Bối cảnh điện toán di động không ngừng phát triển và thách thức tiếp theo đối với các APU di động mới của AMD có thể sẽ đến từ GPU di động dòng RTX 50 của NVIDIA. Mặc dù các báo cáo cho thấy các vấn đề tiềm ẩn về chuỗi cung ứng và sự chậm trễ trong việc ra mắt các GPU này trong các máy tính xách tay chơi game dòng RTX 50 sắp tới, nhưng chúng chắc chắn sẽ đại diện cho đối thủ cạnh tranh chính của AMD về hiệu suất thô, bất kể sự khác biệt về hình thức.

Dấu hiệu ban đầu chống lại GPU rời:

Điều thú vị là AMD đã tuyên bố về hiệu suất AI vượt trội của Ryzen AI Max+ 395 so với GPU máy tính xách tay RTX 4090 của NVIDIA, cho thấy một vị thế cạnh tranh mạnh mẽ ngay cả với các giải pháp đồ họa rời. Đó là một tuyên bố phủ đầu, và một tuyên bố chắc chắn sẽ khiến những người đang chờ đợi các bài đánh giá độc lập rất phấn khích.

Tìm hiểu sâu hơn về kết quả Benchmark

Dữ liệu điểm chuẩn được cung cấp vẽ nên một bức tranh rõ ràng về sự tập trung của AMD vào hiệu suất AI. Việc lựa chọn các mô hình và cấu hình làm nổi bật tầm quan trọng ngày càng tăng của việc xử lý AI hiệu quả và đáp ứng trong các tác vụ điện toán hiện đại.

Mô hình ngôn ngữ lớn (LLM):

Việc sử dụng DeepSeek R1 và Llama, hai LLM nổi bật, thể hiện khả năng của Ryzen AI Max+ 395 trong việc xử lý các tác vụ xử lý ngôn ngữ tự nhiên phức tạp. Số liệu ‘token mỗi giây’ là thước đo hiệu suất tiêu chuẩn trong lĩnh vực này, cho biết bộ xử lý có thể tạo văn bản hoặc xử lý đầu vào dựa trên ngôn ngữ nhanh như thế nào.

Distillation (Chưng cất):

Việc bao gồm các phiên bản ‘Distill’ của các mô hình (ví dụ: Distill Qwen 1.5b) cho thấy sự tập trung vào hiệu quả của mô hình. Distillation là một kỹ thuật được sử dụng để tạo ra các phiên bản nhỏ hơn, nhanh hơn của các mô hình lớn hơn trong khi vẫn giữ được phần lớn độ chính xác của chúng. Điều này đặc biệt phù hợp với các thiết bị di động, nơi tiêu thụ điện năng và hạn chế bộ nhớ là rất quan trọng.

Phi 4 và Llama 3.2:

Việc bổ sung các mô hình Phi 4 và Llama 3.2 cung cấp một góc nhìn rộng hơn về hiệu suất của chip trên các kiến trúc AI và kích thước mô hình khác nhau.

Thời gian đến Token đầu tiên (TTFT):

Sự nhấn mạnh vào ‘thời gian đến token đầu tiên’ là đặc biệt đáng chú ý. TTFT đo độ trễ giữa đầu vào của người dùng và phản hồi ban đầu từ mô hình AI. TTFT thấp hơn chuyển thành trải nghiệm người dùng tương tác và nhạy bén hơn, điều này rất quan trọng đối với các ứng dụng như chatbot, dịch thuật thời gian thực và hoàn thành mã.

Mô hình AI Vision:

Việc bao gồm các mô hình AI vision (IBM Granite Vision và Google Gemma) thể hiện tính linh hoạt của Ryzen AI Max+ 395. Các mô hình này được sử dụng cho các tác vụ như nhận dạng hình ảnh, phát hiện đối tượng và phân tích video. Hiệu suất mạnh mẽ trong các bài kiểm tra này cho thấy sự phù hợp của chip đối với các ứng dụng ngoài việc xử lý ngôn ngữ.

Tầm quan trọng của lợi thế kiến trúc

Các quyết định kiến trúc của AMD đóng một vai trò quan trọng trong sự khác biệt hiệu suất quan sát được.

Đồ họa tích hợp (RDNA 3.5):

Đơn vị đồ họa tích hợp mạnh mẽ là một yếu tố khác biệt chính. Không giống như các giải pháp đồ họa tích hợp truyền thống, thường gặp khó khăn với khối lượng công việc đòi hỏi khắt khe, kiến trúc RDNA 3.5 cung cấp một sự gia tăng đáng kể về hiệu suất, cho phép Ryzen AI Max+ 395 xử lý các tác vụ AI hiệu quả hơn. 40 CU đại diện cho một khả năng tính toán đáng kể.

Số lượng lõi:

Số lượng lõi cao hơn (nhiều hơn tám lõi so với Core Ultra 7 258V) mang lại lợi thế chung trong khối lượng công việc đa luồng. Mặc dù xử lý AI thường phụ thuộc nhiều vào GPU, CPU vẫn đóng một vai trò trong việc quản lý các tác vụ và xử lý các khía cạnh nhất định của tính toán.

TDP có thể định cấu hình:

TDP cao hơn cho phép linh hoạt hơn trong quản lý năng lượng. Mặc dù nó có nghĩa là tiêu thụ điện năng cao hơn, nhưng nó cũng cho phép chip hoạt động ở tốc độ xung nhịp cao hơn và duy trì hiệu suất trong thời gian dài hơn, đặc biệt là trong khối lượng công việc AI đòi hỏi khắt khe. Khả năng định cấu hình TDP lên tới 120W mang lại lợi thế đáng kể so với công suất turbo tối đa 37W hạn chế hơn của Core Ultra 7 258V. Đây là một yếu tố quan trọng để đạt được vị trí dẫn đầu về hiệu suất đã quan sát được.

Bối cảnh điện toán di động: Một chiến trường thay đổi

Sự cạnh tranh giữa AMD và Intel trong không gian di động đã gia tăng trong những năm gần đây, với cả hai công ty đều thúc đẩy ranh giới của hiệu suất và hiệu quả. Sự ra đời của Lunar Lake thể hiện sự tập trung của Intel vào hiệu quả sử dụng năng lượng, trong khi Ryzen AI Max+ 395 của AMD rõ ràng ưu tiên hiệu suất, đặc biệt là trong khối lượng công việc AI.

Trận chiến sắp tới với GPU di động dòng RTX 50 của NVIDIA sẽ là một bài kiểm tra quan trọng đối với AMD. Trong khi NVIDIA có truyền thống thống trị thị trường đồ họa di động cao cấp, những tiến bộ của AMD trong đồ họa tích hợp và khả năng xử lý AI đã định vị nó như một đối thủ cạnh tranh mạnh mẽ. Các vấn đề về chuỗi cung ứng được báo cáo mà NVIDIA phải đối mặt có thể mang lại cho AMD lợi thế về tính khả dụng và thâm nhập thị trường.

Những tuyên bố về hiệu suất AI vượt trội so với GPU máy tính xách tay RTX 4090 là táo bạo, nhưng nếu được chứng minh, chúng sẽ thể hiện một sự thay đổi đáng kể trong bối cảnh cạnh tranh. Nó sẽ chỉ ra rằng giải pháp tích hợp của AMD có thể cạnh tranh với và có khả năng vượt trội hơn các giải pháp đồ họa rời trong các ứng dụng tập trung vào AI nhất định. Đây sẽ là một thành tựu lớn và có thể có ý nghĩa quan trọng đối với tương lai của điện toán di động. Sự nhấn mạnh vào hiệu suất AI là một dấu hiệu rõ ràng về hướng đi của ngành. Khi AI ngày càng được tích hợp vào các ứng dụng hàng ngày, nhu cầu về bộ xử lý có thể xử lý các khối lượng công việc này một cách hiệu quả và hiệu quả sẽ tiếp tục tăng.