Ryzen AI MAX+ 395: Đỉnh cao AI mới | vi

Định nghĩa lại hiệu năng trong Laptop mỏng và nhẹ

Ryzen AI MAX+ 395 được xây dựng trên nền tảng công nghệ tiên tiến. Trái tim của nó là các lõi CPU ‘Zen 5’ của AMD, cung cấp một nền tảng xử lý mạnh mẽ và hiệu quả. Tuy nhiên, sự đổi mới thực sự nằm ở việc tích hợp Bộ xử lý thần kinh (NPU) XDNA 2, tự hào với hơn 50 TOPS (Nghìn tỷ hoạt động mỗi giây) AI cao nhất. Công cụ AI chuyên dụng này, kết hợp với GPU tích hợp dựa trên kiến trúc RDNA 3.5 của AMD (có 40 Đơn vị tính toán), biến đổi tiềm năng của máy tính xách tay mỏng và nhẹ cao cấp.

Sự kết hợp mạnh mẽ này cho phép cấu hình bộ nhớ chưa từng có, từ 32GB đến 128GB bộ nhớ thống nhất đáng kinh ngạc. Một tính năng chính, AMD Variable Graphics Memory (VGM), cho phép phân bổ động tối đa 96GB bộ nhớ thống nhất này làm VRAM. Tính linh hoạt này rất quan trọng để xử lý khối lượng công việc AI đòi hỏi, thường yêu cầu tài nguyên bộ nhớ đáng kể.

Đưa AI đến với người tiêu dùng: Sức mạnh của LLM cục bộ

Trọng tâm của AMD vượt ra ngoài sức mạnh xử lý thô; đó là về việc trao quyền cho người dùng khai thác tiềm năng của AI trong các ứng dụng thực tế, hàng ngày. Một ví dụ điển hình là hỗ trợ cho các ứng dụng llama.cpp như LM Studio. Phần mềm này hoạt động như một cửa ngõ, cho phép người dùng chạy các mô hình ngôn ngữ lớn (LLM) trực tiếp trên máy tính xách tay của họ mà không yêu cầu chuyên môn kỹ thuật chuyên ngành. Việc dân chủ hóa công nghệ AI này mở ra khả năng cho người dùng thử nghiệm và triển khai các mô hình văn bản và tầm nhìn AI mới một cách dễ dàng.

Điểm chuẩn thống trị: Hiệu suất thực tế tăng

Điểm chuẩn nội bộ của AMD vẽ nên một bức tranh hấp dẫn về khả năng của Ryzen AI MAX+ 395. Thử nghiệm được tiến hành bằng máy tính xách tay ASUS ROG Flow Z13 được trang bị 64GB bộ nhớ thống nhất và GPU Radeon 8060S tích hợp. Kết quả cho thấy lợi thế hiệu suất đáng kể so với máy tính xách tay có card đồ họa Intel Arc 140V.

Về thông lượng token – thước đo tốc độ LLM có thể tạo văn bản – Ryzen AI MAX+ 395 đã chứng minh cải thiện gấp 2,2 lần. Các thử nghiệm này được thiết kế cẩn thận để đảm bảo khả năng tương thích với các máy tính xách tay cạnh tranh, tập trung vào các LLM có thể hoạt động trong phạm vi bộ nhớ 16GB (phổ biến cho máy tính xách tay có 32GB bộ nhớ trên gói).

Lợi thế hiệu suất này không giới hạn ở các loại mô hình cụ thể. Nó vẫn nhất quán trên một loạt các LLM, bao gồm:

Mô hình chuỗi suy nghĩ (Chain-of-thought): như DeepSeek R1 Distills.
Mô hình tiêu chuẩn: chẳng hạn như Microsoft Phi 4.
Kích thước tham số khác nhau: thể hiện tính linh hoạt trên các độ phức tạp mô hình khác nhau.

Định nghĩa lại khả năng phản hồi: Thời gian đến Token đầu tiên

Ngoài thông lượng thô, khả năng phản hồi của mô hình AI rất quan trọng đối với trải nghiệm người dùng mượt mà và tương tác. Đây là nơi số liệu “thời gian đến token đầu tiên” phát huy tác dụng, cho biết tốc độ mô hình bắt đầu tạo đầu ra sau khi nhận đầu vào.

Ryzen AI MAX+ 395 đã thể hiện mức tăng thậm chí còn ấn tượng hơn trong lĩnh vực này:

Mô hình nhỏ hơn (ví dụ: Llama 3.2 3b Instruct): Nhanh hơn tới bốn lần so với đối thủ cạnh tranh.
Mô hình 7 tỷ và 8 tỷ tham số lớn hơn (ví dụ: DeepSeek R1 Distill Qwen 7b, DeepSeek R1 Distill Llama 8b): Tốc độ tăng cao tới 9,1 lần.
Mô hình 14 tỷ tham số: ASUS ROG Flow Z13, được trang bị Ryzen AI MAX+ 395, được cho là nhanh hơn tới 12,2 lần so với máy tính xách tay có bộ xử lý Intel Core Ultra 258V.

Những số liệu này làm nổi bật một bước nhảy vọt đáng kể trong khả năng tương tác của các mô hình AI trên máy tính xách tay, cho phép phản hồi gần như tức thời và trải nghiệm người dùng trôi chảy hơn.

Vượt ra ngoài văn bản: Giải phóng sức mạnh của AI đa phương thức

Khả năng của Ryzen AI MAX+ 395 vượt ra ngoài các LLM dựa trên văn bản. Nó cũng vượt trội trong việc xử lý các mô hình đa phương thức, kết hợp khả năng thị giác cùng với xử lý văn bản. Các mô hình này có thể phân tích hình ảnh và cung cấp phản hồi dựa trên nội dung hình ảnh của chúng, mở ra một loạt các ứng dụng mới.

AMD đã trình bày dữ liệu cho thấy hiệu suất của bộ xử lý với các mô hình như:

IBM Granite Vision: Nhanh hơn tới bảy lần trong IBM Granite Vision 3.2 3b.
Google Gemma 3: Nhanh hơn tới 4,6 lần trong Google Gemma 3 4b và nhanh hơn tới sáu lần trong Google Gemma 3 12b.

Đáng chú ý, ASUS ROG Flow Z13 với 64GB bộ nhớ thậm chí còn có thể chạy mô hình Google Gemma 3 27B Vision lớn hơn, chứng tỏ khả năng của nền tảng trong việc xử lý cả khối lượng công việc đa phương thức đòi hỏi khắt khe nhất.

Ứng dụng thực tế: Từ chẩn đoán y tế đến tạo mã

Ý nghĩa thực tế của những tiến bộ này là rất sâu rộng. Một cuộc trình diễn đã cho thấy tiềm năng của các mô hình thị giác trong chẩn đoán y tế, trong đó một mô hình đã phân tích hình ảnh CT scan, xác định các cơ quan và đưa ra chẩn đoán. Điều này làm nổi bật tiềm năng của AI trong việc hỗ trợ các chuyên gia chăm sóc sức khỏe đưa ra các đánh giá nhanh hơn, chính xác hơn.

Một ứng dụng hấp dẫn khác nằm trong việc tạo mã. AMD đã chứng minh khả năng chạy các mô hình ngôn ngữ lớn như DeepSeek R1 Distill Qwen 32b (ở độ chính xác 6 bit) để viết mã một trò chơi đơn giản như Pong trong một khoảng thời gian ngắn đáng kể. Điều này cho thấy tiềm năng của AI trong việc tăng tốc phát triển phần mềm và trao quyền cho các nhà phát triển bằng các công cụ hỗ trợ mã hóa mạnh mẽ.

Tối ưu hóa hiệu suất: Giải phóng toàn bộ tiềm năng

Để đạt được hiệu suất tối ưu với khối lượng công việc LLM trên máy tính xách tay được trang bị bộ xử lý Ryzen AI 300 series, AMD cung cấp các khuyến nghị cụ thể:

Cập nhật trình điều khiển: Đảm bảo bạn đã cài đặt trình điều khiển AMD Software: Adrenalin Edition mới nhất. Trình điều khiển này rất quan trọng để kích hoạt các tính năng và tối ưu hóa mới nhất.
Variable Graphics Memory (VGM): Bật VGM và đặt thành ‘High’. Điều này cho phép hệ thống phân bổ động bộ nhớ cho đồ họa tích hợp, tăng thông lượng token và cho phép sử dụng các mô hình AI lớn hơn.
Cài đặt LM Studio: Trong LM Studio, chọn thủ công các tham số và đặt ‘GPU Offload’ thành ‘MAX’. Điều này đảm bảo rằng GPU được sử dụng đầy đủ cho quá trình xử lý AI.
Lượng tử hóa (Quantization):
- Để sử dụng chung, AMD đề xuất lượng tử hóa Q4 K M.
- Đối với các tác vụ mã hóa, nên sử dụng lượng tử hóa Q6 hoặc Q8.

Bằng cách làm theo các khuyến nghị này, người dùng có thể mở khóa toàn bộ tiềm năng của máy tính xách tay hỗ trợ Ryzen AI của họ và trải nghiệm sức mạnh biến đổi của các mô hình AI tiên tiến.

Một nền tảng cho tương lai của AI

Về bản chất, bộ xử lý AMD Ryzen AI MAX+ 395 đại diện cho nhiều thứ hơn là chỉ nâng cấp hiệu suất. Đó là một nền tảng trao quyền cho người dùng trải nghiệm công nghệ AI tiên tiến ở dạng di động và có thể truy cập được. Cho dù đó là để chơi game, làm việc hay khám phá thế giới AI đang phát triển nhanh chóng, bộ xử lý này nhằm mục đích xác định lại những gì có thể có trên máy tính xách tay mỏng và nhẹ. Nó mở ra những cánh cửa cho những khả năng mới, trao quyền cho người dùng tương tác với các mô hình AI theo những cách mà trước đây không thể tưởng tượng được trên các thiết bị di động như vậy. Sự tập trung vào tính thân thiện với người dùng, kết hợp với sức mạnh xử lý thô, định vị Ryzen AI MAX+ 395 là một bước tiến quan trọng hướng tới một tương lai nơi AI được tích hợp liền mạch vào cuộc sống hàng ngày của chúng ta.

cập nhật lúc 2025-03-20

# AIGC # AMD # Llama