Blackwell Ultra GB300: Bước Nhảy Vọt về Hiệu Suất
Dự kiến ra mắt vào nửa cuối năm 2025, Blackwell Ultra GB300 đại diện cho một bước tiến đáng kể so với các sản phẩm trước đây của NVIDIA. Siêu chip mới này được thiết kế để cung cấp sức mạnh tính toán nâng cao và tăng băng thông bộ nhớ, rất quan trọng để đáp ứng nhu cầu ngày càng tăng của các ứng dụng AI hiện đại.
Hệ thống GB300 là một “cỗ máy” mạnh mẽ, tích hợp 72 GPU NVIDIA Blackwell Ultra và 36 CPU NVIDIA Grace dựa trên nền tảng Arm. Sự kết hợp này mang lại hiệu suất FP4 AI ấn tượng 1.400 petaFLOPS. Để dễ hình dung, đó là mức tăng 1,5 lần khả năng tính toán FP4 dày đặc so với phiên bản tiền nhiệm, Blackwell B200.
Một trong những nâng cấp quan trọng nhất trong GB300 là dung lượng bộ nhớ. Mỗi GPU trong hệ thống được trang bị bộ nhớ HBM3e 288GB đáng kinh ngạc. Điều này tương đương với tổng cộng hơn 20TB bộ nhớ GPU cho mỗi hệ thống. Sự gia tăng đáng kể về bộ nhớ này cho phép xử lý các mô hình và tập dữ liệu AI lớn hơn nhiều, cho phép tính toán phức tạp hơn và đạt được tốc độ xử lý nhanh hơn.
NVIDIA đang định vị Blackwell Ultra AI Factory Platform là cung cấp mức tăng hiệu suất tăng dần, thay vì mang tính cách mạng, so với các chip Blackwell tiêu chuẩn. Mặc dù một chip Ultra duy nhất duy trì cùng 20 petaflops tính toán AI như Blackwell tiêu chuẩn, nhưng nó được hưởng lợi đáng kể từ việc tăng 50% bộ nhớ băng thông cao (HBM3e), tăng từ 192GB lên 288GB.
Xem xét quy mô lớn hơn, một “Superpod” DGX GB300 quy mô đầy đủ tiếp tục chứa 288 CPU và 576 GPU. Thiết lập này cung cấp 11,5 exaflops tính toán FP4, phản ánh hiệu suất của Superpod dựa trên Blackwell ban đầu. Tuynhiên, nó có tổng bộ nhớ tăng 25%, hiện đạt mức khổng lồ 300TB. Những cải tiến bộ nhớ này nhấn mạnh sự tập trung của NVIDIA vào việc đáp ứng các mô hình lớn hơn và nâng cao hiệu quả suy luận AI, thay vì chỉ tập trung vào sức mạnh tính toán thô.
Thay vì so sánh trực tiếp Blackwell với Blackwell Ultra, NVIDIA đang giới thiệu cách nền tảng mới nhất của họ so sánh với chip H100 thời 2022, vẫn được sử dụng rộng rãi trong khối lượng công việc AI. Công ty khẳng định rằng Blackwell Ultra cung cấp hiệu suất suy luận FP4 gấp 1,5 lần so với H100. Tuy nhiên, lợi thế đáng chú ý nhất nằm ở khả năng tăng tốc suy luận AI.
Ví dụ: một cụm NVL72 chạy DeepSeek-R1 671B, một mô hình ngôn ngữ lớn đặc biệt, giờ đây có thể tạo phản hồi chỉ trong mười giây. Đây là một sự giảm đáng kể so với 90 giây cần thiết trên hệ thống H100.
NVIDIA cho rằng sự cải thiện đáng kể này là do tốc độ xử lý token tăng gấp 10 lần. Blackwell Ultra có thể xử lý 1.000 token mỗi giây, một bước nhảy vọt đáng kể so với 100 token mỗi giây của H100. Những số liệu này chứng minh rằng mặc dù Blackwell Ultra có thể không vượt trội đáng kể so với phiên bản tiền nhiệm ngay lập tức, nhưng nó mang lại hiệu quả tăng đáng kể, đặc biệt đối với các tổ chức vẫn đang sử dụng kiến trúc thế hệ trước.
Siêu Chip Vera Rubin: Thế Hệ Xử Lý AI Tiếp Theo
Ngoài Blackwell Ultra, NVIDIA có kế hoạch giới thiệu siêu chip Vera Rubin vào cuối năm 2026. Được đặt tên để vinh danh nhà thiên văn học nổi tiếng Vera Rubin, chip này sẽ kết hợp CPU (Vera) và GPU (Rubin) được thiết kế tùy chỉnh. Điều này thể hiện một bước tiến quan trọng trong việc theo đuổi khả năng xử lý AI tiên tiến của NVIDIA.
CPU Vera, dựa trên kiến trúc Olympus của NVIDIA, được dự đoán sẽ mang lại hiệu suất gấp đôi so với CPU Grace hiện tại. Mặt khác, GPU Rubin sẽ hỗ trợ bộ nhớ băng thông cao lên tới 288GB ấn tượng. Dung lượng bộ nhớ đáng kể này sẽ tăng cường đáng kể khả năng xử lý dữ liệu, đặc biệt là đối với các tác vụ AI phức tạp.
Kiến trúc Vera Rubin thể hiện thiết kế GPU kép trên một khuôn duy nhất. Thiết kế sáng tạo này cho phép hiệu suất suy luận FP4 đáng kinh ngạc 50 petaFLOPS trên mỗi chip, thúc đẩy quá trình xử lý hiệu quả hơn và giảm độ trễ trong các ứng dụng AI.
CPU Vera, kế nhiệm CPU Grace, bao gồm 88 lõi Arm tùy chỉnh với đa luồng đồng thời. Cấu hình này dẫn đến 176 luồng trên mỗi socket. Nó cũng có giao diện NVLink core-to-core 1,8TB/s, cải thiện đáng kể tốc độ truyền dữ liệu giữa các thành phần CPU và GPU.
Blackwell Ultra GB300 và siêu chip Vera Rubin thể hiện những tiến bộ đáng kể so với kiến trúc chip trước đây của NVIDIA. Mức tăng 1,5 lần của GB300 trong tính toán FP4 dày đặc so với B200 chuyển trực tiếp thành xử lý khối lượng công việc AI hiệu quả hơn. Điều này, đến lượt nó, cho phép thời gian đào tạo và suy luận nhanh hơn, rất quan trọng để tăng tốc phát triển AI.
Vera Rubin, với hiệu suất 50 petaFLOPS FP4 trên mỗi chip, báo hiệu một bước nhảy vọt đáng kể. Mức hiệu suất này cho phép triển khai các mô hình và ứng dụng AI thậm chí còn phức tạp hơn, vượt qua ranh giới của những gì có thể trong lĩnh vực trí tuệ nhân tạo.
Dòng thời gian phát triển đầy tham vọng của NVIDIA, với kế hoạch phát hành hàng năm các thế hệ chip AI mới, nhấn mạnh sự cống hiến của họ trong việc duy trì vị trí hàng đầu trong thị trường phần cứng AI đang phát triển nhanh chóng. Cam kết đổi mới của công ty thể hiện rõ trong việc theo đuổi liên tục các giải pháp xử lý AI mạnh mẽ và hiệu quả hơn. Việc giới thiệu các siêu chip mới này không chỉ là về những cải tiến gia tăng; đó là về việc kích hoạt một kỷ nguyên mới của khả năng AI.
Những tiến bộ về dung lượng bộ nhớ và tốc độ xử lý là đặc biệt đáng chú ý. Khả năng xử lý các mô hình và tập dữ liệu lớn hơn là rất quan trọng cho sự phát triển của các hệ thống AI phức tạp hơn. Khi các mô hình AI tiếp tục phát triển về độ phức tạp, nhu cầu về phần cứng có thể theo kịp ngày càng trở nên quan trọng. Sự tập trung của NVIDIA vào băng thông bộ nhớ và tốc độ xử lý token trực tiếp giải quyết nhu cầu này.
Việc chuyển hướng sang nhấn mạnh hiệu quả tăng, đặc biệt đối với các tổ chức chuyển đổi từ kiến trúc cũ hơn, là một động thái chiến lược của NVIDIA. Nó thừa nhận rằng không phải tất cả người dùng sẽ ngay lập tức áp dụng phần cứng mới nhất. Bằng cách chứng minh những cải tiến hiệu suất đáng kể so với chip thế hệ trước, NVIDIA cung cấp một lý lẽ thuyết phục để nâng cấp.
Siêu chip Vera Rubin, với CPU và GPU được thiết kế tùy chỉnh, đại diện cho một tiến bộ kiến trúc đáng kể. Thiết kế GPU kép trên một khuôn duy nhất là một cách tiếp cận sáng tạo hứa hẹn mang lại hiệu quả hiệu suất đáng kể và giảm độ trễ. Thiết kế này phản ánh cam kết của NVIDIA trong việc vượt qua ranh giới của thiết kế chip và tối đa hóa hiệu suất.
Việc đặt tên chip theo tên nhà thiên văn học Vera Rubin là một sự tôn vinh phù hợp với công trình đột phá của bà. Nó cũng ngầm củng cố cam kết của NVIDIA đối với khám phá và đổi mới khoa học. Sự tập trung của công ty vào AI vượt ra ngoài các ứng dụng thương mại; nó cũng bao gồm sự tiến bộ của nghiên cứu khoa học.
Nhìn chung, thông báo của NVIDIA về siêu chip Blackwell Ultra GB300 và Vera Rubin đánh dấu một cột mốc quan trọng trong sự phát triển của phần cứng AI. Các chip mới này đã sẵn sàng để tăng tốc độ phát triển và triển khai AI trên một loạt các ngành công nghiệp. Cam kết đổi mới của công ty và dòng thời gian phát triển tích cực cho thấy rằng chúng ta có thể mong đợi những tiến bộ đột phá hơn nữa trong những năm tới. Việc tập trung vào cả hiệu suất thô và hiệu quả tăng đảm bảo rằng các chip này sẽ phù hợp với nhiều đối tượng người dùng, từ những người có hệ thống tiên tiến đến những người vẫn đang sử dụng kiến trúc cũ hơn. Tương lai của phần cứng AI có vẻ tươi sáng và NVIDIA rõ ràng đang định vị mình ở vị trí hàng đầu trong lĩnh vực thú vị này. Bộ nhớ tăng, tốc độ xử lý nâng cao và thiết kế sáng tạo của các siêu chip mới này chắc chắn sẽ mở đường cho những đột phá mới trong trí tuệ nhân tạo, tác động đến các lĩnh vực khác nhau và thúc đẩy những tiến bộ hơn nữa trong những năm tới.