Superchip Baru NVIDIA: Blackwell & Vera

Blackwell Ultra GB300: Lompatan dalam Performa

Diperkirakan akan dikirimkan pada paruh kedua tahun 2025, Blackwell Ultra GB300 merepresentasikan kemajuan yang cukup besar dibandingkan penawaran NVIDIA sebelumnya. Superchip baru ini direkayasa untuk menyediakan daya komputasi yang ditingkatkan dan bandwidth memori yang lebih tinggi, yang sangat penting untuk memenuhi tuntutan aplikasi AI modern yang terus berkembang.

Sistem GB300 adalah pembangkit tenaga listrik, mengintegrasikan 72 GPU NVIDIA Blackwell Ultra dan 36 CPU NVIDIA Grace berbasis Arm. Kombinasi ini menghasilkan 1.400 petaFLOPS kinerja FP4 AI yang mengesankan. Sebagai gambaran, itu adalah peningkatan 1,5 kali dalam kemampuan komputasi FP4 padat dibandingkan dengan pendahulunya, Blackwell B200.

Salah satu peningkatan paling signifikan dalam GB300 adalah kapasitas memorinya. Setiap GPU dalam sistem dilengkapi dengan memori HBM3e 288GB yang mengejutkan. Ini berarti total lebih dari 20TB memori GPU per sistem. Peningkatan substansial dalam memori ini memungkinkan pemrosesan model dan dataset AI yang jauh lebih besar, memungkinkan komputasi yang lebih kompleks dan mencapai kecepatan pemrosesan yang lebih cepat.

NVIDIA memposisikan Blackwell Ultra AI Factory Platform sebagai penawaran peningkatan, bukan revolusioner, dalam hal kinerja dibandingkan dengan chip Blackwell standar. Sementara satu chip Ultra mempertahankan 20 petaflops komputasi AI yang sama dengan Blackwell standar, ia mendapat manfaat signifikan dari peningkatan 50% dalam memori bandwidth tinggi (HBM3e), meningkat dari 192GB menjadi 288GB.

Memeriksa skala yang lebih besar, DGX GB300 ‘Superpod’ skala penuh terus menampung 288 CPU dan 576 GPU. Pengaturan ini menghasilkan 11,5 exaflops komputasi FP4, mencerminkan kinerja Superpod berbasis Blackwell asli. Namun, ia memiliki peningkatan 25% dalam total memori, sekarang mencapai 300TB yang sangat besar. Peningkatan memori ini menyoroti fokus NVIDIA pada mengakomodasi model yang lebih besar dan meningkatkan efisiensi penalaran AI, daripada hanya berfokus pada daya komputasi mentah.

Alih-alih perbandingan langsung Blackwell-ke-Blackwell Ultra, NVIDIA memamerkan bagaimana platform terbarunya dibandingkan dengan chip H100 era 2022, yang masih banyak digunakan dalam beban kerja AI. Perusahaan menegaskan bahwa Blackwell Ultra memberikan kinerja inferensi FP4 1,5 kali lipat dari H100. Namun, keuntungan yang paling luar biasa terletak pada kemampuannya untuk mempercepat penalaran AI.

Misalnya, klaster NVL72 yang menjalankan DeepSeek-R1 671B, model bahasa yang sangat besar, sekarang dapat menghasilkan respons hanya dalam sepuluh detik. Ini adalah pengurangan dramatis dari 90 detik yang dibutuhkan pada sistem H100.

NVIDIA menganggap peningkatan substansial ini sebagai peningkatan sepuluh kali lipat dalam kecepatan pemrosesan token. Blackwell Ultra dapat menangani 1.000 token per detik, lompatan signifikan dari 100 token per detik H100. Angka-angka ini menunjukkan bahwa meskipun Blackwell Ultra mungkin tidak secara drastis mengungguli pendahulunya, ia menawarkan peningkatan efisiensi yang menarik, terutama bagi organisasi yang masih menggunakan arsitektur generasi sebelumnya.

Vera Rubin Superchip: Generasi Penerus Pemrosesan AI

Melihat melampaui Blackwell Ultra, NVIDIA memiliki rencana untuk memperkenalkan superchip Vera Rubin pada akhir 2026. Dinamai untuk menghormati astronom terkemuka Vera Rubin, chip ini akan menggabungkan CPU (Vera) dan GPU (Rubin) yang dirancang khusus. Ini merupakan langkah maju yang signifikan dalam upaya NVIDIA untuk kemampuan pemrosesan AI yang mutakhir.

CPU Vera, berdasarkan arsitektur Olympus NVIDIA, diproyeksikan untuk memberikan kinerja dua kali lipat dari CPU Grace saat ini. GPU Rubin, di sisi lain, akan mendukung hingga 288GB memori bandwidth tinggi yang mengesankan. Kapasitas memori yang substansial ini akan secara signifikan meningkatkan kemampuan pemrosesan data, terutama untuk tugas-tugas AI yang kompleks.

Arsitektur Vera Rubin menampilkan desain dual-GPU pada satu die. Desain inovatif ini memungkinkan 50 petaFLOPS kinerja inferensi FP4 per chip yang luar biasa, mendorong pemrosesan yang lebih efisien dan mengurangi latensi dalam aplikasi AI.

CPU Vera, penerus CPU Grace, terdiri dari 88 core Arm kustom dengan multithreading simultan. Konfigurasi ini menghasilkan 176 thread per soket. Ini juga dilengkapi antarmuka NVLink core-to-core 1.8TB/s, secara signifikan meningkatkan kecepatan transfer data antara komponen CPU dan GPU.

Blackwell Ultra GB300 dan Vera Rubin Superchip mewakili kemajuan substansial atas arsitektur chip NVIDIA sebelumnya. Peningkatan 1,5 kali GB300 dalam komputasi FP4 padat dibandingkan B200 diterjemahkan langsung ke pemrosesan beban kerja AI yang lebih efisien. Ini, pada gilirannya, memungkinkan waktu pelatihan dan inferensi yang lebih cepat, yang sangat penting untuk mempercepat pengembangan AI.

Vera Rubin, dengan 50 petaFLOPS kinerja FP4 per chip, menandakan lompatan maju yang cukup besar. Tingkat kinerja ini memungkinkan penerapan model dan aplikasi AI yang lebih canggih, mendorong batas-batas dari apa yang mungkin dalam bidang kecerdasan buatan.

Jadwal pengembangan NVIDIA yang ambisius, dengan rencana rilis tahunan generasi chip AI baru, menggarisbawahi dedikasinya untuk mempertahankan posisi terdepan di pasar perangkat keras AI yang berkembang pesat. Komitmen perusahaan terhadap inovasi terbukti dalam upayanya yang berkelanjutan untuk solusi pemrosesan AI yang lebih kuat dan efisien. Pengenalan superchip baru ini bukan hanya tentang peningkatan tambahan; ini tentang memungkinkan era baru kemampuan AI.

Kemajuan dalam kapasitas memori dan kecepatan pemrosesan sangat penting. Kemampuan untuk menangani model dan dataset yang lebih besar sangat penting untuk pengembangan sistem AI yang lebih canggih. Karena model AI terus tumbuh dalam kompleksitas, kebutuhan akan perangkat keras yang dapat mengimbangi menjadi semakin penting. Fokus NVIDIA pada bandwidth memori dan kecepatan pemrosesan token secara langsung mengatasi kebutuhan ini.

Pergeseran ke arah penekanan pada peningkatan efisiensi, terutama bagi organisasi yang bertransisi dari arsitektur lama, adalah langkah strategis oleh NVIDIA. Ini mengakui bahwa tidak semua pengguna akan segera mengadopsi perangkat keras terbaru. Dengan menunjukkan peningkatan kinerja yang signifikan dibandingkan chip generasi sebelumnya, NVIDIA memberikan argumen yang menarik untuk peningkatan.

Superchip Vera Rubin, dengan CPU dan GPU yang dirancang khusus, mewakili kemajuan arsitektur yang signifikan. Desain dual-GPU pada satu die adalah pendekatan inovatif yang menjanjikan untuk memberikan peningkatan kinerja yang substansial dan mengurangi latensi. Desain ini mencerminkan komitmen NVIDIA untuk mendorong batas-batas desain chip dan memaksimalkan kinerja.

Penamaan chip setelah astronom Vera Rubin adalah penghargaan yang pas untuk karya terobosannya. Ini juga secara halus memperkuat komitmen NVIDIA untuk penemuan dan inovasi ilmiah. Fokus perusahaan pada AI melampaui aplikasi komersial; itu juga mencakup kemajuan penelitian ilmiah.

Secara keseluruhan, pengumuman NVIDIA tentang superchip Blackwell Ultra GB300 dan Vera Rubin menandai tonggak penting dalam evolusi perangkat keras AI. Chip baru ini siap untuk mempercepat pengembangan dan penerapan AI di berbagai industri. Komitmen perusahaan terhadap inovasi dan jadwal pengembangannya yang agresif menunjukkan bahwa kita dapat mengharapkan kemajuan yang lebih inovatif di tahun-tahun mendatang. Fokus pada kinerja mentah dan peningkatan efisiensi memastikan bahwa chip ini akan relevan bagi spektrum pengguna yang luas, dari mereka yang memiliki sistem mutakhir hingga mereka yang masih menggunakan arsitektur lama. Masa depan perangkat keras AI tampak cerah, dan NVIDIA jelas memposisikan dirinya di garis depan bidang yang menarik ini. Peningkatan memori, peningkatan kecepatan pemrosesan, dan desain inovatif dari superchip baru ini tidak diragukan lagi akan membuka jalan bagi terobosan baru dalam kecerdasan buatan, memengaruhi berbagai sektor dan mendorong kemajuan lebih lanjut di tahun-tahun mendatang.