Cip Super Baharu NVIDIA: Blackwell & Vera Rubin | ms

Blackwell Ultra GB300: Lonjakan dalam Prestasi

Dijangka akan dikeluarkan pada separuh kedua tahun 2025, Blackwell Ultra GB300 mewakili kemajuan yang ketara berbanding penawaran NVIDIA sebelumnya. Cip super baharu ini direka untuk menyediakan kuasa pengkomputeran yang dipertingkatkan dan lebar jalur memori yang lebih tinggi, penting untuk memenuhi permintaan aplikasi AI moden yang semakin meningkat.

Sistem GB300 ialah sebuah kuasa besar, mengintegrasikan 72 GPU NVIDIA Blackwell Ultra dan 36 CPU NVIDIA Grace berasaskan Arm. Gabungan ini memberikan prestasi FP4 AI yang mengagumkan iaitu 1,400 petaFLOPS. Untuk meletakkannya dalam perspektif, itu adalah peningkatan 1.5 kali ganda dalam keupayaan pengkomputeran FP4 padat berbanding pendahulunya, Blackwell B200.

Salah satu peningkatan paling ketara dalam GB300 ialah kapasiti memorinya. Setiap GPU dalam sistem dilengkapi dengan memori HBM3e 288GB yang mengejutkan. Ini berjumlah lebih 20TB memori GPU setiap sistem. Peningkatan ketara dalam memori ini membolehkan pemprosesan model dan set data AI yang jauh lebih besar, membolehkan pengiraan yang lebih kompleks dan mencapai kelajuan pemprosesan yang lebih pantas.

NVIDIA meletakkan Blackwell Ultra AI Factory Platform sebagai menawarkan peningkatan prestasi tambahan, dan bukannya revolusioner, berbanding cip Blackwell standard. Walaupun cip Ultra tunggal mengekalkan 20 petaflops pengkomputeran AI yang sama seperti Blackwell standard, ia mendapat manfaat ketara daripada peningkatan 50% dalam memori lebar jalur tinggi (HBM3e), meningkat daripada 192GB kepada 288GB.

Memeriksa skala yang lebih besar, DGX GB300 ‘Superpod’ berskala penuh terus menempatkan 288 CPU dan 576 GPU. Persediaan ini memberikan 11.5 exaflops pengkomputeran FP4, mencerminkan prestasi Superpod berasaskan Blackwell yang asal. Walau bagaimanapun, ia menampilkan peningkatan 25% dalam jumlah memori, kini mencecah 300TB yang besar. Peningkatan memori ini menyerlahkan tumpuan NVIDIA untuk menampung model yang lebih besar dan meningkatkan kecekapan penaakulan AI, dan bukannya hanya memfokuskan pada kuasa pengkomputeran mentah.

Daripada perbandingan langsung Blackwell-ke-Blackwell Ultra, NVIDIA mempamerkan bagaimana platform terbaharunya dibandingkan dengan cip H100 era 2022, yang masih digunakan secara meluas dalam beban kerja AI. Syarikat itu menegaskan bahawa Blackwell Ultra menyediakan 1.5 kali ganda prestasi inferens FP4 H100. Walau bagaimanapun, kelebihan yang paling ketara terletak pada keupayaannya untuk mempercepatkan penaakulan AI.

Sebagai contoh, kluster NVL72 yang menjalankan DeepSeek-R1 671B, model bahasa yang sangat besar, kini boleh menjana respons dalam masa sepuluh saat sahaja. Ini adalah pengurangan drastik daripada 90 saat yang diperlukan pada sistem H100.

NVIDIA mengaitkan peningkatan ketara ini dengan peningkatan sepuluh kali ganda dalam kelajuan pemprosesan token. Blackwell Ultra boleh mengendalikan 1,000 token sesaat, satu lonjakan ketara daripada 100 token sesaat H100. Angka-angka ini menunjukkan bahawa walaupun Blackwell Ultra mungkin tidak mengatasi pendahulunya secara drastik, ia menawarkan peningkatan kecekapan yang menarik, terutamanya bagi organisasi yang masih menggunakan seni bina generasi sebelumnya.

Cip Super Vera Rubin: Pemprosesan AI Generasi Akan Datang

Melihat melangkaui Blackwell Ultra, NVIDIA mempunyai rancangan untuk memperkenalkan cip super Vera Rubin pada akhir 2026. Dinamakan sempena ahli astronomi terkenal Vera Rubin, cip ini akan menggabungkan CPU (Vera) dan GPU (Rubin) yang direka khas. Ini mewakili langkah penting ke hadapan dalam usaha NVIDIA untuk keupayaan pemprosesan AI yang canggih.

CPU Vera, berdasarkan seni bina Olympus NVIDIA, diunjurkan untuk memberikan dua kali ganda prestasi CPU Grace semasa. GPU Rubin, sebaliknya, akan menyokong sehingga 288GB memori lebar jalur tinggi yang mengagumkan. Kapasiti memori yang besar ini akan meningkatkan keupayaan pemprosesan data dengan ketara, terutamanya untuk tugas AI yang kompleks.

Seni bina Vera Rubin mempamerkan reka bentuk dwi-GPU pada satu die. Reka bentuk inovatif ini membolehkan prestasi inferens FP4 50 petaFLOPS yang luar biasa setiap cip, memupuk pemprosesan yang lebih cekap dan mengurangkan kependaman dalam aplikasi AI.

CPU Vera, menggantikan CPU Grace, terdiri daripada 88 teras Arm tersuai dengan multithreading serentak. Konfigurasi ini menghasilkan 176 thread setiap soket. Ia juga menampilkan antara muka teras-ke-teras NVLink 1.8TB/s, meningkatkan kelajuan pemindahan data dengan ketara antara komponen CPU dan GPU.

Blackwell Ultra GB300 dan Cip Super Vera Rubin mewakili kemajuan yang ketara berbanding seni bina cip NVIDIA sebelumnya. Peningkatan 1.5 kali ganda GB300 dalam pengkomputeran FP4 padat berbanding B200 diterjemahkan secara langsung kepada pemprosesan beban kerja AI yang lebih cekap. Ini, seterusnya, membolehkan masa latihan dan inferens yang lebih pantas, penting untuk mempercepatkan pembangunan AI.

Vera Rubin, dengan prestasi FP4 50 petaFLOPS setiap cip, menandakan lonjakan yang besar ke hadapan. Tahap prestasi ini membolehkan penggunaan model dan aplikasi AI yang lebih canggih, menolak sempadan apa yang mungkin dalam bidang kecerdasan buatan.

Garis masa pembangunan bercita-cita tinggi NVIDIA, dengan rancangan untuk keluaran tahunan generasi cip AI baharu, menggariskan dedikasinya untuk mengekalkan kedudukan utama dalam pasaran perkakasan AI yang berkembang pesat. Komitmen syarikat terhadap inovasi terbukti dalam usaha berterusannya untuk penyelesaian pemprosesan AI yang lebih berkuasa dan cekap. Pengenalan cip super baharu ini bukan sahaja mengenai peningkatan tambahan; ia adalah mengenai membolehkan era baharu keupayaan AI.

Kemajuan dalam kapasiti memori dan kelajuan pemprosesan amat ketara. Keupayaan untuk mengendalikan model dan set data yang lebih besar adalah penting untuk pembangunan sistem AI yang lebih canggih. Memandangkan model AI terus berkembang dalam kerumitan, keperluan untuk perkakasan yang boleh bersaing menjadi semakin penting. Tumpuan NVIDIA pada lebar jalur memori dan kelajuan pemprosesan token secara langsung menangani keperluan ini.

Peralihan ke arah menekankan peningkatan kecekapan, terutamanya bagi organisasi yang beralih daripada seni bina lama, adalah langkah strategik oleh NVIDIA. Ia mengakui bahawa tidak semua pengguna akan segera menggunakan perkakasan terkini. Dengan menunjukkan peningkatan prestasi yang ketara berbanding cip generasi sebelumnya, NVIDIA menyediakan hujah yang menarik untuk menaik taraf.

Cip super Vera Rubin, dengan CPU dan GPU yang direka khas, mewakili kemajuan seni bina yang ketara. Reka bentuk dwi-GPU pada satu die ialah pendekatan inovatif yang menjanjikan untuk memberikan peningkatan prestasi yang ketara dan mengurangkan kependaman. Reka bentuk ini mencerminkan komitmen NVIDIA untuk menolak sempadan reka bentuk cip dan memaksimumkan prestasi.

Penamaan cip itu sempena ahli astronomi Vera Rubin adalah penghormatan yang sesuai untuk kerja perintisnya. Ia juga secara halus mengukuhkan komitmen NVIDIA terhadap penemuan dan inovasi saintifik. Tumpuan syarikat terhadap AI melangkaui aplikasi komersial; ia juga merangkumi kemajuan penyelidikan saintifik.

Secara keseluruhannya, pengumuman NVIDIA mengenai cip super Blackwell Ultra GB300 dan Vera Rubin menandakan satu peristiwa penting dalam evolusi perkakasan AI. Cip baharu ini bersedia untuk mempercepatkan pembangunan dan penggunaan AI merentasi pelbagai industri. Komitmen syarikat terhadap inovasi dan garis masa pembangunannya yang agresif mencadangkan bahawa kita boleh menjangkakan kemajuan yang lebih hebat pada tahun-tahun akan datang. Tumpuan pada kedua-dua prestasi mentah dan peningkatan kecekapan memastikan bahawa cip ini akan relevan kepada spektrum pengguna yang luas, daripada mereka yang mempunyai sistem canggih kepada mereka yang masih menggunakan seni bina lama. Masa depan perkakasan AI kelihatan cerah, dan NVIDIA jelas meletakkan dirinya di barisan hadapan dalam bidang yang menarik ini. Peningkatan memori, kelajuan pemprosesan yang dipertingkatkan, dan reka bentuk inovatif cip super baharu ini sudah pasti akan membuka jalan kepada penemuan baharu dalam kecerdasan buatan, memberi kesan kepada pelbagai sektor dan memacu kemajuan selanjutnya pada tahun-tahun akan datang.

dikemaskinikan pada 2025-03-20

# AIGC # GPT # Nvidia