NVIDIA新超算芯片:Blackwell Ultra与Vera Rubin

Blackwell Ultra GB300:性能的飞跃

预计于2025年下半年上市的Blackwell Ultra GB300代表了NVIDIA先前产品的重大进步。这款新型超级芯片旨在提供更强的计算能力和更高的内存带宽,这对于满足现代AI应用不断增长的需求至关重要。

GB300系统是一个强大的动力源,集成了72个NVIDIA Blackwell Ultra GPU和36个基于Arm的NVIDIA Grace CPU。这种组合提供了令人印象深刻的1,400 petaFLOPS的FP4 AI性能。相比之下,这比其前身Blackwell B200的密集FP4计算能力提高了1.5倍。

GB300中最显著的升级之一是其内存容量。系统中的每个GPU都配备了惊人的288GB HBM3e内存。这意味着每个系统总共有超过20TB的GPU内存。内存的大幅增加允许处理更大的AI模型和数据集,从而实现更复杂的计算并实现更快的处理速度。

NVIDIA将Blackwell Ultra AI Factory Platform定位为与标准Blackwell芯片相比,提供增量而非革命性的性能提升。虽然单个Ultra芯片保持与标准Blackwell相同的20 petaflops的AI计算能力,但它显著受益于高带宽内存(HBM3e)50%的提升,从192GB增加到288GB。

从更大的规模来看,一个全尺寸的DGX GB300 ‘Superpod’继续容纳288个CPU和576个GPU。此设置提供11.5 exaflops的FP4计算能力,与基于原始Blackwell的Superpod的性能相同。然而,它的总内存增加了25%,现在达到了惊人的300TB。这些内存增强突出了NVIDIA专注于适应更大的模型和提高AI推理效率,而不仅仅是关注原始计算能力。

NVIDIA并没有直接进行Blackwell到Blackwell Ultra的比较,而是展示了其最新平台与其2022年时代的H100芯片(仍在AI工作负载中广泛使用)相比如何。该公司声称Blackwell Ultra提供了H100 1.5倍的FP4推理性能。然而,最显著的优势在于其加速AI推理的能力。

例如,运行DeepSeek-R1 671B(一个特别大的语言模型)的NVL72集群现在可以在短短十秒钟内生成响应。这比H100系统所需的90秒大幅减少。

NVIDIA将这一显著改进归功于令牌处理速度提高了十倍。Blackwell Ultra每秒可以处理1,000个令牌,这是H100每秒100个令牌的显著飞跃。这些数字表明,虽然Blackwell Ultra可能不会大幅超越其直接前身,但它提供了引人注目的效率提升,特别是对于仍在使用上一代架构的组织而言。

Vera Rubin超级芯片:下一代AI处理

除了Blackwell Ultra,NVIDIA还计划在2026年底推出Vera Rubin超级芯片。该芯片以杰出天文学家Vera Rubin的名字命名,将采用定制设计的CPU(Vera)和GPU(Rubin)。这代表了NVIDIA在追求尖端AI处理能力方面迈出的重要一步。

基于NVIDIA Olympus架构的Vera CPU预计将提供当前Grace CPU两倍的性能。另一方面,Rubin GPU将支持高达288GB的高带宽内存。这种巨大的内存容量将显著增强数据处理能力,特别是对于复杂的AI任务。

Vera Rubin架构展示了在单个芯片上的双GPU设计。这种创新设计使每个芯片能够实现惊人的50 petaFLOPS的FP4推理性能,从而在AI应用中实现更高效的处理并减少延迟。

Vera CPU是Grace CPU的继任者,由88个具有同步多线程的定制Arm内核组成。此配置导致每个插槽176个线程。它还具有1.8TB/s的NVLink内核到内核接口,显著提高了CPU和GPU组件之间的数据传输速度。

Blackwell Ultra GB300和Vera Rubin超级芯片代表了NVIDIA先前芯片架构的重大进步。GB300比B200高出1.5倍的密集FP4计算能力直接转化为更高效的AI工作负载处理。这反过来又加快了训练和推理时间,这对于加速AI开发至关重要。

Vera Rubin凭借其每个芯片50 petaFLOPS的FP4性能,标志着一个巨大的飞跃。这种性能水平允许部署更复杂的AI模型和应用,推动人工智能领域可能性的边界。

NVIDIA雄心勃勃的开发时间表,计划每年发布新一代AI芯片,突显了其致力于在快速发展的AI硬件市场中保持领先地位的决心。该公司对创新的承诺体现在其不断追求更强大和更高效的AI处理解决方案。这些新超级芯片的推出不仅仅是渐进式的改进;它还关乎开启一个AI能力的新时代。

内存容量和处理速度的进步尤其值得注意。处理更大模型和数据集的能力对于开发更复杂的AI系统至关重要。随着AI模型继续变得越来越复杂,对能够跟上步伐的硬件的需求变得越来越重要。NVIDIA对内存带宽和令牌处理速度的关注直接解决了这一需求。

NVIDIA的战略举措是转向强调效率提升,特别是对于从旧架构过渡的组织。它承认并非所有用户都会立即采用最新的硬件。通过展示比上一代芯片显著的性能改进,NVIDIA为升级提供了令人信服的理由。

Vera Rubin超级芯片及其定制设计的CPU和GPU代表了一项重大的架构进步。单个芯片上的双GPU设计是一种创新方法,有望提供显著的性能提升和减少延迟。这种设计反映了NVIDIA致力于推动芯片设计边界并最大化性能。

以天文学家Vera Rubin的名字命名该芯片是对她开创性工作的恰当致敬。它也巧妙地强调了NVIDIA对科学发现和创新的承诺。该公司对AI的关注不仅限于商业应用;它还包括推进科学研究。

总体而言,NVIDIA宣布推出Blackwell Ultra GB300和Vera Rubin超级芯片标志着AI硬件发展的一个重要里程碑。这些新芯片有望加速AI在各个行业的开发和部署。该公司的创新承诺及其积极的开发时间表表明,我们可以期待在未来几年取得更多突破性的进展。对原始性能和效率提升的关注确保了这些芯片将与广泛的用户相关,从拥有尖端系统的用户到仍在使用旧架构的用户。AI硬件的未来看起来一片光明,NVIDIA显然将自己定位在这个令人兴奋的领域的最前沿。这些新型超级芯片增加的内存、增强的处理速度和创新设计无疑将为人工智能的新突破铺平道路,影响各个领域并在未来几年推动进一步的发展。