NVIDIA의 새로운 슈퍼칩: Blackwell Ultra 및 Vera Rubin | ko

Blackwell Ultra GB300: 성능의 도약

2025년 하반기에 출시될 예정인 Blackwell Ultra GB300은 NVIDIA의 이전 제품보다 상당한 발전을 나타냅니다. 이 새로운 슈퍼칩은 향상된 컴퓨팅 성능과 증가된 메모리 대역폭을 제공하도록 설계되어 현대 AI 애플리케이션의 끊임없이 증가하는 요구를 충족시키는 데 중요합니다.

GB300 시스템은 72개의 NVIDIA Blackwell Ultra GPU와 36개의 Arm 기반 NVIDIA Grace CPU를 통합하는 강력한 제품입니다. 이 조합은 인상적인 1,400 PetaFLOPS의 FP4 AI 성능을 제공합니다. 이를 비교하자면, 이전 모델인 Blackwell B200에 비해 1.5배 증가된 FP4 연산 능력을 제공합니다.

GB300에서 가장 중요한 업그레이드 중 하나는 메모리 용량입니다. 시스템 내의 각 GPU에는 288GB의 HBM3e 메모리가 장착되어 있습니다. 이는 시스템당 총 20TB 이상의 GPU 메모리에 해당합니다. 이러한 상당한 메모리 증가는 훨씬 더 큰 AI 모델 및 데이터 세트의 처리를 가능하게 하여 더 복잡한 계산과 더 빠른 처리 속도를 달성할 수 있습니다.

NVIDIA는 Blackwell Ultra AI Factory Platform을 표준 Blackwell 칩에 비해 혁신적이라기보다는 점진적인 성능 향상을 제공하는 것으로 포지셔닝하고 있습니다. 단일 Ultra 칩은 표준 Blackwell과 동일한 20 PetaFLOPS의 AI 컴퓨팅을 유지하지만, 고대역폭 메모리(HBM3e)가 192GB에서 288GB로 50% 증가하여 상당한 이점을 얻습니다.

더 큰 규모를 살펴보면, 풀 스케일 DGX GB300 ‘Superpod’는 계속해서 288개의 CPU와 576개의 GPU를 수용합니다. 이 설정은 11.5 ExaFLOPS의 FP4 컴퓨팅을 제공하며, 이는 오리지널 Blackwell 기반 Superpod의 성능과 동일합니다. 그러나 총 메모리가 25% 증가하여 이제 300TB에 달합니다. 이러한 메모리 향상은 NVIDIA가 단순한 계산 능력에만 초점을 맞추는 것이 아니라 더 큰 모델을 수용하고 AI 추론 효율성을 향상시키는 데 중점을 두고 있음을 강조합니다.

NVIDIA는 Blackwell과 Blackwell Ultra를 직접 비교하는 대신, 여전히 AI 워크로드에서 널리 사용되는 2022년형 H100 칩과 비교하여 최신 플랫폼이 어떻게 다른지를 보여주고 있습니다. 회사는 Blackwell Ultra가 H100보다 1.5배 향상된 FP4 추론 성능을 제공한다고 주장합니다. 그러나 가장 주목할 만한 장점은 AI 추론을 가속화하는 능력에 있습니다.

예를 들어, 매우 큰 언어 모델인 DeepSeek-R1 671B를 실행하는 NVL72 클러스터는 이제 단 10초 만에 응답을 생성할 수 있습니다. 이는 H100 시스템에서 필요했던 90초에서 획기적으로 단축된 것입니다.

NVIDIA는 이러한 상당한 개선이 토큰 처리 속도가 10배 증가했기 때문이라고 설명합니다. Blackwell Ultra는 초당 1,000개의 토큰을 처리할 수 있으며, 이는 H100의 초당 100개 토큰에서 크게 도약한 것입니다. 이러한 수치는 Blackwell Ultra가 바로 이전 모델을 크게 능가하지는 않지만, 특히 이전 세대 아키텍처를 여전히 활용하고 있는 조직에게는 매력적인 효율성 향상을 제공한다는 것을 보여줍니다.

Vera Rubin Superchip: 차세대 AI 프로세싱

Blackwell Ultra를 넘어 NVIDIA는 2026년 말에 Vera Rubin 슈퍼칩을 출시할 계획입니다. 저명한 천문학자 Vera Rubin의 이름을 딴 이 칩은 맞춤 설계된 CPU(Vera)와 GPU(Rubin)를 통합할 예정입니다. 이는 NVIDIA가 최첨단 AI 처리 기능을 추구하는 데 있어 중요한 진전을 나타냅니다.

NVIDIA의 Olympus 아키텍처를 기반으로 하는 Vera CPU는 현재 Grace CPU 성능의 두 배를 제공할 것으로 예상됩니다. 반면 Rubin GPU는 최대 288GB의 고대역폭 메모리를 지원합니다. 이 상당한 메모리 용량은 특히 복잡한 AI 작업을 위한 데이터 처리 기능을 크게 향상시킬 것입니다.

Vera Rubin 아키텍처는 단일 다이에 듀얼 GPU 설계를 선보입니다. 이 혁신적인 설계는 칩당 50 PetaFLOPS의 FP4 추론 성능을 가능하게 하여 AI 애플리케이션에서 보다 효율적인 처리와 감소된 지연 시간을 제공합니다.

Grace CPU의 후속 제품인 Vera CPU는 동시 멀티스레딩을 지원하는 88개의 맞춤형 Arm 코어로 구성됩니다. 이 구성은 소켓당 176개의 스레드를 제공합니다. 또한 1.8TB/s NVLink 코어 간 인터페이스를 제공하여 CPU와 GPU 구성 요소 간의 데이터 전송 속도를 크게 향상시킵니다.

Blackwell Ultra GB300 및 Vera Rubin Superchip은 NVIDIA의 이전 칩 아키텍처에 비해 상당한 발전을 나타냅니다. GB300의 B200 대비 1.5배 증가된 FP4 연산은 AI 워크로드의 보다 효율적인 처리로 직접적으로 이어집니다. 이는 결과적으로 AI 개발 가속화에 중요한 더 빠른 훈련 및 추론 시간을 가능하게 합니다.

칩당 50 PetaFLOPS의 FP4 성능을 제공하는 Vera Rubin은 상당한 도약을 의미합니다. 이 수준의 성능은 훨씬 더 정교한 AI 모델 및 애플리케이션의 배포를 가능하게 하여 인공 지능 분야에서 가능한 것의 경계를 넓힙니다.

NVIDIA의 야심 찬 개발 일정은 매년 새로운 AI 칩 세대를 출시할 계획으로, 빠르게 진화하는 AI 하드웨어 시장에서 선두 위치를 유지하려는 노력을 강조합니다. 회사의 혁신에 대한 헌신은 보다 강력하고 효율적인 AI 처리 솔루션을 지속적으로 추구하는 데서 분명하게 드러납니다. 이러한 새로운 슈퍼칩의 도입은 단순한 점진적인 개선이 아니라 새로운 AI 기능의 시대를 여는 것입니다.

메모리 용량 및 처리 속도의 발전은 특히 주목할 만합니다. 더 큰 모델과 데이터 세트를 처리하는 능력은 더 정교한 AI 시스템 개발에 중요합니다. AI 모델이 계속해서 복잡해짐에 따라 이를 따라잡을 수 있는 하드웨어의 필요성이 점점 더 중요해지고 있습니다. NVIDIA의 메모리 대역폭 및 토큰 처리 속도에 대한 집중은 이러한 요구를 직접적으로 해결합니다.

특히 이전 아키텍처에서 전환하는 조직을 위해 효율성 향상을 강조하는 방향으로의 전환은 NVIDIA의 전략적 움직임입니다. 이는 모든 사용자가 즉시 최신 하드웨어를 채택하지는 않을 것이라는 점을 인정합니다. 이전 세대 칩에 비해 상당한 성능 향상을 입증함으로써 NVIDIA는 업그레이드에 대한 설득력 있는 주장을 제공합니다.

맞춤 설계된 CPU와 GPU를 갖춘 Vera Rubin 슈퍼칩은 중요한 아키텍처 발전을 나타냅니다. 단일 다이의 듀얼 GPU 설계는 상당한 성능 향상과 감소된 지연 시간을 제공할 것을 약속하는 혁신적인 접근 방식입니다. 이 설계는 칩 설계의 경계를 넓히고 성능을 극대화하려는 NVIDIA의 노력을 반영합니다.

천문학자 Vera Rubin의 이름을 딴 칩 이름은 그녀의 획기적인 업적에 대한 적절한 헌사입니다. 또한 과학적 발견과 혁신에 대한 NVIDIA의 헌신을 미묘하게 강화합니다. 회사의 AI에 대한 집중은 상업적 응용 프로그램을 넘어 과학 연구의 발전까지 포괄합니다.

전반적으로 NVIDIA의 Blackwell Ultra GB300 및 Vera Rubin 슈퍼칩 발표는 AI 하드웨어 진화의 중요한 이정표입니다. 이러한 새로운 칩은 광범위한 산업 분야에서 AI의 개발 및 배포를 가속화할 준비가 되어 있습니다. 회사의 혁신에 대한 헌신과 공격적인 개발 일정은 앞으로 몇 년 안에 더욱 획기적인 발전이 있을 것임을 시사합니다. 원시 성능과 효율성 향상 모두에 초점을 맞추면 이러한 칩이 최첨단 시스템을 갖춘 사용자부터 여전히 이전 아키텍처를 활용하는 사용자에 이르기까지 광범위한 사용자에게 관련성이 있음을 보장합니다. AI 하드웨어의 미래는 밝아 보이며 NVIDIA는 분명히 이 흥미로운 분야의 선두에 자리매김하고 있습니다. 이러한 새로운 슈퍼칩의 증가된 메모리, 향상된 처리 속도 및 혁신적인 설계는 의심할 여지 없이 인공 지능의 새로운 돌파구를 위한 길을 열어 다양한 분야에 영향을 미치고 앞으로 몇 년 동안 더 많은 발전을 이끌 것입니다.

업데이트됨 2025-03-20

# AIGC # GPT # Nvidia