엔터프라이즈 및 그 이상을 위한 AI 조정
최근 GPU Technical Conference (GTC) 2025에서 Nvidia의 CEO인 Jensen Huang은 가속 컴퓨팅 능력을 광범위한 애플리케이션에 맞게 조정하려는 회사의 전략을 설명했습니다. Nvidia의 차세대 ‘Blackwell’ B300 GPU와 미래의 ‘Rubin’ 가속기 제품군에 스포트라이트가 집중되었지만, Huang은 또한 엔터프라이즈, 엣지 컴퓨팅 및 물리적 AI 영역의 요구를 충족시키기 위한 회사의 노력을 강조했습니다.
Huang은 클라우드 서비스 제공업체가 Nvidia의 최첨단 기술과 풀 스택 접근 방식에 매력을 느끼지만, AI의 광범위한 채택에는 보다 미묘한 전략이 필요하다고 강조했습니다. 그는 “가속 컴퓨팅은 칩에 관한 것이 아니며, 칩과 라이브러리, 프로그래밍 모델에 관한 것도 아닙니다. 칩, 프로그래밍 모델, 그리고 그 위에 올라가는 수많은 소프트웨어에 관한 것입니다.”라고 말했습니다.
AI의 진화: 클라우드에서 유비쿼터스로
AI의 초기 모멘텀은 클라우드에서 시작되었을 수 있지만, 그 궤적은 분명히 그 이상으로 확장되고 있습니다. AI가 다양한 분야에 침투함에 따라 다양한 시스템 구성, 운영 환경, 도메인별 라이브러리 및 사용 패턴을 만나게 됩니다. Huang은 이러한 확장을 강조하며 엔터프라이즈 IT, 제조, 로봇 공학, 자율 주행 자동차, 심지어 신흥 GPU 클라우드 제공업체의 고유한 요구 사항을 언급했습니다.
컴퓨팅의 근본적인 성격은 AI와 머신 러닝에 의해 재편되고 있으며, 프로세서와 운영 체제에서 애플리케이션 및 오케스트레이션에 이르기까지 모든 것에 영향을 미치고 있습니다. 엔터프라이즈 워크플로는 단순한 데이터 검색에서 AI 시스템과의 대화형 질의응답 상호 작용으로 진화하고 있습니다.
AI 에이전트와 디지털 워커의 부상
Huang은 AI 에이전트가 디지털 인력의 필수적인 부분이 되는 미래를 예측합니다. 그는 전 세계 10억 명의 지식 근로자와 함께 100억 명의 디지털 근로자가 등장하여 원활하게 협업할 것이라고 예측합니다. 이러한 AI 에이전트의 유비쿼터스 존재는 고유한 운영 요구 사항에 최적화된 새로운 종류의 컴퓨터를 필요로 합니다.
AI 시대를 위한 새로운 하드웨어 소개
Nvidia는 DGX Spark와 DGX Station이라는 두 가지 개인용 AI 슈퍼컴퓨터를 도입하여 이러한 요구를 해결하고 있습니다. 이 데스크톱 시스템은 추론 및 기타 작업을 위해 설계되었으며, 로컬 운영 또는 Nvidia의 DGX Cloud 및 기타 가속 클라우드 환경과의 통합을 위한 유연성을 제공합니다.
DGX Spark는 GB10 Grace Blackwell Superchip을 탑재하여 AI 미세 조정 및 추론을 위한 탁월한 성능을 제공합니다. 더 강력한 데스크톱 시스템인 DGX Station은 GB300 Grace-Blackwell Ultra Desktop Superchip을 탑재하여 784GB의 코히어런트 메모리, Nvidia의 ConnectX-8 SuperNIC, AI Enterprise 소프트웨어 플랫폼 및 NIM AI 마이크로서비스에 대한 액세스를 제공합니다.
에이전트를 넘어: AI 추론의 새벽
이러한 새로운 시스템은 기업에 AI 워크로드를 위한 강력한 도구를 제공할 뿐만 아니라 AI 진화의 다음 단계인 추론 모델을 위한 길을 열어줍니다. 이러한 모델은 기본적인 AI 에이전트를 뛰어넘는 중요한 도약을 나타내며, 복잡한 문제를 해결하고 현재 AI 챗봇의 프롬프트 및 응답 특성을 훨씬 뛰어넘는 추론 능력을 보여줄 수 있습니다.
Huang은 이러한 발전을 설명하면서 “이제 우리는 문제를 단계별로 분석하는 추론 능력을 가진 AI를 갖게 되었습니다. 이제 우리는 사고 사슬, 최상의 N, 일관성 검사, 경로 계획, 다양한 기술을 사용하여 단계별로 추론할 수 있는 AI를 갖게 되었습니다.”라고 말했습니다.
Nemotron 모델: AI 추론 강화
Consumer Electronics Show에서 Llama Nemotron 및 Cosmos Nemotron 모델을 공개하면서 구축된 기반을 바탕으로 Nvidia는 GTC에서 Llama Nemotron 모델 제품군을 공개했습니다. 이 모델은 수학, 코딩, 의사 결정 및 지시 따르기와 같은 다단계 작업에 대한 향상된 추론 기능을 자랑합니다.
Nvidia의 엔터프라이즈용 생성 AI 소프트웨어 부사장인 Kari Briski는 개발자 지원에 대한 회사의 노력을 강조했습니다. Nvidia는 600억 개의 토큰으로 구성된 합성 생성 데이터와 이러한 모델의 채택을 용이하게 하는 기술을 포함하는 데이터 세트를 제공하고 있습니다.
Briski는 “인간과 마찬가지로 에이전트는 복잡한 요청을 분석하고, 사용자의 의도를 이해하고, 실시간으로 적응하기 위해 컨텍스트를 이해해야 합니다.”라고 설명했습니다.
Nemotron 모델은 다양한 수준의 추론 기능을 제공하며 Nano(PC 및 엣지 장치에 최적화됨), Super(단일 GPU에서 높은 정확도 및 처리량), Ultra(여러 GPU용으로 설계됨)의 세 가지 크기로 제공됩니다.
AI-Q Blueprint: 데이터를 추론 에이전트에 연결
Nvidia의 AI Enterprise 소프트웨어 플랫폼은 기업이 독점 데이터를 추론 AI 에이전트에 연결할 수 있도록 하는 NIM 기반 제품인 AI-Q Blueprint로 강화되고 있습니다. 이 개방형 소프트웨어는 Nvidia의 NeMo Retriever 도구와 통합되어 다양한 데이터 유형(텍스트, 이미지, 비디오)을 쿼리하고 Nvidia의 가속 컴퓨팅과 Llama Nemotron 모델을 포함한 타사 스토리지 플랫폼 및 소프트웨어 간의 협업을 용이하게 합니다.
Briski는 개발 팀에 대한 이점을 강조하면서 “연결된 에이전트 팀의 경우, 이 청사진은 에이전트 활동에 대한 관찰 가능성과 투명성을 제공하여 개발자가 시간이 지남에 따라 에이전트를 개선할 수 있도록 합니다. 개발자는 에이전트 정확도를 개선하고 이러한 작업 완료 시간을 몇 시간에서 몇 분으로 단축할 수 있습니다.”라고 말했습니다.
AI 데이터 플랫폼: 엔터프라이즈 인프라를 위한 참조 설계
Nvidia의 AI Data Platform은 AI-Q Blueprint를 사용하여 구축된 AI 쿼리 에이전트를 통합하는 엔터프라이즈 인프라를 위한 참조 설계 역할을 합니다.
물리적 AI: 디지털 세계와 물리적 세계 연결
Huang은 또한 AI를 물리적 시스템에 통합하여 실제 인식 및 상호 작용을 가능하게 하는 물리적 AI의 급성장하는 분야를 다루었습니다. 그는 이 영역이 AI 시장의 가장 큰 부분이 될 수 있다고 예측했습니다.
Huang은 “마찰과 관성, 원인과 결과, 대상 영속성과 같은 물리적 세계를 이해하는 AI, 3차원 세계를 이해하는 능력. 이것이 물리적 AI의 새로운 시대를 가능하게 하고 로봇 공학을 가능하게 할 것입니다.”라고 설명했습니다.
로봇 공학 및 자율 주행 자동차의 발전
Nvidia의 로봇 공학 및 자율 주행 자동차용으로 특별히 설계된 Nvidia AI Dataset의 도입을 포함하여 여러 발표가 물리적 AI에 대한 Nvidia의 노력을 강조했습니다. 이 데이터 세트를 통해 개발자는 Nvidia의 Cosmos 세계 모델 개발 플랫폼, Drive AV 소프트웨어, Isaac AI 로봇 개발 플랫폼 및 스마트 시티를 위한 Metropolis 프레임워크에서 사용되는 실제 및 합성 데이터를 활용하여 파운데이션 모델을 사전 훈련, 테스트, 검증 및 미세 조정할 수 있습니다.
데이터 세트의 초기 반복은 Hugging Face에서 사용할 수 있으며, 로봇 공학 훈련을 위한 15테라바이트의 데이터를 제공하며, 가까운 시일 내에 자율 주행 자동차 개발에 대한 지원이 예정되어 있습니다.
또한 Nvidia는 휴머노이드 로봇을 위한 파운데이션 모델인 Isaac GROOT N1을 발표했습니다. 실제 및 합성 데이터로 훈련되었으며 Project GROOT의 발전을 나타냅니다.
AI 지평 확장
Nvidia의 전략적 이니셔티브는 AI의 미래에 대한 명확한 비전을 보여주며, 클라우드의 범위를 훨씬 넘어 엔터프라이즈와 물리적 세계의 중심으로 확장하고 있습니다. 최첨단 하드웨어, 혁신적인 소프트웨어 플랫폼 및 개발자 역량 강화에 대한 노력을 결합하여 Nvidia는 차세대 AI 혁신의 원동력으로 자리매김하고 있습니다. 추론 기능의 도입은 물리적 AI를 위한 도구 및 데이터 세트 개발과 결합되어 AI가 일상 생활과 원활하게 통합되어 산업을 변화시키고 기술과 상호 작용하는 방식을 재정의하는 미래를 향한 중요한 단계를 나타냅니다. 엔터프라이즈 솔루션, 엣지 컴퓨팅 및 로봇 공학에 대한 집중은 AI 환경의 다양하고 진화하는 요구에 대한 Nvidia의 이해를 강조하여 이 혁신적인 기술 혁명의 리더로서의 입지를 확고히 합니다.