Nvidia의 도약: 추론 모델과 고급 AI 에이전트 구성 요소

Llama Nemotron의 부상: 더 스마트한 AI를 위한 향상된 추론

Nvidia 전략의 핵심은 Llama Nemotron AI 모델 제품군의 공개입니다. 이 모델들은 상당히 향상된 추론 능력을 자랑하며, 더욱 정교한 AI를 향한 탐구에서 한 걸음 더 나아간 것을 의미합니다. Meta Platforms Inc.의 오픈 소스 Llama 모델을 기반으로 구축된 Nemotron 시리즈는 개발자에게 고급 AI 에이전트 생성을 위한 강력한 기반을 제공하도록 설계되었습니다. 이러한 에이전트는 최소한의 인간 감독으로 작업을 수행하도록 구상되어 AI 자율성에서 상당한 진전을 나타냅니다.

Nvidia는 세심한 훈련 후 개선을 통해 이러한 향상을 달성했습니다. 이미 숙련된 학생을 데려다가 전문적인 개인지도를 제공하는 것으로 생각하면 됩니다. 이 ‘개인지도’는 다단계 수학, 코딩, 복잡한 의사 결정 및 전반적인 추론에서 모델의 능력을 향상시키는 데 중점을 두었습니다. Nvidia에 따르면 그 결과 원래 Llama 모델에 비해 정확도가 20% 향상되었습니다. 그러나 개선 사항은 정확도에 그치지 않습니다. 추론 속도, 즉 모델이 정보를 처리하고 답변을 제공하는 속도가 5배 증가했습니다. 이는 실제 배포에 중요한 요소인 운영 비용 절감으로 더 복잡한 작업을 처리할 수 있음을 의미합니다.

Llama Nemotron 모델은 Nvidia의 NIM 마이크로서비스 플랫폼을 통해 세 가지 크기로 제공됩니다.

  • Nano: 개인용 컴퓨터 및 엣지 장치와 같이 처리 능력이 제한된 장치에 배포하도록 맞춤화되었습니다. 이를 통해 AI 에이전트가 리소스가 제한된 환경에서 작동할 수 있는 가능성이 열립니다.
  • Super: 단일 GPU(그래픽 처리 장치)에서 실행하도록 최적화되었습니다. 이는 성능과 리소스 요구 사항 간의 균형을 제공합니다.
  • Ultra: 최대 성능을 위해 설계되었으며 여러 GPU 서버가 필요합니다. 이는 최고 수준의 AI 기능을 요구하는 애플리케이션을 지원합니다.

개선 프로세스 자체는 Nvidia Nemotron의 고품질 합성 데이터와 Nvidia 자체 큐레이팅된 데이터 세트를 활용하여 Nvidia DGX Cloud 플랫폼을 활용했습니다. 투명성과 협업을 촉진하는 움직임으로 Nvidia는 이러한 데이터 세트, 사용된 도구 및 최적화 기술에 대한 세부 정보를 공개적으로 제공하고 있습니다. 이러한 개방형 접근 방식은 광범위한 AI 커뮤니티가 Nvidia의 작업을 기반으로 자체적인 기본 추론 모델을 개발하도록 장려합니다.

Llama Nemotron의 영향은 Nvidia가 맺은 파트너십에서 이미 분명하게 드러납니다. Microsoft Corp.와 같은 주요 업체들은 이러한 모델을 자사의 클라우드 기반 서비스에 통합하고 있습니다.

  • Microsoft는 Azure AI Foundry 서비스에서 이를 사용할 수 있도록 하고 있습니다.
  • 또한 Microsoft 365용 Azure AI Agent Service를 사용하여 새 에이전트를 만드는 고객을 위한 옵션으로 제공될 예정입니다.
  • SAP SE는 Llama Nemotron을 활용하여 AI 어시스턴트인 Joule과 광범위한 SAP Business AI 솔루션 포트폴리오를 강화하고 있습니다.
  • Accenture Plc, Atlassian Corp., Box Inc. 및 ServiceNow Inc.를 포함한 다른 저명한 회사들도 Nvidia와 협력하여 고객에게 이러한 모델에 대한 액세스를 제공하고 있습니다.

모델 그 이상: 에이전트 AI를 위한 포괄적인 에코시스템

Nvidia는 AI 에이전트를 구축하려면 강력한 언어 모델 이상의 것이 필요하다는 것을 알고 있습니다. 인프라, 도구, 데이터 파이프라인 등을 포괄하는 완전한 에코시스템이 필요합니다. 회사는 GTC 2025에서 발표된 추가 에이전트 AI 구성 요소 제품군으로 이러한 요구 사항을 해결하고 있습니다.

Nvidia AI-Q Blueprint: 지식을 행동에 연결

이 프레임워크는 지식 베이스와 AI 에이전트 간의 연결을 용이하게 하여 자율적으로 행동할 수 있도록 설계되었습니다. Nvidia NIM 마이크로서비스를 사용하여 구축되고 Nvidia NeMo Retriever와 통합된 이 청사진은 AI 에이전트를 위해 텍스트, 이미지, 오디오와 같은 다양한 형식의 정보인 다중 모드 데이터를 검색하는 프로세스를 단순화합니다.

Nvidia AI Data Platform: 추론을 위한 데이터 흐름 최적화

이 사용자 정의 가능한 참조 디자인은 주요 스토리지 제공업체에 제공되고 있습니다. 목표는 Dell Technologies Inc., Hewlett Packard Enterprise Co., Hitachi Vantara, IBM Corp., NetApp Inc.. Nutanix Inc., Vast Data Inc. 및 Pure Storage Inc.와 같은 회사가 에이전트 AI 추론 워크로드를 위해 특별히 더 효율적인 데이터 플랫폼을 개발하도록 지원하는 것입니다. 최적화된 스토리지 리소스와 Nvidia의 가속 컴퓨팅 하드웨어를 결합함으로써 개발자는 AI 추론에서 상당한 성능 향상을 기대할 수 있습니다. 이는 데이터베이스에서 AI 모델로의 정보 흐름을 원활하고 빠르게 보장함으로써 달성됩니다.

향상된 Nvidia NIM 마이크로서비스: 지속적인 학습 및 적응성

Nvidia의 NIM 마이크로서비스는 에이전트 AI 추론을 최적화하고 지속적인 학습 및 적응성을 지원하도록 업데이트되었습니다. 이러한 마이크로서비스를 통해 고객은 Nvidia의 Llama Nemotron 및 Meta, Microsoft, Mistral AI와 같은 회사의 대안을 포함하여 가장 최신의 강력한 에이전트 AI 모델을 안정적으로 배포할 수 있습니다.

Nvidia NeMo 마이크로서비스: 강력한 데이터 플라이휠 구축

Nvidia는 또한 개발자가 강력하고 효율적인 데이터 플라이휠을 만들 수 있는 프레임워크를 제공하는 NeMo 마이크로서비스를 개선하고 있습니다. 이는 AI 에이전트가 인간 생성 피드백과 AI 생성 피드백을 기반으로 지속적으로 학습하고 개선할 수 있도록 하는 데 중요합니다.

전략적 파트너십: AI 환경 전반의 혁신 주도

에이전트 AI에 대한 Nvidia의 노력은 다른 업계 리더와의 협력으로 확장됩니다.

Oracle 파트너십 확장: Oracle Cloud Infrastructure의 에이전트 AI

Nvidia는 Oracle Corp.와의 협력을 확대하여 Oracle Cloud Infrastructure(OCI)에 에이전트 AI 기능을 제공하고 있습니다. 이 파트너십에는 Nvidia의 가속 GPU 및 추론 소프트웨어를 Oracle의 클라우드 인프라에 통합하여 Oracle의 생성 AI 서비스와 호환되도록 하는 것이 포함됩니다. 이를 통해 OCI에서 AI 에이전트 개발이 가속화될 것입니다. Nvidia는 이제 OCI 콘솔을 통해 160개 이상의 AI 도구와 NIM 마이크로서비스를 기본적으로 제공합니다. 두 회사는 또한 Oracle Database 23ai 플랫폼에서 벡터 검색을 가속화하기 위해 협력하고 있습니다.

Google과의 협력 심화: AI 액세스 및 무결성 향상

Nvidia는 또한 Google LLC와의 확장된 협력에 대한 업데이트를 제공하여 AI 및 기본 도구에 대한 액세스를 개선하기 위한 몇 가지 이니셔티브를 공개했습니다.

주요 하이라이트는 Nvidia가 Google DeepMind의 SynthID를 활용하는 최초의 조직이 되었다는 것입니다. 이 기술은 이미지, 비디오, 텍스트를 포함한 AI 생성 콘텐츠에 디지털 워터마크를 직접 삽입합니다. 이는 AI 출력의 무결성을 보존하고 잘못된 정보에 대처하는 데 도움이 됩니다. SynthID는 처음에 Nvidia의 Cosmos World 파운데이션 모델과 통합되고 있습니다.

또한 Nvidia는 Google의 DeepMind 연구원과 협력하여 Nvidia GPU용 오픈 소스 경량 AI 모델 제품군인 Gemma를 최적화했습니다. 두 회사는 또한 잡기 기술을 갖춘 AI 기반 로봇을 구축하기 위한 이니셔티브에 협력하고 있습니다.

Google과 Nvidia 연구원 및 엔지니어 간의 협력은 광범위한 문제를 해결하고 있습니다. 신약 개발에서 로봇 공학에 이르기까지, 의 혁신적인 잠재력을 강조합니다.