Llama Nemotron 的崛起:強化推理能力,打造更智慧的 AI
Nvidia 策略的核心是推出 Llama Nemotron 系列 AI 模型。這些模型顯著增強了推理能力,標誌著在追求更複雜 AI 的道路上邁出了重要一步。Nemotron 系列基於 Meta Platforms Inc. 的開源 Llama 模型構建,旨在為開發人員提供創建進階 AI Agent 的堅實基礎。這些 Agent 被設想為在最少的人工監督下執行任務,代表著 AI 自主性的重大進步。
Nvidia 通過精心的訓練後增強功能實現了這些改進。可以把它想像成一位已經很有技能的學生,並為他們提供專業輔導。這種「輔導」側重於提高模型在多步驟數學、編碼、複雜決策和整體推理方面的能力。根據 Nvidia 的說法,與原始 Llama 模型相比,準確度提高了 20%。但增強功能不僅限於準確性。推論速度(本質上是模型處理資訊並提供答案的速度)提高了五倍。這意味著可以處理更複雜的任務,同時降低營運成本,這是實際部署的關鍵因素。
Llama Nemotron 模型通過 Nvidia 的 NIM 微服務平台提供三種不同的大小:
- Nano: 專為部署在處理能力有限的設備上而設計,例如個人電腦和邊緣設備。這為 AI Agent 在資源受限的環境中運作開闢了可能性。
- Super: 針對在單個圖形處理單元 (GPU) 上執行進行了優化。這在效能和資源需求之間提供了平衡。
- Ultra: 專為實現最佳效能而設計,需要多個 GPU 伺服器。這適用於需要最高 AI 能力的應用。
優化過程本身利用了 Nvidia DGX Cloud 平台,利用來自 Nvidia Nemotron 的高品質合成數據,以及 Nvidia 自己策劃的數據集。為了促進透明度和協作,Nvidia 正在公開這些數據集、使用的工具以及其優化技術的詳細資訊。這種開放的方法鼓勵更廣泛的 AI 社群在 Nvidia 的工作基礎上再接再厲,並開發他們自己的基礎推理模型。
Llama Nemotron 的影響已經在 Nvidia 建立的合作夥伴關係中顯而易見。Microsoft Corp. 等主要參與者正在將這些模型整合到他們的雲端服務中。
- Microsoft 正在其 Azure AI Foundry 服務上提供這些模型。
- 對於使用 Azure AI Agent Service for Microsoft 365 創建新 Agent 的客戶,它們也將作為一個選項提供。
- SAP SE 正在利用 Llama Nemotron 來增強其 AI 助理 Joule 及其更廣泛的 SAP Business AI 解決方案組合。
- 其他知名公司,包括 Accenture Plc、Atlassian Corp.、Box Inc. 和 ServiceNow Inc.,也在與 Nvidia 合作,為其客戶提供對這些模型的訪問權限。
超越模型:Agentic AI 的全面生態系統
Nvidia 明白,構建 AI Agent 不僅需要強大的語言模型。還需要一個完整的生態系統,包括基礎設施、工具、數據管道等等。該公司正在通過一套額外的 Agentic AI 建構基石來滿足這些需求,這些建構基石也在 GTC 2025 上宣布。
Nvidia AI-Q Blueprint:將知識與行動聯繫起來
此框架旨在促進知識庫和 AI Agent 之間的連接,使它們能夠自主行動。該藍圖使用 Nvidia NIM 微服務構建並與 Nvidia NeMo Retriever 集成,簡化了為 AI Agent 檢索多模態數據(各種格式的資訊,如文本、圖像和音頻)的過程。
Nvidia AI Data Platform:優化推理的數據流
這個可定制的參考設計正在提供給主要的儲存供應商。目標是協助 Dell Technologies Inc.、Hewlett Packard Enterprise Co.、Hitachi Vantara、IBM Corp.、NetApp Inc.、Nutanix Inc.、Vast Data Inc. 和 Pure Storage Inc. 等公司開發專門針對 Agentic AI 推理工作負載的更高效數據平台。通過將優化的儲存資源與 Nvidia 的加速計算硬體相結合,開發人員可以期望在 AI 推理方面獲得顯著的效能提升。這是通過確保資訊從數據庫到 AI 模型的順暢和快速流動來實現的。
增強的 Nvidia NIM 微服務:持續學習和適應性
Nvidia 的 NIM 微服務已更新,以優化 Agentic AI 推理,支持持續學習和適應性。這些微服務使客戶能夠可靠地部署最新、最強大的 Agentic AI 模型,包括 Nvidia 的 Llama Nemotron 以及來自 Meta、Microsoft 和 Mistral AI 等公司的替代方案。
Nvidia NeMo 微服務:構建強大的數據飛輪
Nvidia 還在增強其 NeMo 微服務,該微服務為開發人員提供了一個框架,用於創建強大而高效的數據飛輪。這對於確保 AI Agent 能夠根據人類生成和 AI 生成的反饋不斷學習和改進至關重要。
戰略合作夥伴關係:推動整個 AI 領域的創新
Nvidia 對 Agentic AI 的承諾延伸到其與其他行業領導者的合作。
擴大與 Oracle 的合作夥伴關係:Oracle Cloud Infrastructure 上的 Agentic AI
Nvidia 正在擴大與 Oracle Corp. 的合作,將 Agentic AI 功能引入 Oracle Cloud Infrastructure (OCI)。此次合作涉及將 Nvidia 的加速 GPU 和推理軟體整合到 Oracle 的雲端基礎設施中,使其與 Oracle 的生成式 AI 服務兼容。這將加速 OCI 上 AI Agent 的開發。Nvidia 現在通過 OCI 控制台原生提供 160 多個 AI 工具和 NIM 微服務。兩家公司還在努力加速 Oracle Database 23ai 平台上的向量搜索。
深化與 Google 的合作:增強 AI 訪問和完整性
Nvidia 還提供了有關其與 Google LLC 擴大合作的最新資訊,揭示了旨在改善 AI 及其底層工具訪問的幾項舉措。
一個關鍵亮點是 Nvidia 成為第一個利用 Google DeepMind 的 SynthID 的組織。該技術直接將數位浮水印嵌入到 AI 生成的內容中,包括圖像、影片和文本。這有助於保護 AI 輸出的完整性並打擊虛假資訊。SynthID 最初與 Nvidia 的 Cosmos World 基礎模型集成。
此外,Nvidia 還與 Google 的 DeepMind 研究人員合作,為 Nvidia GPU 優化 Gemma(一系列開源、輕量級 AI 模型)。兩家公司還在合作開展一項旨在構建具有抓取技能的 AI 機器人的計劃,以及其他項目。
Google 和 Nvidia 研究人員和工程師之間的合作正在解決廣泛的挑戰。從藥物發現到機器人技術,突出了其變革潛力。