L'AI Enterprise di Nvidia: Un Nuovo Paradigma

Adattare l’IA per l’Impresa e Oltre

Nvidia, leader indiscusso nella fornitura di uno stack completo di hardware, software e strumenti di sviluppo per il fiorente campo dell’intelligenza artificiale, sta puntando al settore enterprise. L’azienda sta dimostrando una profonda comprensione del fatto che l’influenza pervasiva dell’IA necessita di adattabilità a diversi scenari tecnologici.

Alla recente GPU Technical Conference (GTC) 2025, il CEO di Nvidia, Jensen Huang, ha delineato la strategia dell’azienda per adattare la sua potenza di calcolo accelerato a una vasta gamma di applicazioni. Mentre i riflettori erano puntati sulla prossima generazione di GPU ‘Blackwell’ B300 di Nvidia e sulla futura famiglia di acceleratori ‘Rubin’, Huang ha anche sottolineato l’impegno dell’azienda a soddisfare le esigenze delle imprese, dell’edge computing e del regno dell’IA fisica.

Huang ha sottolineato che, mentre i fornitori di servizi cloud sono attratti dalla tecnologia all’avanguardia e dall’approccio full-stack di Nvidia, l’adozione più ampia dell’IA richiede una strategia più sfumata. Ha affermato: “Il calcolo accelerato non riguarda il chip, non riguarda nemmeno il chip e le librerie, il modello di programmazione. Riguarda il chip, il modello di programmazione e un’intera serie di software che ci sta sopra”.

L’Evoluzione dell’IA: Dal Cloud all’Ubiquità

L’impulso iniziale dell’IA potrebbe aver avuto origine nel cloud, ma la sua traiettoria si sta chiaramente estendendo ben oltre. Man mano che l’IA permea vari settori, incontra diverse configurazioni di sistema, ambienti operativi, librerie specifiche del dominio e modelli di utilizzo. Huang ha enfatizzato questa espansione, notando i requisiti unici dell’IT aziendale, della produzione, della robotica, delle auto a guida autonoma e persino dei fornitori di cloud GPU emergenti.

La natura fondamentale del computing viene rimodellata dall’IA e dal machine learning, influenzando tutto, dai processori e sistemi operativi alle applicazioni e alla loro orchestrazione. I flussi di lavoro aziendali si stanno evolvendo dalla semplice estrazione di dati a interazioni interattive di domande e risposte con i sistemi di IA.

L’Ascesa degli Agenti AI e dei Lavoratori Digitali

Huang prevede un futuro in cui gli agenti AI diventeranno parte integrante della forza lavoro digitale. Prevede che, accanto al miliardo di lavoratori della conoscenza del mondo, emergeranno dieci miliardi di lavoratori digitali, che collaboreranno senza soluzione di continuità. Questa presenza ubiqua di agenti AI richiede una nuova generazione di computer, ottimizzati per le loro esigenze operative uniche.

Introduzione di Nuovo Hardware per l’Era dell’IA

Nvidia sta rispondendo a questa esigenza con l’introduzione di due supercomputer AI personali: il DGX Spark e la DGX Station. Questi sistemi desktop sono progettati per l’inferenza e altre attività, offrendo flessibilità per il funzionamento locale o l’integrazione con DGX Cloud di Nvidia e altri ambienti cloud accelerati.

Il DGX Spark vanta il Superchip GB10 Grace Blackwell, che offre prestazioni eccezionali per la messa a punto e l’inferenza dell’IA. La DGX Station, un sistema desktop più potente, presenta il Superchip desktop GB300 Grace-Blackwell Ultra, che offre un’enorme memoria coerente da 784 GB, il SuperNIC ConnectX-8 di Nvidia, la piattaforma software AI Enterprise e l’accesso ai microservizi NIM AI.

Oltre gli Agenti: L’Alba del Ragionamento AI

Questi nuovi sistemi non solo forniscono alle imprese potenti strumenti per i carichi di lavoro AI, ma aprono anche la strada alla prossima fase dell’evoluzione dell’IA: i modelli di ragionamento. Questi modelli rappresentano un significativo passo avanti rispetto agli agenti AI di base, in grado di affrontare problemi complessi e di esibire capacità di ragionamento che superano di gran lunga la natura di prompt-and-reply degli attuali chatbot AI.

Huang ha descritto questo progresso, affermando: “Ora abbiamo IA che possono ragionare, il che significa fondamentalmente scomporre un problema, passo dopo passo. Ora abbiamo IA che possono ragionare passo dopo passo dopo passo usando… tecnologie chiamate catena di pensiero, best of N, controllo di coerenza, pianificazione del percorso, una varietà di tecniche diverse”.

Modelli Nemotron: Potenziare il Ragionamento AI

Basandosi sulle fondamenta gettate al Consumer Electronics Show con la presentazione dei modelli Llama Nemotron e Cosmos Nemotron, Nvidia ha introdotto una famiglia di modelli Llama Nemotron aperti al GTC. Questi modelli vantano capacità di ragionamento migliorate per attività multi-step in matematica, codifica, processo decisionale e rispetto delle istruzioni.

Kari Briski, Vice President of Generative AI Software for the Enterprise di Nvidia, ha sottolineato l’impegno dell’azienda per il supporto agli sviluppatori. Nvidia sta fornendo set di dati, comprendenti 60 miliardi di token di dati generati sinteticamente, e tecniche per facilitare l’adozione di questi modelli.

Briski ha spiegato: “Proprio come gli umani, gli agenti devono comprendere il contesto per scomporre richieste complesse, comprendere l’intento dell’utente e adattarsi in tempo reale”.

I modelli Nemotron offrono diversi livelli di capacità di ragionamento e sono disponibili in tre dimensioni: Nano (ottimizzato per PC e dispositivi edge), Super (elevata precisione e throughput su una singola GPU) e Ultra (progettato per più GPU).

AI-Q Blueprint: Collegare i Dati agli Agenti di Ragionamento

La piattaforma software AI Enterprise di Nvidia viene potenziata con AI-Q Blueprint, un’offerta basata su NIM che consente alle imprese di collegare dati proprietari ad agenti di ragionamento AI. Questo software aperto si integra con lo strumento NeMo Retriever di Nvidia, consentendo l’interrogazione di diversi tipi di dati (testo, immagini, video) e facilitando la collaborazione tra il calcolo accelerato di Nvidia e piattaforme e software di storage di terze parti, inclusi i modelli Llama Nemotron.

Briski ha sottolineato i vantaggi per i team di sviluppo, affermando: “Per i team di agenti connessi, il blueprint fornisce osservabilità e trasparenza nell’attività degli agenti, consentendo agli sviluppatori di migliorare gli agenti nel tempo. Gli sviluppatori possono migliorare la precisione degli agenti e ridurre il completamento di queste attività da ore a minuti”.

AI Data Platform: Un Design di Riferimento per l’Infrastruttura Enterprise

La AI Data Platform di Nvidia funge da design di riferimento per l’infrastruttura enterprise, incorporando agenti di query AI costruiti utilizzando AI-Q Blueprint.

AI Fisica: Unire il Mondo Digitale e Fisico

Huang ha anche affrontato il fiorente campo dell’IA fisica, che prevede l’integrazione dell’IA nei sistemi fisici per consentire la percezione e l’interazione nel mondo reale. Ha previsto che quest’area potrebbe diventare il segmento più grande del mercato dell’IA.

“L’IA che comprende il mondo fisico, cose come l’attrito e l’inerzia, causa ed effetto, permanenza dell’oggetto, quella capacità di comprendere il mondo fisico, il mondo tridimensionale. È ciò che consentirà una nuova era di IA fisica e consentirà la robotica”, ha spiegato Huang.

Progressi nella Robotica e nei Veicoli Autonomi

Diversi annunci hanno sottolineato l’impegno di Nvidia per l’IA fisica, tra cui l’introduzione del Nvidia AI Dataset, specificamente progettato per la robotica e i veicoli autonomi. Questo set di dati consente agli sviluppatori di pre-addestrare, testare, convalidare e mettere a punto modelli di base, sfruttando sia dati reali che sintetici utilizzati nella piattaforma di sviluppo del modello mondiale Cosmos di Nvidia, nel software Drive AV, nella piattaforma di sviluppo di robot Isaac AI e nel framework Metropolis per le smart city.

L’iterazione iniziale del set di dati è disponibile su Hugging Face, offrendo 15 terabyte di dati per l’addestramento della robotica, con il supporto per lo sviluppo di veicoli autonomi previsto per il prossimo futuro.
Inoltre, Nvidia ha annunciato Isaac GROOT N1, un modello di base per robot umanoidi. È addestrato su dati reali e sintetici e rappresenta il progresso del Progetto GROOT.

Espandere gli Orizzonti dell’IA

Le iniziative strategiche di Nvidia dimostrano una chiara visione per il futuro dell’IA, estendendone la portata ben oltre i confini del cloud e nel cuore dell’impresa e del mondo fisico. Attraverso una combinazione di hardware all’avanguardia, piattaforme software innovative e un impegno per l’empowerment degli sviluppatori, Nvidia si sta posizionando come la forza trainante della prossima ondata di innovazione dell’IA. L’introduzione di capacità di ragionamento, insieme allo sviluppo di strumenti e set di dati per l’IA fisica, segna un passo significativo verso un futuro in cui l’IA si integra perfettamente con la nostra vita quotidiana, trasformando le industrie e ridefinendo il modo in cui interagiamo con la tecnologia. L’attenzione alle soluzioni enterprise, all’edge computing e alla robotica evidenzia la comprensione di Nvidia delle diverse ed evolutive esigenze del panorama dell’IA, consolidando la sua posizione di leader in questa rivoluzione tecnologica trasformativa.