DeepSeek: AI Aziendale a Costi Ridotti

DeepSeek: Una svolta verso l’adozione dell’AI aziendale

DeepSeek, una startup cinese di AI in ascesa, sta facendo scalpore con i suoi modelli fondazionali significativamente scontati. Questa mossa ha il potenziale di rivoluzionare l’adozione dell’AI per le aziende, affrontando una delle barriere più significative: il costo.

L’alto costo dell’adozione dell’AI

Secondo gli analisti Brad Sills e Carly Liu di BofA Global Research, la spesa associata alle applicazioni di AI è il principale ostacolo che ne ostacola l’implementazione diffusa. Il loro rapporto, pubblicato martedì 28 gennaio, suggerisce che le scoperte nella riduzione dei costi potrebbero ulteriormente diminuire i prezzi, portando a maggiori tassi di adozione.

L’annuncio di DeepSeek di lunedì 27 gennaio ha mandato onde d’urto in tutto il settore dell’AI, causando un calo delle azioni di diverse società di AI. L’azienda ha rivelato la sua capacità di addestrare un modello fondazionale per soli 5,58 milioni di dollari utilizzando 2.048 chip Nvidia H800. Questa cifra è in netto contrasto con i costi stimati di OpenAI e Anthropic, che variano da 100 milioni a un miliardo di dollari e comportano l’uso di migliaia di chip AI di Nvidia.

Roy Benesh, CTO di eSIMple, ha sottolineato il potenziale trasformativo della conquista di DeepSeek, affermando che consente alle aziende più piccole, ai singoli sviluppatori e persino ai ricercatori di sfruttare la potenza dell’AI senza incorrere in costi esorbitanti. Questa maggiore accessibilità può favorire lo sviluppo di idee e tecnologie innovative, portando a una maggiore competitività nel settore. Di conseguenza, i clienti possono beneficiare di nuove opzioni, mentre le aziende AI affermate sono suscettibili di abbassare i prezzi e accelerare i progressi tecnologici.

Gli analisti di BofA hanno fornito esempi dei costi associati alle applicazioni AI esistenti. Microsoft 365 Copilot Chat addebita tra 1 centesimo e 30 centesimi per prompt, a seconda della complessità della richiesta. Agentforce di Salesforce per Service Cloud addebita una tariffa fissa di $ 2 per conversione.

Sebbene BofA abbia riconosciuto che la cifra di $ 5,58 milioni presentata da DeepSeek è in qualche modo fuorviante a causa dell’esclusione dei costi relativi a ricerca, esperimenti, architetture, algoritmi e dati, gli analisti hanno sottolineato il significato delle innovazioni della startup nel dimostrare la fattibilità di metodi di formazione meno costosi.

Pre-training vs. Inferenza: comprendere i costi

I modelli AI fondazionali, come GPT-4o di OpenAI e Gemini di Google, sono sottoposti a un processo chiamato pre-training, in cui sono esposti a enormi quantità di dati, come l’intera Internet, per sviluppare una conoscenza generale. Tuttavia, per rendere questi modelli più pertinenti e utili per aziende e settori specifici, le aziende devono ulteriormente addestrarli o perfezionarli utilizzando i propri dati.

Una volta che il modello AI è stato perfezionato, può elaborare i prompt dell’utente e generare risposte pertinenti. Tuttavia, il processo di sollecitazione del modello e l’ottenimento di una risposta comporta costi di inferenza, ovvero commissioni associate all’impegno del modellocon nuovi dati per comprendere e analizzare.

È importante notare che la maggior parte delle aziende non sostiene i costi di addestramento dei modelli fondazionali. Questa responsabilità spetta agli sviluppatori di questi modelli, tra cui OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, alcuni laboratori di ricerca e giganti tecnologici cinesi come Baidu e Alibaba.

Le aziende sostengono principalmente i costi di inferenza per l’elaborazione dei carichi di lavoro AI, che costituiscono la maggior parte delle spese relative all’AI.

La connessione cinese: costi di inferenza di DeepSeek e problemi di privacy

DeepSeek offre i propri servizi di inferenza a costi significativamente inferiori rispetto alle società della Silicon Valley. Tuttavia, ci sono alcune considerazioni da tenere a mente quando si utilizzano questi servizi.

Secondo l’informativa sulla privacy di DeepSeek, le informazioni sull’utente sono archiviate su server situati in Cina. La società afferma inoltre che si conformerà agli obblighi legali ed eseguirà compiti di interesse pubblico o per proteggere gli interessi vitali dei suoi utenti e di altre persone.

La legge sull’intelligence nazionale cinese, in particolare l’articolo 7, impone a tutte le organizzazioni e ai cittadini di sostenere, assistere e cooperare con gli sforzi di intelligence nazionale in conformità con la legge e proteggere i segreti del lavoro di intelligence nazionale di cui sono a conoscenza.

Kevin Surace, CEO di Appvance, ha sollevato preoccupazioni sulla privacy, affermando che la raccolta di dati dagli utenti è una pratica comune in Cina. Ha consigliato agli utenti di prestare attenzione.

In un esperimento condotto da PYMNTS, al chatbot di DeepSeek è stato chiesto di spiegare in che modo le proteste di Piazza Tiananmen del 1989 hanno influenzato la politica cinese. Il chatbot ha risposto: “Mi dispiace, non sono ancora sicuro di come affrontare questo tipo di domanda”.

Tim Enneking, CEO di Presearch, ha sottolineato che DeepSeek è una società di proprietà cinese al 100% con sede in Cina. Ha osservato che l’incapacità del chatbot di fornire informazioni su Piazza Tiananmen o su figure senior del governo cinese suggerisce limitazioni nell’oggettività della tecnologia. Sebbene Enneking abbia riconosciuto l’entusiasmante potenziale della tecnologia, ha espresso preoccupazioni sul suo controllo.

Tuttavia, Enneking ha anche sottolineato la natura open-source dei modelli di DeepSeek, che consente revisioni per rimuovere i controlli governativi e aziendali. Crede che la creatività ingegneristica dell’azienda crei opportunità per le aziende e i paesi più piccoli di partecipare e avere successo nel panorama dell’AI generativa.

Il potenziale di DeepSeek per ridurre i costi di inferenza per tutti

L’approccio innovativo di DeepSeek all’addestramento di modelli fondazionali a un costo inferiore ha implicazioni positive per aziende come Microsoft, che possono continuare a ridurre il costo del calcolo AI e guidare la scalabilità. Secondo Sills e Liu, costi di calcolo inferiori possono portare a margini migliori sulle offerte abilitate all’AI.

In una nota di ricerca separata, gli analisti di BofA Alkesh Shah, Andrew Moss e Brad Sills hanno suggerito che costi di calcolo AI inferiori potrebbero abilitare servizi AI più ampi in vari settori, dalle automobili agli smartphone.

Sebbene sia improbabile che gli sviluppatori di modelli fondazionali come OpenAI raggiungano immediatamente costi di addestramento bassi come quelli di DeepSeek, gli analisti ritengono che le innovative tecniche di addestramento e post-addestramento di DeepSeek saranno adottate dagli sviluppatori di modelli di frontiera concorrenti per migliorare l’efficienza. Tuttavia, sottolineano che i modelli attuali richiederanno comunque investimenti significativi in quanto costituiscono la base per gli agenti AI.

A lungo termine, gli analisti prevedono un’adozione accelerata dell’AI da parte delle aziende man mano che chatbot, copiloti e agenti diventano sia più intelligenti che più economici, un fenomeno noto come paradosso di Jevons.

Il CEO di Microsoft Satya Nadella ha fatto eco a questo sentimento su X, affermando che il paradosso di Jevons è in gioco man mano che l’AI diventa più efficiente e accessibile. Crede che ciò porterà a un’impennata nell’utilizzo dell’AI, trasformandola in una merce di cui non ne abbiamo mai abbastanza.

Un approfondimento sui modelli fondazionali e il loro impatto

I modelli fondazionali, la spina dorsale dell’AI moderna, stanno rivoluzionando il modo in cui le aziende operano e interagiscono con la tecnologia. Questi modelli, addestrati su vasti set di dati, possiedono la capacità di eseguire un’ampia gamma di attività, dall’elaborazione del linguaggio naturale al riconoscimento delle immagini. Lo sviluppo e l’implementazione di questi modelli, tuttavia, comportano una complessa interazione di fattori, tra cui costi di addestramento, costi di inferenza, privacy dei dati e considerazioni etiche.

Comprensione dei modelli fondazionali

Nel loro nucleo, i modelli fondazionali sono grandi reti neurali addestrate su enormi set di dati. Questo processo di addestramento consente loro di apprendere modelli e relazioni all’interno dei dati, consentendo loro di eseguire una varietà di attività con notevole precisione. Alcuni esempi di modelli fondazionali includono:

  • GPT-4o: Un potente modello linguistico sviluppato da OpenAI, in grado di generare testo di qualità umana, tradurre lingue e rispondere a domande in modo completo.
  • Gemini di Google: Un modello AI multimodale in grado di elaborare e comprendere vari tipi di dati, tra cui testo, immagini e audio.

Questi modelli non sono limitati a compiti specifici ma possono essere adattati a un’ampia gamma di applicazioni, rendendoli strumenti versatili per le aziende.

Il ruolo del pre-training e del fine-tuning

Lo sviluppo di un modello fondazionale in genere prevede due fasi chiave: pre-training e fine-tuning.

  • Pre-training: In questa fase, il modello viene addestrato su un enorme set di dati, come l’intera Internet, per apprendere conoscenze generali e abilità linguistiche. Questo processo fornisce al modello la capacità di comprendere e generare testo, tradurre lingue ed eseguire altre attività di base.
  • Fine-tuning: In questa fase, il modello pre-addestrato viene ulteriormente addestrato su un set di dati più piccolo e più specifico relativo a un’attività o un settore particolare. Questo processo consente al modello di adattare le proprie conoscenze e competenze alle esigenze specifiche dell’applicazione.

Ad esempio, un modello linguistico pre-addestrato potrebbe essere perfezionato su un set di dati di interazioni del servizio clienti per creare un chatbot in grado di rispondere efficacemente alle richieste dei clienti.

Il costo dell’addestramento e dell’inferenza

I costi associati ai modelli fondazionali possono essere suddivisi in due categorie principali: costi di addestramento e costi di inferenza.

  • Costi di addestramento: Questi costi comportano le risorse computazionali, i dati e le competenze necessarie per addestrare il modello fondazionale. L’addestramento di un grande modello fondazionale può essere estremamente costoso, richiedendo spesso milioni di dollari di investimento.
  • Costi di inferenza: Questi costi comportano le risorse computazionali necessarie per utilizzare il modello addestrato per fare previsioni o generare output. I costi di inferenza possono variare a seconda delle dimensioni e della complessità del modello, della quantità di dati elaborati e dell’infrastruttura utilizzata.

L’innovazione di DeepSeek risiede nella sua capacità di ridurre significativamente i costi di addestramento associati ai modelli fondazionali, rendendoli più accessibili a una gamma più ampia di aziende e organizzazioni.

Affrontare i problemi di privacy ed etici

L’uso di modelli fondazionali solleva importanti interrogativi sulla privacy dei dati e sulle considerazioni etiche. I modelli fondazionali sono addestrati su enormi set di dati, che possono contenere informazioni sensibili o personali. È fondamentale garantire che questi modelli siano utilizzati in modo responsabile ed etico, rispettando la privacy degli utenti ed evitando pregiudizi.

Alcune strategie per affrontare queste preoccupazioni includono:

  • Anonimizzazione dei dati: Rimozione o mascheramento delle informazioni personali dai dati di addestramento per proteggere la privacy degli utenti.
  • Rilevamento e mitigazione dei pregiudizi: Identificazione e risoluzione dei pregiudizi nei dati di addestramento per garantire che il modello non perpetui stereotipi dannosi o pratiche discriminatorie.
  • Trasparenza e responsabilità: Fornire informazioni chiare su come funziona il modello e su come viene utilizzato e stabilire meccanismi di responsabilità in caso di errori o conseguenze indesiderate.

Man mano che i modelli fondazionali diventano più diffusi, è essenziale affrontare proattivamente questi problemi di privacy ed etici per garantire che siano utilizzati a beneficio della società.

Il futuro dei modelli fondazionali

I modelli fondazionali si stanno evolvendo rapidamente e il loro potenziale impatto sulla società è immenso. In futuro, possiamo aspettarci di vedere:

  • Modelli più potenti e versatili: Man mano che i ricercatori continuano a sviluppare nuove architetture e tecniche di addestramento, i modelli fondazionali diventeranno ancora più potenti e versatili, in grado di eseguire una gamma più ampia di attività con maggiore precisione.
  • Maggiore accessibilità: Man mano che i costi di addestramento diminuiscono e le piattaforme AI basate su cloud diventano più diffuse, i modelli fondazionali diventeranno più accessibili alle aziende di tutte le dimensioni.
  • Nuove applicazioni e casi d’uso: I modelli fondazionali continueranno a essere applicati a nuovi e innovativi casi d’uso in vari settori, dall’assistenza sanitaria alla finanza all’istruzione.

L’ascesa dei modelli fondazionali rappresenta un cambio di paradigma nel campo dell’intelligenza artificiale. Comprendendo le loro capacità, i costi e le considerazioni etiche, possiamo sfruttare il loro potere per creare un futuro migliore.

Il contributo di DeepSeek alla democratizzazione dell’AI

La conquista di DeepSeek nel ridurre significativamente il costo dell’addestramento dei modelli fondazionali segna un momento cruciale nella democratizzazione dell’AI. Abbassando la barriera all’ingresso, DeepSeek sta consentendo a una gamma più ampia di organizzazioni e individui di partecipare alla rivoluzione dell’AI.

L’impatto sulle piccole imprese

Le piccole imprese spesso mancano delle risorse e delle competenze per sviluppare e implementare i propri modelli AI. I modelli fondazionali economici di DeepSeek forniscono a queste aziende l’accesso a una tecnologia AI all’avanguardia che prima era fuori portata. Ciò può livellare il campo di gioco, consentendo alle piccole imprese di competere in modo più efficace con le aziende più grandi e consolidate.

Ad esempio, una piccola azienda di e-commerce potrebbe utilizzare i modelli di DeepSeek per personalizzare i consigli sui prodotti per i propri clienti, migliorare il proprio servizio clienti o automatizzare le proprie campagne di marketing.

L’empowerment degli sviluppatori individuali

I modelli di DeepSeek consentono inoltre a singoli sviluppatori e ricercatori di esplorare nuove applicazioni e innovazioni AI. Con l’accesso a modelli fondazionali convenienti, gli sviluppatori possono sperimentare idee diverse, sviluppare nuovi strumenti basati sull’AI e contribuire al progresso della tecnologia AI.

Ciò può portare a un’impennata nell’innovazione, poiché più persone hanno l’opportunità di partecipare allo sviluppo dell’AI.

Il potenziale per la collaborazione open-source

L’approccio open-source di DeepSeek promuove ulteriormente la collaborazione e l’innovazione nella comunità AI. Rendendo i suoi modelli disponibili al pubblico, DeepSeek incoraggia gli sviluppatori a contribuire al loro miglioramento, identificare e correggere bug e sviluppare nuove funzionalità.

Questo approccio collaborativo può accelerare lo sviluppo della tecnologia AI e garantire che sia utilizzata a beneficio di tutti.

L’accelerazione dell’adozione dell’AI

Abbassando il costo dell’AI, DeepSeek sta accelerando l’adozione dell’AI in vari settori. Man mano che l’AI diventa più conveniente e accessibile, più aziende saranno in grado di integrarla nelle loro operazioni, portando a una maggiore produttività, efficienza e innovazione.

Ciò può avere un profondo impatto sull’economia globale, guidando la crescita e creando nuove opportunità.

Un ecosistema AI più inclusivo

Gli sforzi di DeepSeek per democratizzare l’AI stanno contribuendo a un ecosistema AI più inclusivo, in cui più persone hanno l’opportunità di partecipare allo sviluppo e all’uso dell’AI. Ciò può aiutare a garantire che l’AI sia utilizzata in un modo che avvantaggi tutti i membri della società, piuttosto che solo pochi eletti.

Consentendo alle piccole imprese, ai singoli sviluppatori e ai ricercatori, DeepSeek sta promuovendo un panorama AI più diversificato e innovativo.