OpenAI svela GPT-4.5, non è un modello 'frontier'

Un Passo Avanti, Non un Salto da Gigante

OpenAI sta implementando il suo ultimo modello di intelligenza artificiale, internamente noto come Orion. Sebbene ufficialmente denominato GPT-4.5, questa versione non è classificata come un modello “di frontiera” dall’azienda.

GPT-4.5 viene reso disponibile agli utenti di ChatGPT Pro come anteprima di ricerca. OpenAI lo definisce il suo “modello più informato finora”, ma le comunicazioni iniziali avvertivano che potrebbe non eguagliare le prestazioni di modelli come o1 o o3-mini. Ciò suggerisce un focus sul perfezionamento e sull’efficienza piuttosto che su progressi rivoluzionari.

Capacità Potenziate, Interazione Raffinata

Cosa possono aspettarsi gli utenti da GPT-4.5? OpenAI evidenzia miglioramenti in diverse aree chiave:

  • Abilità di scrittura: il modello è progettato per essere un assistente di scrittura più capace.
  • Conoscenza del mondo ampliata: GPT-4.5 possiede una comprensione più ampia dei concetti e delle informazioni del mondo reale.
  • ‘Personalità raffinata’: OpenAI afferma che le interazioni con questo modello saranno più naturali e intuitive.

L’azienda sottolinea la capacità di GPT-4.5 di riconoscere schemi e trarre connessioni, rendendolo particolarmente adatto per attività come la scrittura, la programmazione e la risoluzione di problemi pratici.

Non un Modello di Frontiera: Comprendere la Distinzione

Nonostante questi miglioramenti, OpenAI è chiara sul fatto che GPT-4.5 non rappresenta un salto verso capacità completamente nuove. Un documento trapelato, successivamente rivisto, ha fornito ulteriore contesto:

“GPT-4.5 non è un modello di frontiera, ma è il più grande LLM di OpenAI, migliorando l’efficienza computazionale di GPT-4 di oltre 10 volte”, affermava il documento. “Non introduce 7 nuove capacità di frontiera nette rispetto alle precedenti versioni di ragionamento e le sue prestazioni sono inferiori a quelle di o1, o3-mini e della ricerca approfondita sulla maggior parte delle valutazioni di preparazione”.

Questa distinzione è importante. Suggerisce che, sebbene GPT-4.5 sia un aggiornamento significativo in termini di scala ed efficienza, non spinge i confini delle capacità dell’IA nello stesso modo in cui farebbe un modello “di frontiera”.

Formazione e Sviluppo

I rapporti indicano che OpenAI ha utilizzato il suo modello di ragionamento o1 (nome in codice Strawberry) e dati sintetici per addestrare GPT-4.5. L’azienda conferma una combinazione di nuove tecniche di supervisione e metodi consolidati:

  • Supervised Fine-Tuning (SFT)
  • Reinforcement Learning from Human Feedback (RLHF)

Questi sono simili agli approcci utilizzati nello sviluppo di GPT-4o.

Affrontare le Allucinazioni e Migliorare la Collaborazione

Un miglioramento notevole è la riduzione delle allucinazioni. Secondo OpenAI, GPT-4.5 ha allucinazioni meno frequentemente di GPT-4o e persino leggermente meno del modello o1.

Raphael Gontijo Lopes, un ricercatore di OpenAI, ha sottolineato l’attenzione alla collaborazione: “Abbiamo allineato GPT-4.5 per essere un collaboratore migliore, rendendo le conversazioni più calorose, intuitive ed emotivamente sfumate”. Ha notato che i tester umani hanno valutato GPT-4.5 più in alto di GPT-4o in varie categorie.

La Prospettiva del CEO: Riconoscere i Limiti

Il CEO di OpenAI, Sam Altman, in un post su X, ha riconosciuto la natura di GPT-4.5: “modello gigante e costoso” che “non schiaccerà i benchmark”. Questa valutazione candida rafforza l’idea che questa versione riguardi il progresso incrementale piuttosto che scoperte rivoluzionarie.

Piano di Implementazione

L’implementazione di GPT-4.5 segue un approccio a più livelli:

  1. Utenti Pro: accesso immediato come anteprima di ricerca.
  2. Utenti Plus e Team: disponibilità prevista per la prossima settimana.
  3. Utenti Enterprise ed Edu: accesso successivo agli utenti Plus e Team.

Il modello è disponibile anche tramite la piattaforma AI Foundry di Microsoft Azure, insieme alle offerte di Stability, Cohere e Microsoft stessa.

Precisione e Allucinazioni Ridotte

OpenAI evidenzia la maggiore precisione di GPT-4.5, affermando che genera risposte più accurate e ha meno allucinazioni rispetto agli altri suoi modelli. Questo è un passo avanti cruciale, poiché le allucinazioni (generazione di informazioni false o prive di senso) sono state una sfida persistente nei modelli linguistici di grandi dimensioni.

Guardando Avanti: GPT-5 e il Percorso verso l’AGI

Precedenti rapporti suggerivano una tempistica per le versioni di OpenAI: GPT-4.5 entro la fine di febbraio e GPT-5 già alla fine di maggio. Altman ha descritto GPT-5 come un “sistema che integra molta della nostra tecnologia”. Si prevede che incorporerà il nuovo modello di ragionamento o3 di OpenAI, che è stato anticipato durante gli annunci “12 giorni di Natale” dell’azienda a dicembre.

Mentre o3-mini è stato rilasciato in precedenza, il modello o3 completo è riservato al sistema GPT-5. Ciò è in linea con la visione più ampia di OpenAI di combinare i suoi modelli linguistici di grandi dimensioni per creare un sistema più capace, potenzialmente avvicinandosi al regno dell’intelligenza artificiale generale (AGI).

Approfondimento dell’Architettura di GPT-4.5

Sebbene OpenAI non abbia rilasciato dettagli tecnici esaustivi, è possibile trarre diverse deduzioni sull’architettura di GPT-4.5 in base alle informazioni disponibili:

  • Conteggio dei parametri più elevato: descritto come il “più grande LLM” di OpenAI, è ragionevole presumere che GPT-4.5 vanti un conteggio dei parametri significativamente più elevato rispetto ai suoi predecessori. Questa maggiore capacità probabilmente contribuisce alla sua migliore base di conoscenza e capacità di ragionamento.

  • Efficienza computazionale ottimizzata: il documento trapelato menzionava un miglioramento “superiore a 10 volte” nell’efficienza computazionale rispetto a GPT-4. Ciò suggerisce perfezionamenti architetturali che consentono al modello di elaborare le informazioni in modo più efficace, portando potenzialmente a tempi di risposta più rapidi e a un consumo energetico ridotto.

  • Meccanismi di attenzione migliorati: data l’enfasi sul riconoscimento di schemi e sulla creazione di connessioni, è probabile che GPT-4.5 incorpori progressi nei meccanismi di attenzione. Questi meccanismi consentono al modello di concentrarsi sulle parti più rilevanti del testo di input, portando a risposte più coerenti e contestualmente appropriate.

  • Dati di addestramento perfezionati: l’uso di “nuove tecniche di supervisione” suggerisce miglioramenti nella qualità e nella diversità dei dati di addestramento. Ciò potrebbe comportare l’incorporazione di set di dati più specializzati, lo sfruttamento della generazione di dati sintetici o l’impiego di metodi più sofisticati per filtrare e pulire i dati esistenti.

Il Ruolo dei Dati Sintetici

L’uso segnalato di dati sintetici nell’addestramento di GPT-4.5 è particolarmente degno di nota. I dati sintetici, generati dagli stessi modelli di intelligenza artificiale, offrono diversi potenziali vantaggi:

  • Superare la scarsità di dati: può essere utilizzato per aumentare i set di dati esistenti, in particolare in settori in cui i dati del mondo reale sono limitati o difficili da ottenere.

  • Affrontare i bias: i dati sintetici possono essere accuratamente realizzati per mitigare i bias presenti nei set di dati del mondo reale, portando a modelli di intelligenza artificiale più equi ed equi.

  • Esplorare scenari ipotetici: consente ai ricercatori di addestrare modelli su scenari che potrebbero essere rari o impossibili da osservare nel mondo reale, migliorando la loro capacità di gestire situazioni impreviste.

Tuttavia, l’uso di dati sintetici solleva anche preoccupazioni:

  • Potenziale per amplificare i bias: se non attentamente controllati, i dati sintetici possono inavvertitamente amplificare i bias esistenti o introdurne di nuovi.

  • Rischio di overfitting: i modelli addestrati principalmente su dati sintetici potrebbero funzionare bene su dati sintetici simili, ma faticare a generalizzare agli input del mondo reale.

L’approccio di OpenAI all’utilizzo dei dati sintetici probabilmente prevede un’attenta convalida e test per mitigare questi rischi.

La ‘Personalità Raffinata’: Uno Sguardo Più da Vicino

L’affermazione di OpenAI secondo cui GPT-4.5 ha una ‘personalità raffinata’ è intrigante. Ciò suggerisce sforzi per rendere le interazioni del modello più coinvolgenti, naturali ed emotivamente intelligenti. Ciò potrebbe comportare diverse tecniche:

  • Fine-tuning sui dati conversazionali: addestrare il modello su ampi set di dati di conversazioni umane per comprendere meglio le sfumature del linguaggio, il tono e i segnali sociali.

  • Incorporare modelli di intelligenza emotiva: integrare modelli specializzati progettati per riconoscere e rispondere alle emozioni umane, consentendo a GPT-4.5 di adattare il suo stile di comunicazione di conseguenza.

  • Reinforcement Learning con feedback umano: utilizzare il feedback umano per premiare le risposte percepite come più naturali, coinvolgenti ed empatiche.

L’obiettivo è creare un’esperienza di conversazione più simile a quella umana, andando oltre le interazioni puramente funzionali per favorire un senso di connessione e rapporto.

Implicazioni per Diversi Gruppi di Utenti

L’implementazione scaglionata di GPT-4.5 suggerisce diverse implicazioni per vari gruppi di utenti:

  • Utenti Pro: in quanto early adopter, gli utenti Pro avranno l’opportunità di sperimentare le capacità del modello e fornire feedback a OpenAI. Questo feedback sarà cruciale per plasmare l’ulteriore sviluppo del modello.

  • Utenti Plus e Team: questi utenti trarranno probabilmente vantaggio dalle prestazioni migliorate e dallo stile di interazione raffinato di GPT-4.5 nelle loro attività quotidiane, come la scrittura, la codifica e la ricerca.

  • Utenti Enterprise ed Edu: per questi utenti, la maggiore precisione e le allucinazioni ridotte potrebbero essere particolarmente preziose, garantendo risultati più affidabili e affidabili in contesti professionali ed educativi.

  • Utenti di Microsoft Azure AI Foundry: la disponibilità di GPT-4.5 su questa piattaforma espande l’accesso al modello per sviluppatori e ricercatori, promuovendo l’innovazione e la creazione di nuove applicazioni basate sull’intelligenza artificiale.

Il Contesto Più Ampio: la Strategia di OpenAI

Il rilascio di GPT-4.5, pur non essendo un modello di frontiera, si inserisce nella più ampia strategia di OpenAI di sviluppo iterativo e graduale progresso verso l’AGI. Rilasciando miglioramenti incrementali, OpenAI può:

  • Raccogliere feedback degli utenti: perfezionare continuamente i propri modelli in base all’utilizzo nel mondo reale e al feedback.

  • Gestire le aspettative: evitare l’eccessivo clamore e stabilire aspettative realistiche per ogni versione.

  • Mantenere un vantaggio competitivo: rimanere all’avanguardia nel campo in rapida evoluzione dell’IA.

  • Prepararsi per future scoperte: gettare le basi per progressi più significativi, come GPT-5.

Questo approccio contrasta con le versioni “big bang” di alcune altre società di intelligenza artificiale, suggerendo un approccio più cauto e misurato allo sviluppo e all’implementazione di sistemi di intelligenza artificiale sempre più potenti. L’attenzione non è solo spingere i confini di ciò che è possibile, ma anche garantire sicurezza, affidabilità e soddisfazione dell’utente.
Lo sviluppo e l’implementazione di modelli come GPT-4.5 sollevano molte domande:

  • Come possiamo misurare se il modello ha una “personalità raffinata”?
  • Quali sono le implicazioni di un modello che ha meno allucinazioni?
  • Qual è l’importanza di rilasciare un modello che non è un modello di frontiera?

Queste sono tutte buone domande e non ci sono risposte definitive.