GPT-4.5, IA nello spazio e futuro

GPT-4.5: Un Perfezionamento, Non una Rivoluzione

OpenAI ha recentemente reso disponibile GPT-4.5 agli utenti di ChatGPT Pro, con piani di estensione a breve per gli account Plus, Team, Enterprise ed Education. Conosciuto internamente come ‘Orion’, questo modello vanta una “migliore comprensione dell’intento umano, interpretando segnali sottili e aspettative implicite con maggiore sfumatura e intelligenza emotiva”, secondo OpenAI. Sfrutta nuove tecniche di supervisione insieme al tradizionale fine-tuning e all’apprendimento per rinforzo dal feedback umano, rispecchiando il processo di sviluppo di GPT-4o. GPT-4.5 offre funzionalità di ricerca in tempo reale, supporta il caricamento di file e immagini e si integra con una canvas per la scrittura e la programmazione. Tuttavia, attualmente manca delle funzionalità multimodali come la modalità vocale, video o la condivisione dello schermo presenti in ChatGPT.

OpenAI sottolinea che l’apprendimento non supervisionato migliora l’accuratezza e l’intuizione di un modello. Questo approccio è stato una forza trainante dietro i progressi in modelli come GPT-3.5, GPT-4 e, ora, GPT-4.5. Separatamente, il ragionamento su scala addestra i modelli a elaborare le informazioni in modo sistematico, generando una catena di pensiero prima di rispondere. Questo approccio metodico migliora la loro capacità di affrontare intricati problemi STEM e logici, come dimostrato da modelli come OpenAI o1 e OpenAI o3-mini. GPT-4.5 è presentato come un esempio lampante di apprendimento non supervisionato su scala, sfruttando una maggiore potenza di calcolo, set di dati più grandi e innovazione architetturale. Addestrato sui supercomputer Microsoft Azure AI, possiede presumibilmente una conoscenza più ampia e una comprensione più profonda del mondo, riducendo le allucinazioni e aumentando l’affidabilità.

Nonostante questi progressi, GPT-4.5 non ha generato un entusiasmo significativo. È percepito come un miglioramento incrementale piuttosto che un salto rivoluzionario. Mentre OpenAI vanta una maggiore intelligenza emotiva, sfumatura e creatività, molti utenti non hanno osservato una differenza sostanziale rispetto a GPT-4o. L’assenza di progressi multimodali, una caratteristica chiave di GPT-4o, contribuisce ulteriormente a questa percezione.

Inoltre, GPT-4.5 ha dimostrato una tendenza a produrre output privi di senso. Lo strumento di benchmarking interno di OpenAI per la fattualità, SimpleQA, rivela che GPT-4.5 allucina (presenta invenzioni come fatti con sicurezza) il 37,1% delle volte. Questa è una preoccupazione significativa, anche se confrontata con GPT-4o, un altro modello avanzato di “ragionamento”, che allucina il 61,8% delle volte sullo stesso benchmark. Il modello o3-mini, più piccolo ed economico, mostra un tasso di allucinazione ancora più elevato dell’80,3%.

L’attuale panorama dell’IA, con concorrenti come Anthropic con Claude 3.7 e i progressi di Google con Gemini, ha alzato le aspettative per aggiornamenti significativi. Gli utenti cercano scoperte, non solo perfezionamenti, e GPT-4.5, nella sua forma attuale, sembra non essere all’altezza di questo obiettivo.

L’Ascesa dei Modelli di Ragionamento e la Fiducia degli Investitori

Elon Musk ha recentemente suggerito su X che l’Intelligenza Artificiale Generale (AGI) è all’orizzonte. Questa affermazione arriva nel mezzo di una fervente corsa tra giganti tecnologici come OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic e la stessa xAI di Musk per sviluppare modelli di ragionamento: sistemi di IA progettati per emulare il pensiero umano.

Gli investitori stanno chiaramente mostrando entusiasmo per questo obiettivo. Poco dopo aver lanciato Claude 3.7 Sonnet con ragionamento ibrido, Anthropic si è assicurata un sostanziale round di finanziamento di Serie E da 3,5 miliardi di dollari. Questo ha triplicato la sua valutazione a 61,5 miliardi di dollari, consolidando la sua posizione come uno dei principali concorrenti di OpenAI. L’investimento, guidato da Lightspeed Venture Partners e che include Salesforce Ventures, Cisco, Fidelity, Jane Street e altri, sarà utilizzato per espandere la potenza di calcolo per lo sviluppo dell’IA, migliorare la ricerca sulla sicurezza e accelerare la crescita globale.

Spingere i Limiti del Ragionamento: Il Benchmark BBEH

I Large Language Models (LLM) sono sempre più integrati nelle applicazioni quotidiane, richiedendo solide capacità di ragionamento in diversi ambiti. Tuttavia, i benchmark esistenti spesso danno la priorità alla matematica e alla programmazione, trascurando altri tipi cruciali di ragionamento. Mentre il set di dati BIG-Bench è stato ampiamente utilizzato per valutare gli LLM su compiti di ragionamento complessi, i modelli hanno fatto progressi così significativi che ora raggiungono punteggi quasi perfetti sia su BIG-Bench che sulla sua variante più impegnativa, BIG-Bench Hard (BBH). Questa saturazione rende questi benchmark meno efficaci per valutare ulteriori progressi.

Per affrontare questa limitazione, i ricercatori hanno introdotto BIG-Bench Extra Hard (BBEH). Questo nuovo benchmark sostituisce ogni attività in BBH con una versione significativamente più difficile, pur valutando competenze di ragionamento simili. I test su BBEH rivelano che anche i migliori modelli general-purpose raggiungono solo un punteggio del 9,8%, mentre il modello di punta specificamente progettato per il ragionamento raggiunge il 44,8%. Questi risultati evidenziano le continue sfide che gli LLM affrontano con il ragionamento complesso, indicando un ampio margine di miglioramento. Il documento di ricerca completo fornisce ulteriori dettagli su questo nuovo benchmark.

Satelliti Alimentati dall’IA: Una Nuova Era nell’Esplorazione e nelle Operazioni Spaziali

TakeMe2Space, una startup spacetech con sede a Hyderabad, si è recentemente assicurata 5,5 crore di rupie in un round di finanziamento pre-seed guidato da Seafund, con la partecipazione di Blume Ventures, Artha Venture Fund, AC Ventures e altri angel investors. Questo finanziamento, sebbene modesto, segna un passo significativo verso la creazione del primo laboratorio di IA indiano nello spazio. TakeMe2Space prevede di utilizzare i fondi per sviluppare MOI-1 (My Orbital Infrastructure–Technology Demonstrator), una piattaforma che consentirà agli utenti di caricare modelli di IA per l’osservazione della Terra o altri esperimenti spaziali direttamente su un satellite orbitale tramite una console web chiamata Orbitlab. Gli utenti pagheranno solo per il tempo di utilizzo del satellite, a una tariffa di 2 dollari al minuto.

La piattaforma MOI-TD dell’azienda ha presumibilmente dimostrato la capacità di caricare grandi modelli di IA da una stazione di terra, eseguire codice esterno sul satellite e scaricare in modo sicuro risultati codificati e crittografati. Questo rappresenta un passo verso operazioni satellitari più autonome ed efficienti.

TakeMe2Space non è sola in questo sforzo. Organizzazioni come ESA (con OPS-SAT) e Globalstar stanno anche aprendo la strada ad applicazioni reali della tecnologia satellitare alimentata dall’IA, che vanno dalla comunicazione IoT sicura all’esecuzione di modelli di IA in orbita. Man mano che la tecnologia continua ad avanzare, i satelliti guidati dall’IA sono destinati a diventare sempre più autonomi, portando a operazioni spaziali più efficienti e aprendo nuove possibilità per la ricerca, la sicurezza e la connettività globale.

Tradizionalmente, i satelliti hanno fatto molto affidamento sulle stazioni di terra per l’elaborazione dei dati, il processo decisionale e l’esecuzione dei comandi. I dati dovevano essere scaricati, analizzati sulla Terra e quindi le informazioni elaborate venivano caricate di nuovo sul satellite, un processo che richiedeva tempo e larghezza di banda. Tuttavia, i progressi nell’IA e nell’edge computing (elaborazione dei dati sul dispositivo stesso piuttosto che nel cloud) stanno ora consentendo ai satelliti di elaborare i dati a bordo, prendere decisioni autonome e trasmettere in modo sicuro solo le informazioni più cruciali. Ciò si traduce in operazioni più veloci, più intelligenti e più efficienti.

Il funzionamento dei moderni satelliti alimentati dall’IA prevede in genere tre passaggi chiave:

  1. Uplink degli Algoritmi IA: Gli algoritmi IA vengono trasmessi dalle stazioni di terra ai satelliti, fornendo loro capacità avanzate di elaborazione dei dati.
  2. Analisi dei Dati a Bordo: I modelli IA analizzano immagini, dati dei sensori e altri input direttamente in orbita, riducendo al minimo la necessità di un intervento costante da terra.
  3. Downlink Sicuro delle Informazioni: Invece di trasmettere dati grezzi, i satelliti inviano informazioni crittografate, risparmiando larghezza di banda e migliorando la sicurezza.

Questo approccio guidato dall’IA offre diversi vantaggi. Riduce significativamente la latenza consentendo ai satelliti di elaborare i dati nello spazio, consentendo risposte più rapide alle condizioni in tempo reale senza attendere istruzioni dalle stazioni di terra. L’utilizzo della larghezza di banda è ottimizzato, poiché vengono trasmesse solo le informazioni più rilevanti invece di grandi volumi di dati grezzi. Anche la sicurezza è migliorata attraverso la comunicazione crittografata, mitigando il rischio di minacce informatiche e violazioni dei dati. Questi vantaggi sono particolarmente preziosi in applicazioni come la risposta ai disastri, le operazioni militari e l’esplorazione spaziale.

Le applicazioni reali dei satelliti alimentati dall’IA sono diverse e di grande impatto:

  • Gestione dei Disastri: I satelliti dotati di IA possono rilevare incendi, inondazioni e uragani in tempo reale, consentendo un’azione rapida da parte dei team di risposta alle emergenze.
  • Agricoltura di Precisione: I modelli IA analizzano la salute delle colture e le condizioni del suolo per migliorare le pratiche agricole di precisione.
  • Monitoraggio Ambientale: Le agenzie ambientali utilizzano i dati satellitari per monitorare i livelli di inquinamento dell’aria e dell’acqua.
  • Navigazione Autonoma e Operazioni Spaziali: L’IA migliora l’evitamento delle collisioni prevedendo e reagendo a potenziali minacce, garantendo la sicurezza dei satelliti. Facilita anche il coordinamento delle costellazioni di satelliti, migliorando la copertura e l’efficienza. Inoltre, l’IA svolge un ruolo cruciale nel tracciare e prevedere i movimenti dei detriti orbitali, riducendo il rischio di danni alle infrastrutture spaziali.
  • Difesa e Sicurezza: I sistemi di sorveglianza alimentati dall’IA rilevano attività non autorizzate e movimenti militari con maggiore precisione.
  • Telecomunicazioni e IoT: I satelliti guidati dall’IA contribuiscono a un routing del traffico più intelligente, migliorando la connettività Internet satellitare e garantendo una comunicazione globale senza interruzioni.
  • Esplorazione Spaziale: L’IA migliora l’efficienza dei telescopi spaziali nel rilevare asteroidi ed esopianeti, facendo avanzare significativamente gli sforzi di scoperta spaziale.

Nonostante i numerosi vantaggi, rimangono sfide nello sviluppo e nell’implementazione di satelliti alimentati dall’IA:

  • Potenza di Calcolo Limitata: I satelliti devono funzionare con chip a bassa potenza e resistenti alle radiazioni, che limitano le capacità dell’IA.
  • Ambiente Spaziale Ostile: L’esposizione alle radiazioni comporta il rischio di malfunzionamenti hardware.
  • Minacce alla Sicurezza: Il caricamento e l’esecuzione di codice esterno nello spazio richiedono un’attenta gestione per prevenire attacchi informatici.
  • Costi e Tempi di Sviluppo: Costruire, testare e convalidare hardware satellitare compatibile con l’IA è un processo costoso e dispendioso in termini di tempo.
  • Requisiti di Adattabilità: I modelli IA distribuiti in orbita devono essere altamente adattabili, funzionando con aggiornamenti minimi e adattandosi autonomamente a nuovi scenari.

IA Sbloccata: Eliminare le Frasi Ripetitive in ChatGPT

L’IA può essere uno strumento prezioso nella creazione di contenuti, assistendo nella scrittura, nel brainstorming, nel miglioramento della chiarezza, nel perfezionamento della struttura e nel miglioramento della leggibilità complessiva. Tuttavia, un problema comune con il testo generato dall’IA è la sua tendenza verso un linguaggio formulaico a causa di scelte di parole ripetitive. Invece di fornire messaggi freschi e di grande impatto, l’IA spesso si affida a schemi familiari, riducendo l’efficacia e l’originalità.

Parole e frasi abusate, come “delve” (approfondire), “tapestry” (arazzo), “vibrant” (vibrante), “landscape” (paesaggio), “realm” (regno), “embark” (intraprendere), “excels” (eccelle), “It’s important to note…” (È importante notare…) e “A testament to…” (Una testimonianza di…), possono sminuire significativamente la qualità dei contenuti generati dall’IA. Per i product marketer, questa ripetizione può rendere i messaggi meno convincenti, ridurre il coinvolgimento del pubblico, indebolire la differenziazione del marchio e impedire che approfondimenti e messaggi strategici si distinguano in un mercato affollato.

Sfruttando la funzionalità di memoria di ChatGPT, è possibile mitigare questo problema ed eliminare parole e frasi abusate. Ecco come utilizzare efficacemente questa funzionalità:

Accesso: È possibile accedere a ChatGPT tramite il suo sito Web o l’app mobile.

Vantaggi:

  • Originalità Migliorata: Assicura che i contenuti generati dall’IA risultino meno robotici e più umani.
  • Messaggistica del Marchio Migliorata: Evita frasi generiche che indeboliscono la differenziazione del marchio.
  • Coinvolgimento Potenziato: Incoraggia una comunicazione più efficace riducendo la ridondanza.

Esempio: Generazione di Contenuti di Product Marketing

Si consideri un product marketer incaricato di redigere contenuti per il lancio di un nuovo prodotto. Una richiesta iniziale a ChatGPT potrebbe risultare in una risposta piena di frasi ripetitive e generiche come “delving into an intricate landscape of innovation…” (approfondendo un intricato paesaggio di innovazione…), rendendo il messaggio poco ispirato.

Per creare contenuti più avvincenti e unici, il marketer può seguire questi passaggi:

  1. Impostazione del Prompt: Il marketer istruisce esplicitamente ChatGPT: “Per favore, evita le seguenti parole: delve, tapestry, vibrant, landscape, realm, embark, excels. Memorizza questo.”. Questo istruisce ChatGPT a filtrare attivamente questi termini nelle sue risposte.
  2. Utilizzo della Memoria Persistente: La frase “Memorizza questo” assicura che ChatGPT conservi queste istruzioni specifiche su più interazioni. Ciò consente di evitare in modo persistente le parole e le frasi specificate. ChatGPT controllerà la sua memoria prima di generare il testo e aderirà alle istruzioni per evitare i termini designati.
  3. Revisione Manuale: Dopo aver generato la risposta, il marketer rivede il contenuto per eventuali ridondanze rimanenti e perfeziona il linguaggio per chiarezza e impatto.

Efficacia:

  • Personalizzazione del Prompt: Istruzioni specifiche aiutano a modellare l’output dell’IA.
  • Conservazione della Memoria: ChatGPT può memorizzare e seguire le regole di evitamento delle parole tra le conversazioni.
  • Perfezionamento Manuale: Una modifica umana finale garantisce chiarezza e autenticità.

Nota: Gli strumenti e le analisi presentati in questa sezione si basano su test interni e dimostrano un chiaro valore. Le raccomandazioni sono indipendenti e non influenzate dai creatori degli strumenti.

Ulteriori Notizie e Sviluppi sull’IA

  • Smartphone Alimentati dall’IA in Aumento: Deutsche Telekom ha annunciato al Mobile World Congress 2025 a Barcellona l’intenzione di lanciare uno smartphone alimentato dall’IA con un assistente Perplexity. Questo assistente è progettato per semplificare le attività quotidiane come ordinare taxi, prenotare tavoli, tradurre lingue in tempo reale e rispondere alle domande degli utenti. L’azienda lo immagina come un assistente virtuale che supporterà milioni di clienti scrivendo e-mail, avviando chiamate, riassumendo testi e gestendo calendari. L’AI Phone integrerà Google Cloud AI, ElevenLabs e Picsart per migliorarne la funzionalità e il lancio è previsto entro la fine dell’anno. Glance, un’unità di InMobi, e Google Cloud hanno anche annunciato una collaborazione per sfruttare i modelli di IA di Google per lo sviluppo di applicazioni di IA rivolte ai consumatori per migliorare le esperienze degli utenti sugli schermi di blocco degli smartphone e sugli schermi TV ambientali. Glance attualmente alimenta oltre 450 milioni di smartphone basati su Android in tutto il mondo.

  • I Settori Governativi Vedono un Calo degli Incidenti Informatici Critici: I settori governativi e dello sviluppo hanno registrato una diminuzione significativa degli incidenti ad alta gravità che coinvolgono il coinvolgimento umano diretto nel 2024, secondo l’ultimo rapporto degli analisti di Kaspersky Managed Detection and Response (MDR). Tuttavia, i settori alimentare, IT, telecomunicazioni e industriale hanno mostrato un aumento di tali incidenti.

  • OpenAI Pianifica di Integrare Sora in ChatGPT: OpenAI sta lavorando per integrare il suo strumento di generazione di video AI, Sora, direttamente in ChatGPT. Attualmente, Sora è disponibile solo tramite un’app Web dedicata, che consente agli utenti di generare clip cinematografiche lunghe fino a 20 secondi. OpenAI sta anche sviluppando un generatore di immagini AI alimentato da Sora.