Scontro AI: ChatGPT vs Grok vs Gemini vs Claude

L’avanzata vertiginosa dell’intelligenza artificiale (AI) è tale da stordire, e stare al passo con le ultime novità richiede un impegno quasi a tempo pieno.

Lo so bene, perché è il mio lavoro. Per sperimentare in prima persona i modelli più recenti, ho sottoscritto la modalità Pro di Anthropic, che mi permette di usare l’ultimo modello Claude 3.7 in modalità “pensiero esteso”. Contemporaneamente, ho sottoscritto la modalità enterprise di OpenAI per testare i loro modelli più nuovi o3 e o4-mini-high (spiegherò più avanti la sconcertante nomenclatura di OpenAI!). Ho inoltre usato il nuovo modello di generazione immagini 4o di OpenAI per creare tantissime immagini. Le ottime prestazioni di 4o mi hanno spinto a cancellare il mio abbonamento precedente a Midjourney, uno strumento per la generazione di immagini.

Inoltre, ho sottoscritto Grok 3 di Elon Musk, che ha la mia funzionalità AI preferita. Ho anche provato a usare la piattaforma di AI agent cinese Manus per fare shopping e programmare impegni. Queste sottoscrizioni hanno prosciugato quasi completamente il mio budget, e non includono tutte le altre AI che uso in altre forme. Proprio nel mese in cui sto scrivendo questo articolo, Google ha effettuato un aggiornamento su larga scala del suo prodotto AI di punta, Gemini 2.5, e Meta ha rilasciato Llama 4, il più grande modello AI open source finora.

Quindi, cosa fare se seguire gli sviluppi dell’AI non è il tuo lavoro quotidiano, ma vuoi comunque sapere quando usare quale AI può migliorare davvero la tua vita, senza sprecare tempo con modelli che non performano bene?

Questo è lo scopo di questo articolo. Analizzeremo in modo simile a un “rapporto sui consumatori” quale AI è più adatta a vari casi d’uso, e come usarle effettivamente, tutto basato sulla mia esperienza in compiti reali.

Prima, però, è necessario dichiarare quanto segue: Vox Media è una delle diverse case editrici che hanno firmato un accordo di collaborazione con OpenAI, ma la nostra copertura mantiene sempre l’indipendenza editoriale. Future Perfect è finanziata in parte dalla BEMC Foundation, il cui principale finanziatore è anche un primo investitore di Anthropic; anche loro non esercitano alcuna interferenza editoriale sui nostri contenuti. Mia moglie lavora in Google, ma non è coinvolta nei loro prodotti AI; di conseguenza, di solito non mi occupo di Google, ma in un articolo come questo, sarebbe irresponsabile non includere Google.

La buona notizia è che questo articolo non richiede che tu ti fidi della mia indipendenza editoriale; ti mostrerò il mio lavoro. Ho effettuato decine di confronti tra tutte le principali AI sul mercato, molti dei quali progettati da me. Ti incoraggio a confrontare le loro risposte e a giudicare da solo se ho scelto le AI giuste da raccomandare.

Etica dell’arte AI

L’arte AI viene creata addestrando computer su contenuti Internet, senza quasi nessuna considerazione per il copyright o le intenzioni del creatore. Di conseguenza, la maggior parte degli artisti non ne è contenta. In queste circostanze, è ragionevole usare l’arte AI?

Penso che, in un mondo giusto, OpenAI dovrebbe sicuramente risarcire alcuni artisti - in un mondo giusto, il Congresso agirebbe per definire i confini della citazione artistica. Nel frattempo, sono sempre più convinto che le leggi sul copyright esistenti non siano adatte per affrontare questo problema. Gli artisti si influenzano, si commentano e si prendono in prestito a vicenda, e chi può usare strumenti di intelligenza artificiale continuerà a farlo.

La mia filosofia personale è influenzata dalla cultura dei fan della mia infanzia: costruire sul lavoro di qualcun altro per il proprio divertimento è corretto, ma se ti piace, dovresti pagare per questo, e non dovresti assolutamente venderlo. Ciò significa non usare l’arte AI generativa per scopi commerciali, ma giocare con le foto di famiglia va bene.

La Migliore Opzione per la Generazione di Immagini

La nuova modalità di creazione di immagini 4o di OpenAI è di gran lunga il miglior strumento di generazione di immagini AI disponibile e il vantaggio è notevole. È il miglior giocatore sia nella categoria gratuita che in quella a pagamento.

Prima del lancio di 4o, ho sottoscritto la piattaforma di generazione di immagini AI Midjourney. Quando si parla di arte AI, è probabile che si pensi a Midjourney: può generare opere misteriose, memorabili, visivamente splendide e ha alcuni strumenti eccellenti per perfezionare e modificare i risultati finali, come ritoccare i capelli di qualcuno mantenendo intatto tutto il resto.

Il più grande vantaggio di 4o è che può trasformare in modo affidabile una foto di scarsa qualità in una bellissima opera d’arte mantenendo le caratteristiche della foto originale. Nessun modello precedente poteva farlo.

In questa foto qui sotto, io e mia moglie stiamo abbracciando il nostro bambino mentre festeggiamo il suo primo compleanno:

L’AI ha spostato la torta (quasi oscurata da un rotolo di tovaglioli nella foto originale) in una posizione focale nell’immagine, mantenendo nel contempo la postura mia e di mia moglie che abbracciamo il bambino, e la tavola disordinata e il frigorifero coperto di foto sullo sfondo. L’effetto finale è caloroso, piacevole e affettuoso.

È questa capacità che ha reso 4o un successo così grande di recente, qualcosa che nessun generatore di immagini precedente è stato in grado di fare.

Nella foto qui sotto, è stato chiesto a Midjourney di eseguire il trasferimento di stile, trasformando la stessa foto in un “film in stile Pixar”:

Noterai che sembra una famiglia completamente diversa, senza alcuna ispirazione reale rispetto alla foto originale! Alla fine puoi ottenere risultati migliori di questo da Midjourney, ma ci vogliono settimane per padroneggiare il linguaggio e il set di strumenti altamente specifici della piattaforma, diventando un esperto di suggerimenti.

Al contrario, ChatGPT ha fornito un output di gran lunga superiore a Midjourney al primo tentativo con una semplice richiesta, senza linguaggio specializzato.

La differenza tra 4o e altri modelli di immagini è più evidente in questo tipo di richiesta, ma è anche più adatta a quasi tutti gli altri compiti di generazione di immagini che uso. Il prodotto che ottieni immediatamente è molto buono e non è difficile generare opere migliori. Idealmente, questo è ciò che dovremmo ottenere dagli strumenti AI: i non professionisti possono creare cose straordinarie con un linguaggio semplice.

Una carenza attuale di 4o è la modifica di piccole porzioni di un’immagine mantenendo intatto il resto. Ma anche in questo caso, non hai più bisogno di Midjourney: Gemini ora offre questa funzionalità gratuitamente.

Strategie di Prompt per la Generazione di Immagini 4o

Per ottenere buone immagini da 4o, devi prima aggirare i filtri che vietano vari tipi di immagini (come immagini offensive o pornografiche), ma questi filtri spesso vengono applicati a contenuti del tutto innocui in modo apparentemente casuale. Per evitare occasionali rimproveri da parte dei filtri dei contenuti, non chiedere di creare opere nello stile di un artista specifico, ma chiedere invece di creare qualcosa che ricordi l’artista, quindi chiedere specificamente una “conversione di stile”. Certo, questa non è l’unica soluzione efficace, ma per me funziona.

A marzo di quest’anno, c’è stata una breve mania su Internet in cui le persone potevano usare 4o per ricreare adorabili foto di famiglia nello stile dello Studio Ghibli del maestro dell’animazione giapponese Hayao Miyazaki. Ma lo stile dello Studio Ghibli è più che semplice carineria, e ottieni risultati migliori con un po’ più di suggerimenti. Ecco un rendering in stile Studio Ghibli di 4o di una foto di mia figlia che ruba uno spuntino dal tavolo, con la semplice istruzione “ghiblifica questa foto”:

Kawaii! Ma se chiedi a 4o di riflettere innanzitutto su cosa rende Ghibli lo stile di questa foto, a quale film dello Studio Ghibli potrebbe adattarsi e quali piccoli dettagli includerebbe un film del genere, otterrai questo:

Le differenze sono sottili ma significative: la luce proviene da una fonte di luce specifica, non dalla luminosità generale senza fonte. Ci sono più tipi di cibo sul tavolo, con dettagli che lo fanno sembrare più reale. Il libro sul pavimento non è semplicemente un libro qualsiasi: mostra chiaramente il classico libro “The Very Hungry Caterpillar” di Eric Carle, e evoca ricordi con soli due colori e una linea. L’intento e l’intensità della bambina nella foto sono assenti nella prima foto.

Qualche anno fa, una stranezza con i modelli linguistici era che se semplicemente dicevi loro “dai una risposta intelligente”, diventavano più intelligenti. Questo non è più così vero per i modelli linguistici, ma rimane vero per la generazione di arte AI. Prova a chiedere all’AI di fare un buon lavoro e lo farà meglio. Metti in discussione se ha davvero catturato il genio dell’artista e ti darà una risposta ponderata e poi dipingerà una versione migliore.

La differenza è ancora più evidente con stili artistici più realistici (come illustrazioni a matita, fotorealismo o dipinti a olio), che non sempre hanno un bell’aspetto se non sai come sollecitare l’AI, e finiscono spesso nella valle perturbante. Se carico una mia foto con la mia bambina sulla spiaggia e uso semplicemente un prompt come “converti lo stile in un’illustrazione che ricordi Norman Rockwell”, otterrei questo:

Questo è impressionante per l’AI, ma in realtà non è un pezzo d’arte molto buono, mancando quasi completamente della magia di Norman Rockwell. Non sorprende: a meno che tu non ti impegni a fare in modo che l’AI li dipinga correttamente, stili artistici più realistici come Rockwell spesso non danno i risultati sperati.

Se puoi farlo, ecco la strategia che consiglio: non caricare solo una foto, ma un gruppo di foto, ognuna con pose diversi e momenti leggermente diversi. Carica foto chiare dei volti di ogni membro della famiglia e dì all’AI che sono disponibili come riferimento. Quindi, non chiedere all’AI di generare immediatamente l’immagine, ma chiedile invece di discutere con te cosa vuoi catturare. Ecco cosa ho scritto:

Questa foto è il momento in cui mia figlia ha visto l’oceano per la prima volta. Voglio un’illustrazione che catturi questo momento in uno stile simile a un illustratore di metà secolo come Norman Rockwell: qualcosa di acuto, attento ai dettagli, personalizzato e che presti attenzione alla magia dei momenti ordinari e alla gioia della vita normale. Ho fornito foto aggiuntive di me e mia figlia come riferimento. Prima di generare l’immagine, discutiamo quali sono le qualità essenziali dello stile di Rockwell, cosa porterebbe a questa foto e come possiamo catturarlo.

4o ha risposto con entusiasmo a una richiesta come questa:

Sarei felice di discutere come catturare questo momento in un’illustrazione in stile Norman Rockwell: è il candidato perfetto per quello stile: un primo incontro con qualcosa di vasto e selvaggio (l’oceano!), radicato nel calore, nella cura e nei momenti molto umani tra genitori e figli.

Analizziamo alcuni elementi essenziali dello stile di Rockwell e come possono essere applicati a questa scena.

Dopo alcuni scambi, ha prodotto questo:

Rockwell? Non proprio. Ma è molto meglio della bozza di prima. Ha più movimento, più energia, più dettagli e più espressività: e tutto ciò deriva solo dal fatto di aver chiesto all’AI di pensare a cosa dovrebbe cercare di ottenere il dipinto prima di dipingerlo!

Puoi anche chiedere a 4o di modificare i suoi dipinti, ma puoi chiedere davvero solo una modifica: nella mia esperienza, dopo la prima modifica, inizia a peggiorare i dipinti, probabilmente perché il “contesto” che sta usando è ora pieno delle sue stesse bozze scadenti. (Questo è uno dei tanti esempi di come l’AI non funzioni come gli umani.)

È qui che Midjourney continua a brillare: ha strumenti davvero buoni per modificare parti specifiche di un’immagine mantenendo lo stile generale, qualcosa che 4o non ha in gran parte. Se vuoi dare una seconda modifica a un dipinto che hai ottenuto in 4o, ti consiglio di aprire una nuova finestra di chat e di copiare la bozza che stai modificando, insieme alle immagini di ispirazione originali.

Queste semplici strategie di prompt funzionano per quasi tutto ciò che stai cercando di fare con l’AI. Anche se hai fretta, ti consiglio vivamente di chiedere all’AI “cosa vedrebbe [l’artista] in questa immagine” prima di chiedere il rendering e, se hai tempo, ti consiglio di prenderti il tempo per una lunga discussione sulla tua visione.

La Migliore Scelta per Vincere Inutili Discussioni su Internet

X.AI di Elon Musk ha rilasciato Grok 3, che viene fornito con una funzionalità incredibile che ho atteso con ansia che altre aziende replicassero: un pulsante che scansiona il profilo X di qualcuno e ti dice tutto su di loro.

Ogni volta che qualcuno risponde ai miei tweet in modo particolarmente memorabile (nel bene o nel male), premo quel pulsante per ottenere un riepilogo dell’intero percorso di esistenza su Twitter. Sono riflessivi? Sono impegnati onestamente? Sono “agricoltori del Nebraska”? Postano in gran parte sul perché l’Ucraina sia cattiva (ovvero, probabilmente un bot)?

Questa è una grande funzionalità. Quindi, ovviamente, X.AI l’ha rapidamente e massicciamente indebolita, presumibilmente perché persone come me la usavano spesso e facevano un sacco di costose query. Presumo che non stia più usando il modello Grok più avanzato e che ora scansioni sicuramente solo pochi giorni di cronologia del profilo. Ma se qualcuno sta cercando una brillante opportunità di prodotto, per favore, dammi una buona versione restaurata di questa funzionalità! È decisamente un piacere colpevole, ma è uno dei pochi casi in cui uso costantemente l’AI.

La Migliore Scelta per Scrivere Romanzi

Gemini 2.5 Pro è la migliore AI per scrivere romanzi nella categoria gratuita; GPT 4.5 la supera nella categoria a pagamento.

Non sono un artista, quindi le imperfezioni dell’AI in arte non mi turbano davvero: è comunque molto meglio di quello che potrei fare io stesso! Ma sono un romanziere, quindi non posso fare a meno di vedere i limiti dell’AI quando si tratta di scrittura di narrativa.

La cosa più importante della tendenza della scrittura creativa AI è quanto sia prevedibile. L’arte della scrittura è l’arte di conquistare l’interesse del lettore e premiarlo. L’intelligenza artificiale… non lo fa. Possono scrivere belle metafore; possono scrivere descrizioni poetiche nello stile che desideri. Ma non possono ancora fornire la vera sostanza di una buona finzione.

Se vuoi una stupida storia della buonanotte con tuo figlio come protagonista (i bambini adorano questo) o vuoi una cassa di risonanza per le idee che puoi incorporare nel tuo lavoro, l’AI è fantastica. Sono anche amichevoli lettori di narrativa, felici di fornire feedback e analisi (forse con un entusiasmo un po’ troppo alto).

Come con l’arte, il prompt è fondamentale. Ho esplorato principalmente le capacità di generazione di narrativa AI chiedendo loro di scrivere un prologo a “Il Trono di Spade” di George R.R. Martin (l’ho scelto perché, ovviamente, il sogno finale è che l’AI possa finire questa serie destinata a marcire).

Martin è davvero bravo in quello che fa. Il prologo, che riguarda alcuni sfortunati uomini della Guardia Notturna che incontrano i loro nemici soprannaturali, riesce a stabilire l’atmosfera unica del mondo di “Il Trono di Spade” mentre attira immediatamente i lettori. In sole 14 pagine, il prologo rappresenta tutte le cose che l’AI non può ancora fare bene quando si tratta di scrivere. La loro prosa tende ad essere troppo ornata; i loro dialoghi sono goffi e poco sottili.

Noterai che non solo sono tutti di gran lunga inferiori a quelli di Martin (e il lavoro di Martin è quasi certamente nei dati di addestramento!), ma che sono tutti pessimi nello stesso modo. La prosa è fiorita e prolissa: Martin usa un linguaggio normale per introdurre metodicamente un’inquietudine senza nemmeno suggerire il soprannaturale e per far avanzare la storia attraverso i conflitti tra i personaggi, mentre nessuna delle AI è sottile. Sanno che è una storia sul soprannaturale e non esitano a metterlo in primo piano.

Non è che siano tutti uguali. Nella mia esperienza nel cercare di insegnare all’AI a scrivere bene, ho la netta sensazione che Gemini sia l’apprendista più veloce (livello gratuito), mentre ChatGPT 4.5 ha alcune mosse speciali (livello a pagamento). ChatGPT 4.5 è l’unica AI la cui scrittura narrativa mi ha sorpreso dicendo “wow, questo è stato scritto dall’AI?”. Per me, entrambi questi modelli sembrano fondamentalmente più creativi e più capaci di eseguire le loro idee nella prosa che mi piace leggere.

Le impressioni generali non si traducono bene in una valutazione del consumatore, quindi ho avuto un’altra idea: un concorso di scrittura. Ho chiesto a Gemini 2.5 Pro, ChatGPT 4.5, Grok e Claude di scrivere due racconti: una finzione realista su una donna che ha una lotta straziante e dolorosa con sua madre il giorno del suo matrimonio e un prologo di fantascienza a “Il Trono di Spade”, ma nello spazio. La mia brillante idea era che avrei chiesto a un altro gruppo di AI di giudicare le storie, per fornire un’altra fonte di valutazione delle mie personali impressioni che Gemini sia il migliore nella categoria gratuita e ChatGPT sia il migliore nella categoria a pagamento. Tuttavia (forse prevedibilmente), questo non ha funzionato davvero: i risultati dei punteggi delle AI erano un pasticcio assoluto.

Ma, come con l’arte, puoi rendere l’AI migliore nello scrivere attraverso il potere dei prompt. Ho (molto lunghi) prompt per l’AI per migliorare la loro scrittura in prosa, enfatizzando la fornitura di molti esempi di buona scrittura, invitandoli ad adottare un approccio attento e strutturato all’emulazione e incoraggiandoli a generare più bozze e a scegliere le più forti.

Ecco Gemini 2.5 pro a cui è stato chiesto di scrivere un microromanzo di due frasi su un argomento a sua scelta, senza alcun prompt strutturato:

Il vecchio bibliotecario insisteva sul fatto che questo libro polveroso non fosse mai stato preso in prestito, la sua tessera di prestito completamente vuota. Eppure, nel profondo delle sue pagine, tra i capitoli sulle costellazioni dimenticate, giaceva un quadrifoglio schiacciato, ancora incredibilmente verde.

Ed ecco Gemini 2.5 pro con un prompt che incoraggia un pensiero strutturato su come scrivere bene:

Ha finalmente decodificato il debole segnale proveniente da Proxima Centauri: un’elegante sequenza di numeri primi che