AI-slagveld ontcijferd: ChatGPT vs Grok vs Gemini vs Claude

De snelle ontwikkeling van Artificial Intelligence (AI) is overweldigend en het vereist bijna volledige toewijding om op de hoogte te blijven van de laatste ontwikkelingen.

Ik ben me hiervan terdege bewust, want dit is mijn werk. Om als eerste de nieuwste modellen te ervaren, heb ik me geabonneerd op de Pro-modus van Anthropic, waardoor ik hun nieuwste model, Claude 3.7, in de “uitgebreid denken”-modus kan gebruiken. Tegelijkertijd heb ik me geabonneerd op de Enterprise-modus van OpenAI om hun nieuwste modellen, o3 en o4-mini-high (ik zal de verwarrende naamgevingsregels van OpenAI later uitleggen!), te testen en om met OpenAI’s nieuwe model voor het genereren van afbeeldingen, 4o, een groot aantal afbeeldingen te maken. De uitstekende prestaties van 4o zorgden ervoor dat ik mijn eerdere abonnement op de tool voor het genereren van afbeeldingen, Midjourney, opzegde.

Daarnaast heb ik ook een abonnement op Grok 3 van Elon Musk, met de AI-functie waar ik het meest van hou. Ik heb ook geprobeerd het Chinese AI-agentenplatform Manus te gebruiken voor winkelen en het plannen van afspraken. Deze abonnementen slokken bijna mijn hele budget op, maar dat is exclusief alle AI die ik op andere manieren gebruik. Deze maand, terwijl ik dit schreef, heeft Google zijn beste AI-product, Gemini 2.5, een grote upgrade gegeven en heeft Meta Llama 4 uitgebracht, het tot nu toe grootste open-source AI-model.

Dus, als het volgen van de AI-ontwikkelingen niet je dagelijkse werk is, maar je toch wilt weten welke AI je in welke situatie kunt gebruiken om je leven echt te verbeteren, zonder tijd te verspillen aan modellen die slecht presteren, wat moet je dan doen?

Dat is het doel van dit artikel. We gaan, in de stijl van een “consumentenrapport”, dieper ingaan op welke AI het meest geschikt is voor verschillende toepassingen en hoe je ze daadwerkelijk kunt gebruiken, allemaal gebaseerd op mijn ervaring met praktische taken.

Maar eerst een verklaring: Vox Media is een van de verschillende uitgevers die een samenwerkingsovereenkomst heeft getekend met OpenAI, maar onze berichtgeving blijft altijd redactioneel onafhankelijk. Future Perfect wordt gedeeltelijk gefinancierd door de BEMC-stichting, waarvan de belangrijkste financier ook een vroege investeerder in Anthropic is; ze zullen ook geen enkele redactionele inmenging doen in onze inhoud. Mijn vrouw werkt bij Google, maar heeft geen banden met hun AI-producten; daarom rapporteer ik doorgaans niet over Google, maar in zo’n artikel zou het onverantwoordelijk zijn om Google niet mee te nemen.

Het goede nieuws is dat dit artikel niet van je vereist dat je mijn redactionele onafhankelijkheid vertrouwt; ik zal mijn werk laten zien. Ik heb tientallen vergelijkingen gemaakt tussen alle belangrijke AI’s op de markt, waarvan ik er vele zelf heb ontworpen. Ik moedig je aan om hun antwoorden te vergelijken en zelf te beoordelen of ik de juiste AI heb gekozen om aan te bevelen.

Over de ethiek van AI-kunst

AI-kunst wordt gemaakt door computers te trainen op internetcontent, waarbij nauwelijks rekening wordt gehouden met auteursrechten of de intentie van de maker. Daarom zijn de meeste kunstenaars er ontevreden over. Is het onder deze omstandigheden redelijk om AI-kunst te gebruiken?

Ik denk dat OpenAI in een rechtvaardige wereld zeker een aantal kunstenaars zou compenseren – in een rechtvaardige wereld zou het Congres actie ondernemen om de grenzen van het lenen van kunst te bepalen. Tegelijkertijd raak ik er steeds meer van overtuigd dat de bestaande auteursrechtwetgeving niet geschikt is om dit probleem op te lossen. Artiesten beïnvloeden elkaar, geven commentaar op elkaar en bouwen voort op elkaar, en mensen die AI-tools kunnen gebruiken, zullen dat blijven doen.

Mijn persoonlijke filosofie is beïnvloed door mijn jeugd in de fancultuur: bouwen op het werk van anderen voor je eigen plezier is oké, maar als je het leuk vindt, moet je ervoor betalen, en je mag het absoluut niet verkopen. Dat betekent dat gegenereerde AI-kunst niet voor commerciële doeleinden mag worden gebruikt, maar spelen met je familiefoto’s is oké.

De beste keuze voor het genereren van afbeeldingen

De nieuwe 4o-beeldcreatiemodus van OpenAI is verreweg de beste AI-tool voor het genereren van afbeeldingen die er is, en dat met een duidelijk voordeel. Het is de beste in zowel de gratis als de betaalde categorie.

Voor de release van 4o had ik een abonnement op het AI-imagegeneratieplatform Midjourney. Als je het hebt over AI-kunst, dan denk je misschien aan Midjourney: het kan mysterieuze, gedenkwaardige, visueel verbluffende werken genereren en heeft een aantal uitstekende tools om je eindresultaat te verbeteren en te bewerken, zoals het retoucheren van iemands haar, terwijl al het andere hetzelfde blijft.

Het grootste voordeel van 4o is dat het op betrouwbare wijze een slechte foto kan omzetten in een prachtig kunstwerk, met behoud van de kenmerken van de originele foto. Geen enkel vorig model kon dat.

In deze foto vieren mijn vrouw en ik de eerste verjaardag van haar, terwijl we haar vasthouden:

AI verplaatst de cake (die bijna verborgen is achter een rol keukenpapier op de originele foto) naar de focus van de afbeelding, terwijl de pose van mijn vrouw en mij die onze baby vasthouden, en de rommelige tafel en de koelkast vol foto’s op de achtergrond behouden blijven. Het eindresultaat is warm, aangenaam en lieflijk.

Het is dit vermogen dat 4o de laatste tijd zo populair heeft gemaakt, iets wat geen enkele vorige imagegenerator kon.

In de onderstaande foto is Midjourney gevraagd een stijltransformatie uit te voeren, waarbij dezelfde foto wordt omgezet in een “Pixar-film”:

Je zult merken dat dit eruitziet als een compleet ander gezin, met geen echte inspiratie uit de originele foto! Uiteindelijk kun je met Midjourney betere resultaten behalen dan dit, maar het kost je weken om de zeer specifieke taal en toolset van dit platform onder de knie te krijgen om een expert in prompting te worden.

In vergelijking hiermee kon ChatGPT met een simpel verzoek en zonder gespecialiseerde taal bij de eerste poging een output genereren die veel beter was dan die van Midjourney.

Het verschil tussen 4o en andere modellen voor het genereren van afbeeldingen is het meest opvallend in dit type verzoek, maar het is ook beter geschikt voor bijna alle andere taken voor het genereren van afbeeldingen die ik heb gebruikt. Het out-of-the-box product is erg goed, en het is niet moeilijk om nog betere werken te genereren. Idealiter is dit wat we van AI-tools zouden moeten krijgen – niet-professionals kunnen met eenvoudige taal verbluffende dingen creëren.

Een nadeel van 4o op dit moment is het bewerken van kleine delen van een afbeelding terwijl de rest ongewijzigd blijft. Maar zelfs dan heb je Midjourney niet meer nodig – Gemini biedt deze functie nu gratis aan.

4o Promptstrategieën voor het genereren van afbeeldingen

Om goede afbeeldingen uit 4o te halen, moet je eerst de filters omzeilen die verschillende afbeeldingen (zoals aanstootgevende of pornografische afbeeldingen) verbieden, maar deze filters worden vaak op een ogenschijnlijk willekeurige manier afgedwongen op volledig onschuldige inhoud. Om de af en toe een standje van de inhoudsfilters te vermijden, moet je niet vragen om werken te creëren in de stijl van een specifieke kunstenaar, maar vragen om iets te creëren dat doet denken aan de kunstenaar en vervolgens specifiek vragen om een “stijltransformatie”. Zeker, dit is niet de enige effectieve oplossing, maar het werkt voor mij.

In maart van dit jaar was er een korte rage op internet waarbij mensen 4o gebruikten om schattige familiefoto’s na te bootsen in de stijl van de Japanse animatiemeester Hayao Miyazaki’s Studio Ghibli. Maar de stijl van Studio Ghibli is meer dan alleen maar schattig, en met iets meer aanwijzingen kun je betere resultaten behalen. Hier is een rendering van een foto van mijn dochter die snacks van tafel steelt, in de stijl van Studio Ghibli, met 4o, met de aanwijzing “maak er alsjeblieft Ghibli van”:

Kawaii! Maar als je 4o eerst laat nadenken over wat deze foto Ghibli-achtig maakt, in welke Studio Ghibli-film ze zou passen en welke kleine details zo’n film zou bevatten, dan krijg je dit:

De verschillen zijn klein maar significant: het licht komt van een specifieke bron, in plaats van een algemene passieve helderheid. Er is meer variatie in het eten op tafel, en de details zorgen ervoor dat het eten er realistischer uitziet. Het boek op de vloer is niet zomaar eender welk boek – het toont duidelijk het klassieke werk van Eric Carle, “The Very Hungry Caterpillar”, dat herinneringen oproept met slechts twee kleuren en een lijn. De intentie en intensiteit van de baby op de foto is er niet in de eerste foto.

Een aantal jaren geleden was het vreemd aan taalmodellen dat ze slimmer werden als je ze simpelweg vertelde “geef een slim antwoord”. Dit is niet langer zo waar voor taalmodellen, maar het is nog steeds erg waar voor AI-kunstgeneratie. Probeer AI te vragen om goed werk te leveren, en het zal dat ook doen. Vraag het of het de genialiteit van de kunstenaar echt heeft vastgelegd, en het zal je een doordacht antwoord geven en vervolgens een betere versie tekenen.

Voor meer realistische kunststijlen (zoals potloodillustraties, fotorealisme of olieverfschilderijen) zijn de verschillen nog duidelijker, deze stijlen zien er niet altijd goed uit als je niet weet hoe je AI moet aansturen en komen vaak terecht in de uncanny valley. Als ik een foto van mij en mijn jongste dochter op het strand upload en simpelweg de aanwijzing “zet de stijl om in een illustratie die doet denken aan Rockwell” gebruik, dan krijg ik dit:

Voor AI is dit indrukwekkend, maar als kunstwerk is het eigenlijk niet zo goed en mist het bijna volledig de magie van Norman Rockwell. Dit is niet verrassend: tenzij je er wat moeite in steekt om AI ze correct te laten tekenen, halen meer realistische kunststijlen zoals Rockwell vaak niet de verwachte resultaten.

Als je dat kunt, is dit de strategie die ik aanbeveel: upload niet slechts één foto, maar een reeks foto’s, elk met een iets andere pose en moment. Upload duidelijke foto’s van het gezicht van elk familielid en vertel AI dat ze als referentie dienen. Vraag AI vervolgens niet om direct een foto te genereren, maar vraag het om met je te bespreken wat je wilt vastleggen. Dit is wat ik schreef:

Deze foto is van het moment dat mijn dochter de zee voor het eerst ziet. Ik wil een illustratie die dit moment vastlegt in een stijl die lijkt op die van een middeleeuwse illustrator als Norman Rockwell – iets scherps, gedetailleerds, gepersonaliseerds en met aandacht voor de magie van alledaagse momenten en het plezier van het gewone leven. Ik heb extra foto’s van mij en mijn dochter als referentie meegeleverd. Laten we, voordat je een foto genereert, de essentiële elementen van de Rockwell-stijl bespreken, wat hij aan deze foto zou toevoegen en hoe we haar kunnen vastleggen.

Toen het eenmaal van alles was voorzien wat ik kon, reageerde 4o enthousiast op dergelijke vragen:

Ik zou graag bespreken hoe een illustratie in de stijl van Norman Rockwell dit moment kan vastleggen – het is de perfecte kandidaat voor die stijl: een eerste ontmoeting met iets groots en wilds (de zee!), ingebed in een warm, zorgzaam en zeer menselijk moment tussen ouders en kinderen.
Laten we enkele van de essentiële elementen van de Rockwell-stijl opsplitsen en hoe deze op deze scène kunnen worden toegepast.

Na wat heen en weer gepraat produceerde hij dit:

Rockwell? Niet helemaal. Maar dit is veel beter dan het eerste concept dat we net zagen. Het heeft meer beweging, meer energie, meer detail en meer expressie – en dit alles alleen maar door AI te vragen om na te denken over wat het schilderij hoopt te bereiken voordat hij het schildert!

Je kunt 4o ook vragen om zijn schilderijen aan te passen, maar je kunt in feite maar één keer om een aanpassing vragen: in mijn ervaring begint hij de schilderijen na de eerste aanpassing steeds erger te maken, mogelijk omdat de “context” die hij gebruikt nu vol zit met zijn eigen slechte ontwerpen. (Dit is een van de vele voorbeelden dat AI niet werkt zoals mensen.)

Dit is de enige plek waar Midjourney nog steeds schittert – het heeft hele goede tools om specifieke onderdelen van een foto aan te passen met behoud van de algehele stijl, wat 4o grotendeels mist. Als je een tweede aanpassing wilt aan het schilderij dat je in 4o hebt gemaakt, raad ik je aan om een nieuw chatvenster te openen en het concept dat je aan het aanpassen bent samen met je originele inspiratie-afbeelding te kopiëren en te plakken.

Deze simpele promptstrategieën zijn van toepassing op bijna alles wat je probeert te doen met AI. Zelfs als je haast hebt, raad ik je ten zeerste aan om, voordat je een rendering aanvraagt, eerst aan AI te vragen “wat zou [de kunstenaar] in deze foto zien?”. En als je tijd hebt, raad ik je aan om de tijd te nemen voor een langdurige discussie over je visie.

De beste keuze voor het winnen van saaie internetdiscussies

X.AI van Elon Musk heeft Grok 3 uitgebracht, die wordt geleverd met een ongelooflijke functie waar ik reikhalzend naar uitkijk tot andere bedrijven deze kopiëren: een knop die het X-profiel van iemand scant en je alles over ze vertelt.

Steeds wanneer iemand op een bijzonder gedenkwaardige manier op mijn tweets reageert (goed of slecht), klik ik op die knop om een samenvatting te krijgen van hun gehele Twitter-bestaan. Zijn ze bedachtzaam? Zijn ze oprecht betrokken? Zijn ze “boeren in Nebraska”? Posten ze veel over waarom Oekraïne slecht is (dat wil zeggen, mogelijk een bot)?

Het is een geweldige functie. Natuurlijk heeft X.AI het snel aanzienlijk afgezwakt, mogelijk omdat mensen zoals ik het vaak gebruikten en een groot aantal berekeningsintensieve query’s deden. Ik denk niet dat het het meer geavanceerde Grok-model meer gebruikt, en het scant nu zeker alleen de profielgeschiedenis van een paar dagen. Maar als iemand zoekt naar een briljante productmogelijkheid, herstel dan alstublieft een goede versie van deze functie! Het is ronduit een onbeschaamd genot, maar het is een van de weinige gevallen waarin ik AI voortdurend gebruik.

De beste keuze voor het schrijven van een roman

Gemini 2.5 Pro is de beste AI voor het schrijven van romans in de gratis categorie; GPT 4.5 overtreft het in de betaalde categorie.

Ik ben geen kunstenaar, dus de onvolkomenheden van AI op het gebied van kunst storen me niet echt – het is nog steeds veel beter dan wat ik zelf kan doen! Maar ik ben romanschrijver, dus op het gebied van fictie kan ik de beperkingen van AI niet helpen, maar inzien.

De belangrijkste trend van AI creatief schrijven is hoe voorspelbaar het is. De kunst van het schrijven is om lezers aan je te binden en hen te belonen. AI… doet dat niet. Zo kunnen ze prachtige metaforen schrijven, en ze kunnen poëtische beschrijvingen schrijven in elke stijl die je wilt. Maar ze kunnen nog niet de echte inhoud van geweldige fictie produceren.

Als je een stupide verhaaltje voor het slapengaan wilt hebben met je kind in de hoofdrol (kinderen zijn dol op dit) of je wilt een klankbord voor ideeën die je kunt verwerken in je eigen werk, dan is AI geweldig. Ze zijn ook vriendelijke fictielezers die graag feedback en analyses geven (misschien iets_te_enthousiast).

Net zoals bij kunst is prompten de sleutel. Ik heb AI in de eerste plaats onderzocht door te vragen om een proloog te schrijven voor George R.R. Martin’s “Game of Thrones” (ik heb dit gekozen omdat de ultieme droom natuurlijk is dat AI de taak kan voltooien van het afronden van deze serie die gedoemd is om te falen).

Martin is erg goed in wat hij doet. De proloog, waarin enkele ongelukkige mannen van de Night’s Watch hun bovennatuurlijke vijanden tegenkomen, weet met succes de uitzonderlijke sfeer van de wereld van “Game of Thrones” te vestigen en tegelijkertijd de lezer direct aan te trekken. In slechts 14 pagina’s vertegenwoordigt de proloog alles wat AI nog niet kan doen met betrekking tot schrijven. Hun proza is vaak te gekunsteld; hun dialogen zijn houterig en niet subtiel.

Je zult merken dat ze niet alleen allemaal veel slechter zijn dan de versie van Martin (en Martin’s werk zit vrijwel zeker in de trainingsdata!), maar dat ze allemaal op dezelfde manier slecht zijn. Het proza is bloemrijk en omslachtig: Martin introduceert methodisch een onbehagen met normaal taalgebruik en geeft niet eens een hint van iets bovennatuurlijks, en drijft het verhaal vooruit door conflicten tussen personages, terwijl AI niet subtiel is. Ze weten dat het een verhaal over bovennatuurlijke verschijnselen is en gooien dat zonder aarzelen op tafel.

Dat wil niet zeggen dat ze allemaal hetzelfde zijn. In mijn ervaring met het proberen om AI goed te leren schrijven, vond ik inderdaad dat Gemini de snelste leerling was (gratis)