OpenAI onthult GPT-4.5

Een tussenstap, geen reuzensprong

GPT-4.5 wordt beschikbaar gesteld aan ChatGPT Pro-gebruikers als een onderzoeksvoorbeeld. OpenAI prijst het aan als hun ‘meest deskundige model tot nu toe’, maar de eerste communicatie waarschuwde dat het misschien niet de prestaties van modellen zoals o1 of o3-mini evenaart. Dit suggereert een focus op verfijning en efficiëntie in plaats van baanbrekende vooruitgang.

Verbeterde mogelijkheden, verfijnde interactie

Wat kunnen gebruikers verwachten van GPT-4.5? OpenAI benadrukt verbeteringen op verschillende belangrijke gebieden:

  • Schrijfvaardigheid: Het model is ontworpen als een capabelere schrijfassistent.
  • Uitgebreide wereldkennis: GPT-4.5 bezit een breder begrip van concepten en informatie uit de echte wereld.
  • ‘Verfijnde persoonlijkheid’: OpenAI beweert dat interacties met dit model natuurlijker en intuïtiever zullen aanvoelen.

Het bedrijf benadrukt het vermogen van GPT-4.5 om patronen te herkennen en verbanden te leggen, waardoor het bijzonder geschikt is voor taken zoals schrijven, programmeren en het aanpakken van praktische problemen.

Geen Frontier Model: Het onderscheid begrijpen

Ondanks deze verbeteringen is OpenAI duidelijk dat GPT-4.5 geen sprong naar geheel nieuwe mogelijkheden vertegenwoordigt. Een gelekt document, later herzien, bood verdere context:

‘GPT-4.5 is geen frontier model, maar het is OpenAI’s grootste LLM, dat de computationele efficiëntie van GPT-4 met meer dan 10x verbetert’, aldus het document. ‘Het introduceert geen 7 netto-nieuwe frontier mogelijkheden in vergelijking met eerdere redeneerversies, en de prestaties zijn lager dan die van o1, o3-mini en diepgaand onderzoek op de meeste paraatheidsbeoordelingen.’

Dit onderscheid is belangrijk. Het suggereert dat hoewel GPT-4.5 een aanzienlijke upgrade is in termen van schaal en efficiëntie, het de grenzen van AI-mogelijkheden niet verlegt op dezelfde manier als een ‘frontier’ model zou doen.

Training en ontwikkeling

Rapporten geven aan dat OpenAI zijn o1-redeneermodel (codenaam Strawberry) en synthetische data heeft gebruikt om GPT-4.5 te trainen. Het bedrijf bevestigt een combinatie van nieuwe supervisietechnieken en gevestigde methoden:

  • Supervised Fine-Tuning (SFT)
  • Reinforcement Learning from Human Feedback (RLHF)

Deze zijn vergelijkbaar met de benaderingen die zijn gebruikt bij het ontwikkelen van GPT-4o.

Hallucinaties aanpakken en samenwerking verbeteren

Een opmerkelijke verbetering is een vermindering van hallucinaties. Volgens OpenAI hallucineert GPT-4.5 minder vaak dan GPT-4o en zelfs iets minder dan het o1-model.

Raphael Gontijo Lopes, een OpenAI-onderzoeker, benadrukte de focus op samenwerking: ‘We hebben GPT-4.5 afgestemd om een betere medewerker te zijn, waardoor gesprekken warmer, intuïtiever en emotioneel genuanceerder aanvoelen.’ Hij merkte op dat menselijke testers GPT-4.5 hoger beoordeelden dan GPT-4o in verschillende categorieën.

CEO’s perspectief: Beperkingen erkennen

OpenAI CEO Sam Altman erkende in een bericht op X de aard van GPT-4.5: ‘gigantisch, duur model’ dat ‘benchmarks niet zal verpletteren’. Deze openhartige beoordeling versterkt het idee dat deze release gaat over incrementele vooruitgang in plaatsvan revolutionaire doorbraken.

Uitrolplan

De uitrol van GPT-4.5 volgt een gelaagde aanpak:

  1. Pro-gebruikers: Onmiddellijke toegang als onderzoeksvoorbeeld.
  2. Plus- en Team-gebruikers: Beschikbaarheid wordt volgende week verwacht.
  3. Enterprise- en Edu-gebruikers: Toegang volgt na Plus- en Team-gebruikers.

Het model is ook beschikbaar via Microsoft’s Azure AI Foundry-platform, naast aanbiedingen van Stability, Cohere en Microsoft zelf.

Nauwkeurigheid en verminderde hallucinaties

OpenAI benadrukt de verbeterde nauwkeurigheid van GPT-4.5 en beweert dat het nauwkeurigere antwoorden genereert en minder hallucineert in vergelijking met zijn andere modellen. Dit is een cruciale stap voorwaarts, aangezien hallucinaties (het genereren van valse of onzinnige informatie) een hardnekkige uitdaging zijn geweest bij grote taalmodellen.

Vooruitblik: GPT-5 en het pad naar AGI

Eerdere rapportage suggereerde een tijdlijn voor OpenAI’s releases: GPT-4.5 eind februari en GPT-5 al eind mei. Altman heeft GPT-5 beschreven als een ‘systeem dat veel van onze technologie integreert’. Het zal naar verwachting OpenAI’s nieuwe o3-redeneermodel bevatten, dat werd geteased tijdens de ‘12 dagen van Kerstmis’-aankondigingen van het bedrijf in december.

Terwijl o3-mini eerder werd uitgebracht, wordt het volledige o3-model gereserveerd voor het GPT-5-systeem. Dit sluit aan bij OpenAI’s bredere visie om zijn grote taalmodellen te combineren om een capabeler systeem te creëren, dat mogelijk het rijk van artificial general intelligence (AGI) nadert.

Dieper ingaan op de architectuur van GPT-4.5

Hoewel OpenAI geen uitputtende technische details heeft vrijgegeven, kunnen verschillende gevolgtrekkingen worden gemaakt over de architectuur van GPT-4.5 op basis van beschikbare informatie:

  • Groter aantal parameters: Beschreven als OpenAI’s ‘grootste LLM’, is het redelijk om aan te nemen dat GPT-4.5 een aanzienlijk hoger aantal parameters heeft dan zijn voorgangers. Deze verhoogde capaciteit draagt waarschijnlijk bij aan zijn verbeterde kennisbasis en redeneervermogen.

  • Geoptimaliseerde computationele efficiëntie: Het gelekte document noemde een ‘meer dan 10x’ verbetering in computationele efficiëntie in vergelijking met GPT-4. Dit suggereert architecturale verfijningen die het model in staat stellen informatie effectiever te verwerken, wat mogelijk leidt tot snellere reactietijden en een lager energieverbruik.

  • Verbeterde aandachtsmechanismen: Gezien de nadruk op patroonherkenning en het leggen van verbanden, is het waarschijnlijk dat GPT-4.5 verbeteringen in aandachtsmechanismen bevat. Deze mechanismen stellen het model in staat zich te concentreren op de meest relevante delen van de invoertekst, wat leidt tot coherentere en contextueel passendere antwoorden.

  • Verfijnde trainingsgegevens: Het gebruik van ‘nieuwe supervisietechnieken’ wijst op verbeteringen in de kwaliteit en diversiteit van de trainingsgegevens. Dit kan het opnemen van meer gespecialiseerde datasets omvatten, het gebruik van synthetische gegevensgeneratie of het toepassen van meer geavanceerde methoden voor het filteren en opschonen van bestaande gegevens.

De rol van synthetische data

Het gerapporteerde gebruik van synthetische data bij het trainen van GPT-4.5 is bijzonder opmerkelijk. Synthetische data, gegenereerd door AI-modellen zelf, biedt verschillende potentiële voordelen:

  • Het overwinnen van dataschaarste: Het kan worden gebruikt om bestaande datasets aan te vullen, met name in domeinen waar gegevens uit de echte wereld beperkt of moeilijk te verkrijgen zijn.

  • Het aanpakken van bias: Synthetische data kunnen zorgvuldig worden samengesteld om bias in datasets uit de echte wereld te verminderen, wat leidt tot eerlijkere en rechtvaardigere AI-modellen.

  • Het verkennen van hypothetische scenario’s: Het stelt onderzoekers in staat modellen te trainen op scenario’s die zeldzaam of onmogelijk te observeren zijn in de echte wereld, waardoor hun vermogen om onverwachte situaties aan te kunnen wordt verbeterd.

Het gebruik van synthetische data roept echter ook zorgen op:

  • Potentieel voor het versterken van bias: Als het niet zorgvuldig wordt gecontroleerd, kunnen synthetische data onbedoeld bestaande bias versterken of nieuwe introduceren.

  • Risico op overfitting: Modellen die voornamelijk op synthetische data zijn getraind, presteren mogelijk goed op vergelijkbare synthetische data, maar hebben moeite om te generaliseren naar inputs uit de echte wereld.

OpenAI’s aanpak van het gebruik van synthetische data omvat waarschijnlijk zorgvuldige validatie en testen om deze risico’s te beperken.

De ‘verfijnde persoonlijkheid’: een nadere blik

OpenAI’s bewering dat GPT-4.5 een ‘verfijnde persoonlijkheid’ heeft, is intrigerend. Dit suggereert inspanningen om de interacties van het model boeiender, natuurlijker en emotioneel intelligenter te maken. Dit kan verschillende technieken omvatten:

  • Finetuning op conversatiegegevens: Het trainen van het model op grote datasets van menselijke gesprekken om nuances van taal, toon en sociale signalen beter te begrijpen.

  • Het opnemen van emotionele intelligentiemodellen: Het integreren van gespecialiseerde modellen die zijn ontworpen om menselijke emoties te herkennen en erop te reageren, waardoor GPT-4.5 zijn communicatiestijl dienovereenkomstig kan aanpassen.

  • Reinforcement learning met menselijke feedback: Het gebruik van menselijke feedback om reacties te belonen die als natuurlijker, boeiender en empathischer worden ervaren.

Het doel is om een meer mensachtige conversatie-ervaring te creëren, die verder gaat dan puur functionele interacties om een gevoel van verbinding en rapport te bevorderen.

Implicaties voor verschillende gebruikersgroepen

De gelaagde uitrol van GPT-4.5 suggereert verschillende implicaties voor verschillende gebruikersgroepen:

  • Pro-gebruikers: Als early adopters krijgen Pro-gebruikers de kans om te experimenteren met de mogelijkheden van het model en feedback te geven aan OpenAI. Deze feedback zal cruciaal zijn bij het vormgeven van de verdere ontwikkeling van het model.

  • Plus- en Team-gebruikers: Deze gebruikers zullen waarschijnlijk profiteren van de verbeterde prestaties en verfijnde interactiestijl van GPT-4.5 in hun dagelijkse taken, zoals schrijven, coderen en onderzoek.

  • Enterprise- en Edu-gebruikers: Voor deze gebruikers kunnen de verbeterde nauwkeurigheid en verminderde hallucinaties bijzonder waardevol zijn, wat zorgt voor betrouwbaardere en betrouwbaardere resultaten in professionele en educatieve omgevingen.

  • Microsoft Azure AI Foundry-gebruikers: De beschikbaarheid van GPT-4.5 op dit platform breidt de toegang tot het model uit voor ontwikkelaars en onderzoekers, waardoor innovatie en de creatie van nieuwe AI-gestuurde applicaties worden bevorderd.

De bredere context: OpenAI’s strategie

De release van GPT-4.5, hoewel geen frontier model, past in OpenAI’s bredere strategie van iteratieve ontwikkeling en geleidelijke vooruitgang in de richting van AGI. Door incrementele verbeteringen uit te brengen, kan OpenAI:

  • Gebruikersfeedback verzamelen: Zijn modellen continu verfijnen op basis van gebruik in de echte wereld en feedback.

  • Verwachtingen beheren: Overhyping vermijden en realistische verwachtingen stellen voor elke release.

  • Concurrentievoordeel behouden: Voorop blijven lopen in het snel evoluerende veld van AI.

  • Voorbereiden op toekomstige doorbraken: De basis leggen voor belangrijkere vorderingen, zoals GPT-5.

Deze aanpak staat in contrast met de ‘big bang’-releases van sommige andere AI-bedrijven, wat wijst op een meer voorzichtige en afgemeten benadering van het ontwikkelen en implementeren van steeds krachtigere AI-systemen. De focus ligt niet alleen op het verleggen van de grenzen van wat mogelijk is, maar ook op het waarborgen van veiligheid, betrouwbaarheid en gebruikerstevredenheid.
De ontwikkeling en inzet van modellen zoals GPT-4.5 roept veel vragen op:

  • Hoe kunnen we meten of het model een ‘verfijnde persoonlijkheid’ heeft?
  • Wat zijn de implicaties van een model dat minder hallucineert?
  • Wat is het belang van het uitbrengen van een model dat geen frontier model is?

Dit zijn allemaal goede vragen, en er zijn geen definitieve antwoorden.