AI: GPT-4.5, Ruimtevaart & Toekomst

GPT-4.5: Een Verfijning, Geen Revolutie

OpenAI heeft onlangs GPT-4.5 beschikbaar gesteld aan ChatGPT Pro-gebruikers, met Plus-, Team-, bedrijfs- en onderwijsaccounts die volgen. Intern bekend als ‘Orion’, beschikt dit model over een “beter begrip van menselijke intentie, waarbij subtiele signalen en impliciete verwachtingen met meer nuance en emotionele intelligentie worden geïnterpreteerd”, aldus OpenAI. Het maakt gebruik van nieuwe supervisietechnieken naast traditionele fine-tuning en reinforcement learning from human feedback, wat het ontwikkelingsproces van GPT-4o weerspiegelt. GPT-4.5 biedt real-time zoekmogelijkheden, ondersteunt het uploaden van bestanden en afbeeldingen, en integreert met een canvas voor schrijven en coderen. Het mist echter momenteel de multimodale functies zoals spraakmodus, video of schermdeling die in ChatGPT te vinden zijn.

OpenAI benadrukt dat unsupervised learning de nauwkeurigheid en intuïtie van een model verbetert. Deze aanpak is een drijvende kracht geweest achter de vooruitgang in modellen zoals GPT-3.5, GPT-4 en nu GPT-4.5. Afzonderlijk traint het schalen van redeneren modellen om informatie systematisch te verwerken, waarbij een gedachtegang wordt gegenereerd voordat er wordt gereageerd. Deze methodische aanpak verbetert hun vermogen om complexe STEM- en logische uitdagingen aan te pakken, zoals gedemonstreerd door modellen zoals OpenAI o1 en OpenAI o3-mini. GPT-4.5 wordt gepresenteerd als een uitstekend voorbeeld van het schalen van unsupervised learning, waarbij gebruik wordt gemaakt van meer rekenkracht, grotere datasets en architecturale innovatie. Getraind op Microsoft Azure AI-supercomputers, bezit het naar verluidt bredere kennis en een dieper begrip van de wereld, waardoor hallucinaties worden verminderd en de betrouwbaarheid wordt vergroot.

Ondanks deze verbeteringen heeft GPT-4.5 geen significant enthousiasme gegenereerd. Het wordt gezien als een incrementele verbetering in plaats van een baanbrekende sprong. Hoewel OpenAI verbeterde emotionele intelligentie, nuance en creativiteit aanprijst, hebben veel gebruikers geen substantieel verschil waargenomen in vergelijking met GPT-4o. De afwezigheid van multimodale verbeteringen, een belangrijk kenmerk van GPT-4o, draagt verder bij aan deze perceptie.

Bovendien heeft GPT-4.5 de neiging getoond om onzinnige outputs te produceren. OpenAI’s interne feitelijkheidsbenchmarkingtool, SimpleQA, onthult dat GPT-4.5 37,1% van de tijd hallucineert (presenteert verzinsels als feiten met vertrouwen). Dit is een aanzienlijke zorg, zelfs in vergelijking met GPT-4o, een ander geavanceerd “redenerend” model, dat 61,8% van de tijd hallucineert op dezelfde benchmark. Het kleinere, goedkopere o3-mini-model vertoont een nog hoger hallucinatiepercentage van 80,3%.

Het huidige AI-landschap, met concurrenten zoals Anthropic met Claude 3.7 en Google’s vooruitgang met Gemini, heeft de verwachtingen voor significante upgrades verhoogd. Gebruikers zijn op zoek naar doorbraken, niet alleen verfijningen, en GPT-4.5, in zijn huidige vorm, lijkt hieraan niet te voldoen.

De Opkomst van Redeneermodellen en Investeerdersvertrouwen

Elon Musk suggereerde onlangs op X dat Artificial General Intelligence (AGI) aan de horizon is. Deze verklaring komt te midden van een fervente race tussen techgiganten zoals OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic en Musk’s eigen xAI om redeneermodellen te ontwikkelen – AI-systemen die zijn ontworpen om mensachtig denken te emuleren.

Investeerders tonen duidelijk enthousiasme voor dit streven. Kort na de lancering van Claude 3.7 Sonnet met hybride redenering, verzekerde Anthropic zich van een substantiële Series E-financieringsronde van $ 3,5 miljard. Dit verdrievoudigde de waardering tot $ 61,5 miljard, waarmee zijn positie als een belangrijke concurrent van OpenAI werd verstevigd. De investering, geleid door Lightspeed Venture Partners en inclusief Salesforce Ventures, Cisco, Fidelity, Jane Street en anderen, zal worden gebruikt om de rekenkracht voor AI-ontwikkeling uit te breiden, het veiligheidsonderzoek te verbeteren en de wereldwijde groei te versnellen.

De Grenzen van Redeneren Verleggen: De BBEH Benchmark

Large Language Models (LLM’s) worden steeds meer geïntegreerd in alledaagse toepassingen, waardoor robuuste redeneercapaciteiten in diverse domeinen vereist zijn. Bestaande benchmarks geven echter vaak prioriteit aan wiskunde en codering, waarbij andere cruciale redeneertypen worden verwaarloosd. Hoewel de BIG-Bench-dataset op grote schaal is gebruikt om LLM’s te beoordelen op complexe redeneertaken, hebben modellen zo’n aanzienlijke vooruitgang geboekt dat ze nu bijna perfecte scores behalen op zowel BIG-Bench als de meer uitdagende variant, BIG-Bench Hard (BBH). Deze verzadiging maakt deze benchmarks minder effectief voor het meten van verdere vooruitgang.

Om deze beperking aan te pakken, hebben onderzoekers BIG-Bench Extra Hard (BBEH) geïntroduceerd. Deze nieuwe benchmark vervangt elke taak in BBH door een aanzienlijk moeilijkere versie, terwijl nog steeds vergelijkbare redeneervaardigheden worden geëvalueerd. Tests op BBEH onthullen dat zelfs de beste algemene modellen slechts een score van 9,8% behalen, terwijl het topmodel dat specifiek is ontworpen voor redeneren 44,8% bereikt. Deze resultaten benadrukken de aanhoudende uitdagingen waarmee LLM’s worden geconfronteerd met complexe redenering, wat wijst op aanzienlijke ruimte voor verbetering. Het volledige onderzoeksartikel biedt verdere details over deze nieuwe benchmark.

AI-Aangedreven Satellieten: Een Nieuw Tijdperk in Ruimteverkenning en -Operaties

TakeMe2Space, een in Hyderabad gevestigde spacetech-startup, heeft onlangs Rs 5,5 crore binnengehaald in een pre-seed financieringsronde onder leiding van Seafund, met deelname van Blume Ventures, Artha Venture Fund, AC Ventures en andere angel investors. Deze financiering, hoewel bescheiden, betekent een belangrijke stap in de richting van de oprichting van India’s eerste AI-lab in de ruimte. TakeMe2Space is van plan de fondsen te gebruiken om MOI-1 (My Orbital Infrastructure–Technology Demonstrator) te ontwikkelen, een platform waarmee gebruikers earth observation AI-modellen of andere ruimte-experimenten rechtstreeks naar een sateliet in een baan om de aarde kunnen uploaden via een webconsole genaamd Orbitlab. Gebruikers betalen alleen voor de gebruikstijd van de satelliet, tegen een tarief van $ 2 per minuut.

Het MOI-TD-platform van het bedrijf heeft naar verluidt aangetoond dat het in staat is om grote AI-modellen vanaf een grondstation te uplinken, externe code op de satelliet uit te voeren en gecodeerde en versleutelde resultaten veilig te downlinken. Dit vertegenwoordigt een stap in de richting van meer autonome en efficiënte satellietoperaties.

TakeMe2Space is niet de enige in dit streven. Organisaties zoals ESA (met OPS-SAT) en Globalstar zijn ook pioniers in real-world toepassingen van AI-aangedreven satelliettechnologie, variërend van veilige IoT-communicatie tot in-orbit AI-modeluitvoering. Naarmate de technologie zich verder ontwikkelt, zullen AI-gestuurde satellieten steeds autonomer worden, wat leidt tot efficiëntere ruimteoperaties en nieuwe mogelijkheden opent voor onderzoek, veiligheid en wereldwijde connectiviteit.

Traditioneel hebben satellieten sterk vertrouwd op grondstations voor gegevensverwerking, besluitvorming en commando-uitvoering. Gegevens moesten worden gedownlinkt, op aarde worden geanalyseerd en vervolgens werden verwerkte inzichten teruggekoppeld naar de satelliet – een proces dat zowel tijdrovend als bandbreedte-intensief was. Vooruitgang in AI en edge computing (het verwerken van gegevens op het apparaat zelf in plaats van in de cloud) stelt satellieten nu echter in staat om gegevens aan boord te verwerken, autonome beslissingen te nemen en alleen de meest cruciale inzichten veilig te verzenden. Dit resulteert in snellere, slimmere en efficiëntere operaties.

De werking van moderne AI-aangedreven satellieten omvat doorgaans drie belangrijke stappen:

  1. Uplink van AI-algoritmen: AI-algoritmen worden vanaf grondstations naar de satellieten verzonden, waardoor ze geavanceerde mogelijkheden voor gegevensverwerking krijgen.
  2. Onboard Data-analyse: AI-modellen analyseren afbeeldingen, sensorgegevens en andere inputs direct in een baan om de aarde, waardoor de noodzaak van constante interventie vanaf de grond wordt geminimaliseerd.
  3. Veilige Downlink van Inzichten: In plaats van ruwe data te verzenden, sturen satellieten versleutelde inzichten, waardoor bandbreedte wordt bespaard en de beveiliging wordt verbeterd.

Deze AI-gestuurde aanpak biedt verschillende voordelen. Het vermindert de latentie aanzienlijk doordat satellieten gegevens in de ruimte kunnen verwerken, waardoor snellere reacties op real-time omstandigheden mogelijk zijn zonder te wachten op instructies van grondstations. Het bandbreedtegebruik wordt geoptimaliseerd, omdat alleen de meest relevante inzichten worden verzonden in plaats van grote hoeveelheden ruwe data. De beveiliging wordt ook verbeterd door versleutelde communicatie, waardoor het risico op cyberdreigingen en datalekken wordt beperkt. Deze voordelen zijn met name waardevol in toepassingen zoals rampenbestrijding, militaire operaties en ruimteverkenning.

De real-world toepassingen van AI-aangedreven satellieten zijn divers en impactvol:

  • Rampenbeheer: Satellieten uitgerust met AI kunnen bosbranden, overstromingen en orkanen in real-time detecteren, waardoor snelle actie door noodhulpteams mogelijk wordt.
  • Precisielandbouw: AI-modellen analyseren de gezondheid van gewassen en de bodemgesteldheid om precisielandbouwpraktijken te verbeteren.
  • Milieumonitoring: Milieuagentschappen gebruiken satellietgegevens om lucht- en watervervuilingsniveaus te volgen.
  • Autonome Navigatie en Ruimteoperaties: AI verbetert het vermijden van botsingen door potentiële bedreigingen te voorspellen en erop te reageren, waardoor de veiligheid van satellieten wordt gewaarborgd. Het vergemakkelijkt ook de coördinatie van satellietconstellaties, waardoor de dekking en efficiëntie worden verbeterd. Bovendien speelt AI een cruciale rol bij het volgen en voorspellen van bewegingen van ruimtepuin, waardoor het risico op schade aan ruimte-infrastructuur wordt verminderd.
  • Defensie en Veiligheid: AI-aangedreven bewakingssystemen detecteren ongeautoriseerde activiteiten en militaire bewegingen met verhoogde nauwkeurigheid.
  • Telecommunicatie en IoT: AI-gestuurde satellieten dragen bij aan slimmere verkeersroutering, verbeteren de satellietinternetconnectiviteit en zorgen voor naadloze wereldwijde communicatie.
  • Ruimteverkenning: AI verbetert de efficiëntie van ruimtetelescopen bij het detecteren van asteroïden en exoplaneten, waardoor de ruimteontdekkingsinspanningen aanzienlijk worden bevorderd.

Ondanks de talrijke voordelen blijven er uitdagingen bestaan bij de ontwikkeling en implementatie van AI-aangedreven satellieten:

  • Beperkte Rekenkracht: Satellieten moeten werken op low-power, stralingsgeharde chips, die de AI-mogelijkheden beperken.
  • Harde Ruimteomgeving: Blootstelling aan straling vormt een risico op hardwarestoringen.
  • Beveiligingsdreigingen: Het uplinken en uitvoeren van externe code in de ruimte vereist zorgvuldig beheer om cyberaanvallen te voorkomen.
  • Kosten en Ontwikkeltijd: Het bouwen, testen en valideren van AI-compatibele satelliet hardware is een kostbaar en tijdrovend proces.
  • Aanpassingsvereisten: AI-modellen die in een baan om de aarde worden ingezet, moeten zeer aanpasbaar zijn, functioneren met minimale updates en zich autonoom aanpassen aan nieuwe scenario’s.

AI Ontgrendeld: Het Elimineren van Herhalende Zinnen in ChatGPT

AI kan een waardevol hulpmiddel zijn bij het creëren van content, het assisteren bij het schrijven, brainstormen, het verbeteren van de helderheid, het verfijnen van de structuur en het verbeteren van de algehele leesbaarheid. Een veelvoorkomend probleem met AI-gegenereerde tekst is echter de neiging tot formule-achtige taal als gevolg van repetitieve woordkeuzes. In plaats van frisse, impactvolle boodschappen te leveren, vertrouwt AI vaak op bekende patronen, waardoor de effectiviteit en originaliteit worden verminderd.

Overmatig gebruikte woorden en zinnen, zoals “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” en “A testament to…,” kunnen de kwaliteit van AI-gegenereerde content aanzienlijk verminderen. Voor productmarketeers kan deze herhaling de boodschap minder overtuigend maken, de betrokkenheid van het publiek verminderen, de merkdifferentiatie verzwakken en voorkomen dat inzichten en strategische boodschappen opvallen in een drukke markt.

Door gebruik te maken van de geheugenfunctie van ChatGPT, is het mogelijk om dit probleem te verminderen en overmatig gebruikte woorden en zinnen te elimineren. Hier is hoe je deze functie effectief kunt gebruiken:

Toegang: ChatGPT is toegankelijk via de website of mobiele app.

Voordelen:

  • Verbeterde Originaliteit: Zorgt ervoor dat AI-gegenereerde content minder robotachtig en menselijker aanvoelt.
  • Verbeterde Merkboodschap: Vermijdt generieke formuleringen die de merkdifferentiatie verzwakken.
  • Verhoogde Betrokkenheid: Stimuleert effectievere communicatie door redundantie te verminderen.

Voorbeeld: Generatie van Productmarketing Content

Stel je een productmarketeer voor die de taak heeft om content te schrijven voor een nieuwe productlancering. Een eerste verzoek aan ChatGPT kan resulteren in een reactie vol met repetitieve en generieke zinnen zoals “delving into an intricate landscape of innovation…,” waardoor de boodschap ongeïnspireerd aanvoelt.

Om meer overtuigende en unieke content te creëren, kan de marketeer de volgende stappen volgen:

  1. Het Instellen van de Prompt: De marketeer instrueert ChatGPT expliciet: “Vermijd de volgende woorden: delve, tapestry, vibrant, landscape, realm, embark, excels. Sla dit op in het geheugen.” Dit instrueert ChatGPT om deze termen actief te filteren in zijn reacties.
  2. Gebruik van Persistent Geheugen: De zin “Sla dit op in het geheugen” zorgt ervoor dat ChatGPT deze specifieke instructies onthoudt over meerdere interacties. Dit maakt het mogelijk om de gespecificeerde woorden en zinnen persistent te vermijden. ChatGPT controleert zijn geheugen voordat het tekst genereert en houdt zich aan de instructies om de aangewezen termen te vermijden.
  3. Handmatige Review: Na het genereren van de reactie, beoordeelt de marketeer de content op eventuele resterende redundantie en verfijnt de taal voor helderheid en impact.

Effectiviteit:

  • Prompt Aanpassing: Specifieke instructies helpen de output van de AI vorm te geven.
  • Geheugenbehoud: ChatGPT kan regels voor het vermijden van woorden opslaan en volgen over gesprekken heen.
  • Handmatige Verfijning: Een laatste menselijke bewerking zorgt voor helderheid en authenticiteit.

Opmerking: De tools en analyse die in deze sectie worden gepresenteerd, zijn gebaseerd op interne tests en tonen duidelijke waarde. De aanbevelingen zijn onafhankelijk en niet beïnvloed door de makers van de tools.

Aanvullend AI Nieuws en Ontwikkelingen

  • AI-Aangedreven Smartphones in Opkomst: Deutsche Telekom kondigde plannen aan op het Mobile World Congress 2025 in Barcelona om een AI-aangedreven smartphone te lanceren met een Perplexity-assistent. Deze assistent is ontworpen om dagelijkse taken te vereenvoudigen, zoals het bestellen van taxi’s, het reserveren van tafels, het vertalen van talen in real-time en het beantwoorden van vragen van gebruikers. Het bedrijf ziet dit als een virtuele assistent die miljoenen klanten zal ondersteunen bij het schrijven van e-mails, het starten van oproepen, het samenvatten van teksten en het beheren van agenda’s. De AI Phone zal Google Cloud AI, ElevenLabs en Picsart integreren om de functionaliteit te verbeteren, en de lancering is gepland voor later dit jaar. Glance, een InMobi-eenheid, en Google Cloud kondigden ook een samenwerking aan om Google’s AI-modellen te gebruiken voor het ontwikkelen van consumentgerichte AI-toepassingen om de gebruikerservaring op smartphone-vergrendelingsschermen en ambient tv-schermen te verbeteren. Glance voedt momenteel meer dan 450 miljoen Android-gebaseerde smartphones wereldwijd.

  • Overheidssectoren Zien Daling in Kritieke Cyberincidenten: Overheids- en ontwikkelingsindustrieën hebben in 2024 een aanzienlijke daling ervaren in incidenten met hoge ernst waarbij directe menselijke betrokkenheid was, volgens het laatste Kaspersky Managed Detection and Response (MDR) analistenrapport. De voedings-, IT-, telecom- en industriële sectoren vertoonden echter een toename van dergelijke incidenten.

  • OpenAI Plant Integratie van Sora in ChatGPT: OpenAI werkt aan de integratie van zijn AI-videogeneratietool, Sora, rechtstreeks in ChatGPT. Momenteel is Sora alleen beschikbaar via een speciale web-app, waarmee gebruikers filmische clips tot 20 seconden lang kunnen genereren. OpenAI ontwikkelt ook een AI-beeldgenerator aangedreven door Sora.