Baidu's ERNIE X1 en 4.5: AI-uitdagers | nl

Baidu, een dominante kracht in het Chinese techlandschap, heeft twee belangrijke updates gelanceerd voor zijn ERNIE (Enhanced Representation through Knowledge Integration) foundation model. Deze nieuwe iteraties, ERNIE X1 en ERNIE 4.5, vertegenwoordigen Baidu’s strategische reactie op het steeds competitievere wereldwijde AI-landschap, met name de vooruitgang die is geboekt door zowel Chinese als Amerikaanse bedrijven. Deze modellen zijn niet louter incrementele upgrades; ze zijn ontworpen om head-to-head te concurreren met enkele van de meest geavanceerde AI-systemen die beschikbaar zijn, met mogelijkheden die, volgens Baidu, die van hun rivalen evenaren of overtreffen. Beide modellen zijn toegankelijk voor gebruikers via de ERNIE Bot-chatbot en Baidu plant een gefaseerde integratie in zijn bredere productassortiment, inclusief zijn vlaggenschip Baidu Search.

De timing van deze release is cruciaal. De generatieve AI-sector beleeft een periode van snelle innovatie en intense rivaliteit, met een bijzondere focus op de dynamiek tussen China en de Verenigde Staten. DeepSeek, een Chinese AI-startup, trok begin 2025 de aandacht van de industrie met R1, een open-source redeneermodel dat naar verluidt beter presteerde dan toonaangevende AI-modellen tegen aanzienlijk lagere kosten. Deze stap bracht DeepSeek voor op concurrenten in zowel China als de VS, waaronder Baidu. Baidu was echter een van de eerste Chinese bedrijven die een ChatGPT-concurrent introduceerde, ERNIE Bot.

ERNIE X1 en ERNIE 4.5: Een nadere blik op Baidu’s nieuwe modellen

ERNIE X1 en ERNIE 4.5, hoewel beide ontwikkeld door Baidu, zijn afzonderlijke foundation models die zijn afgestemd op verschillende toepassingen:

ERNIE X1: Dit model is gepositioneerd als een zeer efficiënte redeneermachine, die rechtstreeks concurreert met modellen zoals DeepSeek R1 en OpenAI’s o3 mini. Het is ontworpen voor taken die complexe logische verwerking en het oplossen van problemen in meerdere stappen vereisen.
ERNIE 4.5: Dit model is een grote multimodale AI, die in staat is om verschillende vormen van media te verwerken en te begrijpen – tekst, afbeeldingen, audio en video. Het concurreert met modellen zoals GPT-4o en Google’s Gemini.

De opkomst van DeepSeek’s R1 leidde tot een verschuiving in de prioriteiten van grote AI-spelers zoals Google, OpenAI, Anthropic en xAI. Deze bedrijven begonnen zich te concentreren op efficiëntie en betaalbaarheid, naast de ruwe schaal van het model. Baidu’s introductie van ERNIE X1, in het bijzonder, betekent zijn intrede in deze wereldwijde AI-race, met prestaties die vergelijkbaar zijn met R1 en andere modellen, mogelijk tegen een nog concurrerendere prijs.

Baidu benadrukt dat 2025 een cruciaal jaar is voor de evolutie van grote taalmodellen en gerelateerde technologieën. Het persbericht van het bedrijf benadrukt zijn voortdurende inzet om te investeren in kunstmatige intelligentie, datacenters en cloudinfrastructuur, met als doel zijn AI-mogelijkheden verder te verbeteren en nog krachtigere modellen van de volgende generatie te ontwikkelen.

ERNIE X1: Duiken in diepdenkend redeneren

ERNIE X1 is een taalmodel dat specifiek is ontworpen voor ‘diepdenkend redeneren’. Dit onderscheidt het van traditionele taalmodellen die uitblinken in het genereren van snelle, op patronen gebaseerde reacties. Redeneermodellen zijn daarentegen ontworpen om complexe problemen te ontleden in een reeks logische stappen. Ze evalueren verschillende potentiële oplossingen en verfijnen hun antwoorden voordat ze een definitieve output presenteren. Dit maakt ze bijzonder geschikt voor taken die multi-step planning, logische deductie en ingewikkelde probleemoplossing omvatten.

Baidu schrijft de redeneerkracht van ERNIE X1 toe aan verschillende geavanceerde technieken, waaronder:

Progressive Reinforcement Learning: Dit suggereert een iteratief leerproces waarbij het model continu zijn prestaties verbetert door middel van feedback.
End-to-End Training: Dit impliceert een holistische trainingsaanpak waarbij het hele model tegelijkertijd wordt geoptimaliseerd, in plaats van in afzonderlijke fasen.
Chains of Thought and Action: Deze techniek stelt het model waarschijnlijk in staat om een reeks logische stappen te volgen, waarbij menselijke denkprocessen worden nagebootst.
Unified Multi-faceted Reward System: Dit suggereert een geavanceerd systeem voor het evalueren en belonen van de prestaties van het model op verschillende aspecten van redeneren.

Hoewel Baidu geen uitputtende technische details heeft vrijgegeven, wijzen deze methoden op een focus op iteratief leren, contextueel begrip en gestructureerd redeneren – sterke punten die ook kenmerkend zijn voor andere succesvolle redeneermodellen.

In praktische toepassingen claimt Baidu dat ERNIE X1 ‘verbeterde mogelijkheden in begrip, planning, reflectie en evolutie’ vertoont. Het bedrijf benadrukt zijn bekwaamheid op gebieden zoals:

Literary Creation: Het genereren van creatieve tekstformaten.
Manuscript Writing: Assisteren bij het opstellen van langere documenten.
Dialogue: Deelnemen aan natuurlijke en coherente gesprekken.
Logical Reasoning: Het oplossen van problemen die logische deductie vereisen.
Complex Calculations: Het uitvoeren van ingewikkelde wiskundige bewerkingen.
‘Chinese Knowledge’: Deze niet-gespecificeerde mogelijkheid verwijst waarschijnlijk naar een diep begrip van de Chinese taal, cultuur en context.

Bijgevolg wordt ERNIE X1 voorzien om een breed scala aan toepassingen aan te drijven, waaronder:

Search Engines: Het verbeteren van zoekresultaten met een genuanceerder begrip.
Document Summarization and Q&A: Het bieden van beknopte samenvattingen en nauwkeurige antwoorden op vragen.
Image Understanding and Generation: Het interpreteren en creëren van visuele inhoud.
Code Interpretation: Het analyseren en begrijpen van programmeercode.
Webpage Analysis: Het extraheren van belangrijke informatie van webpagina’s.
Mind Mapping: Het creëren van visuele representaties van ideeën en concepten.
Academic Research: Assisteren bij onderzoekstaken in verschillende disciplines.
Business and Franchise Information Search: Het verstrekken van relevante informatie voor zakelijke vragen.

ERNIE X1: Benchmarking tegen de concurrentie

Hoewel Baidu geen specifieke benchmarkscores of gedetailleerde evaluaties voor ERNIE X1 heeft vrijgegeven, beweert het dat de prestaties van het model ‘vergelijkbaar zijn met’ DeepSeek R1, terwijl het wordt aangeboden voor ‘slechts de helft van de prijs’. Op dit moment heeft Baidu geen vergelijkingen met andere redeneermodellen op de markt verstrekt. Dit gebrek aan gedetailleerde vergelijkende gegevens maakt het moeilijk om de concurrentiepositie van ERNIE X1 volledig te beoordelen, maar de claim van vergelijkbare prestaties tegen lagere kosten is zeker opmerkelijk.

ERNIE 4.5: Omarmen van native multimodale mogelijkheden

ERNIE 4.5 wordt door Baidu gepresenteerd als een ‘native multimodal model’. Dit betekent dat het is ontworpen om verschillende vormen van media – tekst, afbeeldingen, audio en video – naadloos te integreren en te begrijpen binnen een uniform framework. In tegenstelling tot veel AI-systemen die verschillende mediatypen afzonderlijk verwerken, is ERNIE 4.5 ontworpen om deze modaliteiten te combineren en zelfs tussen hen te converteren (bijv. tekst naar audio en vice versa).

Baidu benadrukt dat ERNIE 4.5 ‘collaboratieve optimalisatie bereikt door gezamenlijke modellering van meerdere modaliteiten, wat uitzonderlijke multimodale begripsmogelijkheden demonstreert’. Dit suggereert een geavanceerde aanpak waarbij het model leert om informatie over verschillende mediatypen te begrijpen en te relateren.

Naast zijn multimodale bekwaamheid, beschikt ERNIE 4.5 over ‘verfijnde taalvaardigheden’, waardoor zijn begrip- en generatiemogelijkheden, evenals zijn logische redenering, geheugen en codeervaardigheden worden verbeterd. Baidu benadrukt ook de ‘sterke intelligentie’ en het ‘contextuele bewustzijn’ van het model, met name zijn vermogen om genuanceerde inhoud te herkennen, zoals internetmemes en satirische cartoons. Dit duidt op een focus op het begrijpen van niet alleen de letterlijke betekenis van inhoud, maar ook de culturele en sociale context ervan.

Bovendien claimt Baidu dat ERNIE 4.5 minder vatbaar is voor ‘hallucinaties’ – een veelvoorkomend probleem in AI waarbij modellen valse of misleidende informatie genereren die op het eerste gezicht plausibel kan lijken. Dit is een cruciale verbetering, omdat hallucinaties de betrouwbaarheid en geloofwaardigheid van AI-systemen kunnen ondermijnen.

Baidu schrijft deze vooruitgang toe aan verschillende sleuteltechnologieën, waaronder:

Spatiotemporal Representation Compression: Dit verwijst waarschijnlijk naar technieken voor het efficiënt representeren en verwerken van informatie die in de tijd en ruimte verandert, zoals video-inhoud.
Knowledge-Centric Training Data Construction: Dit suggereert een focus op het bouwen van trainingsdatasets die rijk zijn aan feitelijke kennis.
Self-Feedback Enhanced Post-Training: Dit impliceert een mechanisme waarbij het model kan leren van zijn eigen outputs en zijn prestaties in de loop van de tijd kan verbeteren.
Heterogeneous Multimodal Mixture-of-Experts (MoE): Deze aanpak maakt gebruik van kleinere, gespecialiseerde ‘expert’-modellen die alleen worden geactiveerd wanneer dat nodig is. Dit optimaliseert de prestaties en verlaagt de computationele kosten. MoE-modellen zijn vaak kleiner en kosteneffectiever dan traditionele op transformatoren gebaseerde modellen, maar ze kunnen vergelijkbare of zelfs superieure prestaties bereiken, waardoor ze een aantrekkelijke optie zijn voor AI-ontwikkeling.

Vooruitkijkend geven rapporten aan dat Baidu van plan is om ERNIE 5 later in 2025 uit te brengen, met de belofte van ‘grote verbeteringen’ in zijn multimodale mogelijkheden. Dit suggereert een voortdurende inzet om de grenzen van multimodale AI te verleggen.

ERNIE 4.5: Een vergelijkende analyse

Baidu heeft de multimodale mogelijkheden van ERNIE 4.5 direct vergeleken met OpenAI’s GPT-4o. Het bedrijf claimt dat ERNIE 4.5 beter presteerde dan GPT-4o in bijna elke benchmark, met uitzondering van MMU (Massive Multi-discipline Understanding). MMU evalueert modellen op een breed scala aan taken op universitair niveau die diepgaande vakkennis en weloverwogen redenering vereisen. Dit suggereert dat, hoewel ERNIE 4.5 op veel gebieden uitblinkt, GPT-4o mogelijk nog steeds een voordeel heeft bij taken die gespecialiseerde academische kennis vereisen.

Baidu presenteert ook benchmarkresultaten die aangeven dat ERNIE 4.5 beter presteert dan OpenAI’s GPT-4o en GPT-4.5, evenals DeepSeek’s V3, op verschillende andere gebieden, waaronder:

C-Eval: Deze benchmark beoordeelt geavanceerde kennis- en redeneervaardigheden in verschillende disciplines, van de geesteswetenschappen tot wetenschap en techniek. De sterke prestaties van ERNIE 4.5 hier suggereren een breed begrip van diverse onderwerpen.
CMMLU: Deze benchmark evalueert kennis- en redeneervaardigheden binnen de specifieke context van de Chinese taal en cultuur. Het succes van ERNIE 4.5 hier benadrukt zijn bekwaamheid op dit gebied.
GSM8K: Deze benchmark evalueert redeneren in meerdere stappen met behulp van wiskundige problemen op de basisschool. De prestaties van ERNIE 4.5 duiden op sterke capaciteiten in wiskundig redeneren.
DROP: Deze benchmark meet het leesbegrip van een LLM. De resultaten van ERNIE 4.5 suggereren een hoog niveau van tekstbegrip.

Het is echter belangrijk om te erkennen dat veel van de benchmarks waarin ERNIE 4.5 superieure prestaties liet zien, specifiek gericht waren op de Chinese taal en cultuur. Dit kan gedeeltelijk verklaren waarom GPT-4o en GPT-4.5, modellen ontwikkeld door een Amerikaans bedrijf, niet zo goed presteerden. Desalniettemin presteerde ERNIE 4.5 ook beter dan DeepSeek-V3, een model ontwikkeld door een Chinees bedrijf, op veel van deze benchmarks, wat wijst op een echt concurrentievoordeel in de Chinese context.

Omgekeerd presteerde ERNIE 4.5 naar verluidt niet zo goed op bepaalde andere benchmarks, waaronder:

MMLU-Pro: Deze benchmark evalueert taalbegrip over een bredere en uitdagendere reeks taken. GPT-4.5 presteerde hier beter dan ERNIE 4.5, wat wijst op een potentieel voordeel in algemeen taalbegrip.
GPQA: Deze benchmark omvat een dataset van meerkeuzevragen geschreven door experts in biologie, natuurkunde en scheikunde. GPT-4.5 presteerde opnieuw beter dan ERNIE 4.5, wat wijst op een sterkere greep op gespecialiseerde wetenschappelijke kennis.
Math-500: Deze benchmark test het vermogen om uitdagende wiskundige problemen op middelbare schoolniveau op te lossen. Zowel DeepSeek-V3 als GPT-4.5 presteerden beter dan ERNIE 4.5, wat wijst op een behoefte aan verdere verbetering in geavanceerd wiskundig redeneren.
LiveCodeBench: Deze benchmark meet codeervaardigheden. GPT-4.5 presteerde beter dan ERNIE 4.5, wat wijst op een potentieel voordeel in codegeneratie en -begrip.

Ondanks de superieure prestaties van GPT-4.5 op sommige benchmarks, benadrukt Baidu dat ERNIE 4.5 slechts 1% van de prijs van het OpenAI-model kost. Dit aanzienlijke kostenverschil zou ERNIE 4.5 een zeer aantrekkelijke optie kunnen maken voor bedrijven en ontwikkelaars die op zoek zijn naar een kosteneffectieve multimodale AI-oplossing.

Toegang tot ERNIE X1 en ERNIE 4.5

ERNIE 4.5 is momenteel toegankelijk via zijn API en op Baidu AI Cloud’s MaaS (Model-as-a-Service) platform, Qianfan. Inputprijzen beginnen bij RMB 0,004 per duizend tokens, en outputprijzen beginnen bij RMB 0,016 per duizend tokens. Baidu stelt dat ERNIE X1 ‘binnenkort’ beschikbaar zal zijn op het platform, met inputprijzen vanaf RMB 0,002 per duizend tokens en outputprijzen vanaf RMB 0,008 per duizend tokens.

Gebruikers kunnen ook met beide modellen communiceren via Baidu’s chatbot, ERNIE Bot, die een handige en gebruiksvriendelijke interface biedt om hun mogelijkheden te verkennen.

De specifieke prijsstructuur en beschikbaarheidsdetails benadrukken Baidu’s inzet om deze geavanceerde AI-modellen toegankelijk te maken voor een breed scala aan gebruikers, van individuele ontwikkelaars tot grote ondernemingen. De concurrerende prijsstelling, met name voor ERNIE X1, positioneert Baidu als een sterke concurrent op de wereldwijde AI-markt, die een aantrekkelijk alternatief biedt voor modellen van Amerikaanse techreuzen.

bijgewerkt op 2025-03-20

# AIGC # Baidu # ERNIE