AI revolutioneert schildklierkankerdiagnose

Een baanbrekende vooruitgang in de medische technologie is ontstaan met de creatie van ‘s werelds eerste artificiële intelligentie (AI) model dat in staat is om zowel het stadium als de risicocategorie van schildklierkanker te classificeren met een opmerkelijke nauwkeurigheid van meer dan 90%. Deze innovatieve tool belooft de voorbereidingstijd vóór consultatie voor eerstelijns clinici aanzienlijk te verminderen met ongeveer 50%, wat een grote sprong voorwaarts betekent in de efficiëntie en precisie van kankerdiagnose en -behandeling.

Het ontstaan van het AI-model

De ontwikkeling van dit baanbrekende AI-model is het resultaat van gezamenlijke inspanningen van een interdisciplinair onderzoeksteam bestaande uit experts van de LKS Faculty of Medicine van de University of Hong Kong (HKUMed), het InnoHK Laboratory of Data Discovery for Health (InnoHK D24H) en de London School of Hygiene & Tropical Medicine (LSHTM). Hun bevindingen, gepubliceerd in het gerenommeerde tijdschrift npj Digital Medicine, benadrukken het potentieel van AI om de klinische praktijk te transformeren en de resultaten voor patiënten te verbeteren.

Schildklierkanker, een veel voorkomende maligniteit zowel in Hong Kong als wereldwijd, vereist nauwkeurige managementstrategieën. Het succes van deze strategieën hangt af van twee kritieke systemen:

  • Het American Joint Committee on Cancer (AJCC) of Tumor-Node-Metastasis (TNM) kankerstadiumsysteem: Dit systeem, nu in zijn 8e editie, wordt gebruikt om de omvang en verspreiding van de kanker te bepalen.
  • Het American Thyroid Association (ATA) risicoclassificatiesysteem: Dit systeem categoriseert het risico op terugkeer of progressie van kanker.

Deze systemen zijn onmisbaar voor het voorspellen van overlevingskansen van patiënten en het informeren van behandelbeslissingen. De conventionele methode om complexe klinische informatie handmatig in deze systemen te integreren is echter vaak tijdrovend en vatbaar voor inefficiënties.

Hoe de AI-assistent werkt

Om deze uitdagingen aan te gaan, heeft het onderzoeksteam een AI-assistent ontwikkeld die gebruikmaakt van grote taalmodellen (LLM’s), vergelijkbaar met die gebruikt in ChatGPT en DeepSeek. Deze LLM’s zijn ontworpen om menselijke taal te begrijpen en te verwerken, waardoor ze klinische documenten kunnen analyseren en de nauwkeurigheid en efficiëntie van schildklierkankerstadiëring en risicoclassificatie kunnen verbeteren.

Het AI-model maakt gebruik van vier offline open-source LLM’s - Mistral (Mistral AI), Llama (Meta), Gemma (Google) en Qwen (Alibaba) - om klinische documenten met vrije tekst te analyseren. Deze aanpak zorgt ervoor dat het model een breed scala aan klinische informatie kan verwerken, waaronder pathologierapporten, chirurgische aantekeningen en andere relevante medische gegevens.

Training en validatie van het AI-model

Het AI-model is zorgvuldig getraind met behulp van een in de VS gevestigde open-access dataset met pathologierapporten van 50 schildklierkankerpatiënten afkomstig van het Cancer Genome Atlas Program (TCGA). Na de trainingsfase werd de prestatie van het model rigoureus gevalideerd aan de hand van pathologierapporten van 289 TCGA-patiënten en 35 pseudogevallen die zijn gemaakt door ervaren endocrinologen. Dit uitgebreide validatieproces zorgde ervoor dat het model robuust en betrouwbaar was in een breed scala aan klinische scenario’s.

Prestaties en nauwkeurigheid

Door de output van alle vier LLM’s te combineren, heeft het onderzoeksteam de algehele prestaties van het AI-model aanzienlijk verbeterd. Het model behaalde een indrukwekkende algehele nauwkeurigheid van 88,5% tot 100% in ATA-risicoclassificatie en 92,9% tot 98,1% in AJCC-kankerstadiëring. Dit nauwkeurigheidsniveau overtreft dat van traditionele handmatige documentbeoordelingen, die vaak onderhevig zijn aan menselijke fouten en inconsistenties.

Een van de belangrijkste voordelen van dit AI-model is het vermogen om de tijd die clinici besteden aan de voorbereiding van pre-consultatie met ongeveer 50% te verminderen. Deze tijdsbesparing stelt clinici in staat om meer tijd te besteden aan directe patiëntenzorg, waardoor de algehele patiëntervaring wordt verbeterd en de kwaliteit van de zorg wordt verbeterd.

Belangrijkste inzichten van het onderzoeksteam

Professor Joseph T Wu, Sir Kotewall Professor in Public Health en Managing Director van InnoHK D24H bij HKUMed, benadrukte de uitstekende prestaties van het model en verklaarde: ‘Ons model bereikt meer dan 90% nauwkeurigheid bij het classificeren van AJCC-kankerstadia en ATA-risicocategorie. Een aanzienlijk voordeel van dit model is de offline-mogelijkheid, die lokale implementatie mogelijk zou maken zonder de noodzaak om gevoelige patiëntinformatie te delen of te uploaden, waardoor maximale privacy van de patiënt wordt geboden.’

Professor Wu benadrukte ook het vermogen van het model om op hetzelfde niveau te presteren als krachtige online LLM’s zoals DeepSeek en GPT-4o, en merkte op: ‘In het licht van de recente debuut van DeepSeek hebben we verdere vergelijkende tests uitgevoerd met een ‘zero-shot benadering’ tegen de nieuwste versies van DeepSeek - R1 en V3 - evenals GPT-4o. We waren blij te constateren dat ons model op hetzelfde niveau presteerde als deze krachtige online LLM’s.’

Dr. Matrix Fung Man-him, klinisch assistent-professor en hoofd van de endocriene chirurgie, afdeling Chirurgie, School of Clinical Medicine, HKUMed, onderstreepte de praktische voordelen van het model en verklaarde: ‘Naast het bieden van een hoge nauwkeurigheid bij het extraheren en analyseren van informatie uit complexe pathologierapporten, operatieverslagen en klinische aantekeningen, verkort ons AI-model ook de voorbereidingstijd van artsen drastisch met bijna de helft in vergelijking met menselijke interpretatie. Het kan tegelijkertijd kankerstadiëring en klinische risicostratificatie bieden op basis van twee internationaal erkende klinische systemen.’

Dr. Fung benadrukte ook de veelzijdigheid en het potentieel van het model voor wijdverbreide adoptie en verklaarde: ‘Het AI-model is veelzijdig en kan gemakkelijk worden geïntegreerd in verschillende omgevingen in de publieke en private sector, en zowel lokale als internationale gezondheidszorg- en onderzoeksinstituten. We zijn optimistisch dat de implementatie van dit AI-model in de echte wereld de efficiëntie van eerstelijns clinici kan verbeteren en de kwaliteit van de zorg kan verbeteren. Bovendien hebben artsen meer tijd om hun patiënten te adviseren.’

Dr. Carlos Wong, Honorary Associate Professor in de afdeling Family Medicine and Primary Care, School of Clinical Medicine, HKUMed, benadrukte het belang van het valideren van het model met echte patiëntgegevens en verklaarde: ‘In overeenstemming met de sterke pleidooi van de overheid voor AI-adoptie in de gezondheidszorg, zoals geïllustreerd door de recente lancering van een op LLM gebaseerd systeem voor het schrijven van medische rapporten in de Hospital Authority, is onze volgende stap het evalueren van de prestaties van deze AI-assistent met een grote hoeveelheid echte patiëntgegevens.’

Dr. Wong benadrukte ook het potentieel van het model om te worden ingezet in klinische omgevingen en ziekenhuizen en verklaarde: ‘Eenmaal gevalideerd, kan het AI-model gemakkelijk worden ingezet in echte klinische omgevingen en ziekenhuizen om clinici te helpen de operationele en behandelingsefficiëntie te verbeteren.’

Implicaties voor de klinische praktijk

De ontwikkeling van dit AI-model heeft diepgaande implicaties voor de klinische praktijk op het gebied van schildklierkankerdiagnose en -behandeling. Door het proces van kankerstadiëring en risicoclassificatie te automatiseren, kan het model clinici vrijmaken om zich te concentreren op andere kritieke aspecten van patiëntenzorg, zoals behandelplanning en patiëntbegeleiding.

Bovendien kunnen de hoge nauwkeurigheid en betrouwbaarheid van het model helpen om het risico op fouten en inconsistenties in het diagnostisch proces te verminderen. Dit kan leiden tot meer geïnformeerde behandelbeslissingen en verbeterde resultaten voor de patiënt.

Het AI-model heeft ook het potentieel om de toegang tot kwaliteitszorg voor patiënten in achtergestelde gebieden te verbeteren. Door clinici in staat te stellen schildklierkanker efficiënter te diagnosticeren en te behandelen, kan het model helpen om ongelijkheden in de toegang tot de gezondheidszorg en de resultaten te verminderen.

Toekomstige richtingen

Het onderzoeksteam is van plan om het AI-model verder te verfijnen en te verbeteren, met een focus op het uitbreiden van de mogelijkheden en het verbeteren van de nauwkeurigheid. Toekomstig onderzoek zal ook het potentieel van het model onderzoeken om te worden gebruikt in andere gebieden van kankerdiagnose en -behandeling.

Daarnaast is het team van plan om verdere studies uit te voeren om de impact van het AI-model op de klinische praktijk en de resultaten voor de patiënt te evalueren. Deze studies zullen helpen om de beste manieren te bepalen om het model te integreren in klinische workflows en om ervoor te zorgen dat het effectief wordt gebruikt om de patiëntenzorg te verbeteren.

De ontwikkeling van dit AI-model vertegenwoordigt een belangrijke stap voorwaarts in de strijd tegen schildklierkanker. Door de kracht van artificiële intelligentie te benutten, werken onderzoekers en clinici aan het verbeteren van de nauwkeurigheid, efficiëntie en toegankelijkheid van kankerdiagnose en -behandeling, wat uiteindelijk leidt tot betere resultaten voor patiënten.

Gedetailleerd onderzoek van de componenten en functionaliteit van het AI-model

De architectuur van het AI-model is een geavanceerde mix van verschillende geavanceerde technologieën, ontworpen om de cognitieve processen die betrokken zijn bij medische diagnoses te emuleren en te verbeteren. In de kern vertrouwt het model op Large Language Models (LLM’s), een type artificiële intelligentie dat opmerkelijke vaardigheid heeft getoond in het begrijpen, interpreteren en genereren van menselijke taal. Deze LLM’s, zoals Mistral, Llama, Gemma en Qwen, dienen als de fundamentele bouwstenen voor de analytische mogelijkheden van de AI.

Rol van grote taalmodellen (LLM’s)

LLM’s zijn getraind op enorme datasets van tekst en code, waardoor ze patronen, relaties en nuances binnen de gegevens kunnen onderscheiden. In de context van dit AI-model hebben de LLM’s de taak om klinische documenten te analyseren, waaronder pathologierapporten, chirurgische aantekeningen en andere medische gegevens. Deze documenten bevatten vaak complexe en technische taal, waardoor een hoog niveau van begrip vereist is om relevante informatie te extraheren.

De LLM’s verwerken de tekst door deze op te splitsen in kleinere eenheden, zoals woorden en zinsdelen, en analyseren vervolgens de relaties tussen deze eenheden. Dit proces omvat het identificeren van belangrijke entiteiten, zoals tumoromvang, betrokkenheid van lymfeklieren en afstandsmetastasen, die cruciaal zijn voor het bepalen van het stadium en de risicocategorie van de kanker.

Offline open-source LLM’s: Mistral, Llama, Gemma en Qwen

Het AI-model maakt gebruik van vier offline open-source LLM’s: Mistral (Mistral AI), Llama (Meta), Gemma (Google) en Qwen (Alibaba). Het gebruik van meerdere LLM’s is een strategische beslissing die gericht is op het verbeteren van de robuustheid en nauwkeurigheid van het model. Elke LLM heeft zijn unieke sterke en zwakke punten, en door hun outputs te combineren, kan het model de collectieve intelligentie van deze systemen benutten.

  • Mistral: Bekend om zijn efficiëntie en het vermogen om goed te presteren bij verschillende taken.
  • Llama: Ontworpen voor onderzoeksdoeleinden, biedt een sterke basis voor taalbegrip.
  • Gemma: Het aanbod van Google, bekend om zijn integratie met andere Google-services en zijn sterke prestaties bij het beantwoorden van vragen.
  • Qwen: Ontwikkeld door Alibaba, blinkt uit in het omgaan met complexe Chinese taaltaken.

De integratie van deze diverse LLM’s stelt het AI-model in staat om te profiteren van een breed scala aan perspectieven en benaderingen, wat uiteindelijk leidt tot meer nauwkeurige en betrouwbare resultaten.

Trainingsdataset: Cancer Genome Atlas Program (TCGA)

De trainingsdataset van het AI-model is afgeleid van het Cancer Genome Atlas Program (TCGA), een uitgebreide openbare bron met genomische, klinische en pathologische gegevens voor duizenden kankerpatiënten. De TCGA-dataset biedt een schat aan informatie die essentieel is voor het trainen van het AI-model om patronen en relaties binnen de gegevens te herkennen.

De trainingsdataset bevat pathologierapporten van 50 schildklierkankerpatiënten. Deze rapporten bevatten gedetailleerde informatie over de kenmerken van de tumor, inclusief de grootte, vorm en locatie, evenals informatie over de aanwezigheid van metastatische ziekte. Het AI-model leert deze kenmerken te identificeren en te gebruiken om het kankerstadium en de risicocategorie te classificeren.

Validatieproces: nauwkeurigheid en betrouwbaarheid waarborgen

De prestaties van het AI-model worden rigoureus gevalideerd met behulp van pathologierapporten van 289 TCGA-patiënten en 35 pseudogevallen die zijn gemaakt door ervaren endocrinologen. Het validatieproces is ontworpen om ervoor te zorgen dat het model nauwkeurig en betrouwbaar is in een breed scala aan klinische scenario’s.

Het validatieproces omvat het vergelijken van de classificaties van het AI-model met de classificaties van menselijke experts. De nauwkeurigheid van het AI-model wordt gemeten door het percentage gevallen te berekenen waarin de classificaties van het AI-model overeenkomen met de classificaties van de menselijke experts.

Hoge nauwkeurigheid bereiken bij ATA-risicoclassificatie en AJCC-kankerstadiëring

Het AI-model behaalt een indrukwekkende algehele nauwkeurigheid van 88,5% tot 100% in ATA-risicoclassificatie en 92,9% tot 98,1% in AJCC-kankerstadiëring. Deze hoge nauwkeurigheidspercentages tonen het potentieel van AI aan om de klinische praktijk te transformeren en de resultaten voor de patiënt te verbeteren. Het vermogen van het model om kankerstadia en risicocategorieën nauwkeurig te classificeren, kan clinici helpen om meer geïnformeerde behandelbeslissingen te nemen, wat leidt tot betere resultaten voor patiënten.

Offline-mogelijkheid: privacy van de patiënt waarborgen

Een van de belangrijkste voordelen van dit AI-model is de offline-mogelijkheid. Dit betekent dat het model lokaal kan worden ingezet zonder de noodzaak om gevoelige patiëntinformatie te delen of te uploaden. Dit is cruciaal voor het beschermen van de privacy van de patiënt en het waarborgen van de naleving van de voorschriften voor gegevensbeveiliging.

De offline-mogelijkheid maakt het AI-model ook toegankelijker voor ziekenhuizen en klinieken in omgevingen met beperkte middelen. Deze faciliteiten hebben mogelijk niet de bandbreedte of infrastructuur om online AI-modellen te ondersteunen, maar ze kunnen nog steeds profiteren van de mogelijkheden van het AI-model door het lokaal in te zetten.

Vergelijking met online LLM’s: DeepSeek en GPT-4o

Het onderzoeksteamheeft vergelijkende tests uitgevoerd met de nieuwste versies van DeepSeek en GPT-4o, twee krachtige online LLM’s. De resultaten van deze tests toonden aan dat het AI-model op hetzelfde niveau presteerde als deze online LLM’s, wat aantoont dat het in staat is om te concurreren met de beste AI-systemen ter wereld.

Het feit dat het AI-model op hetzelfde niveau kan presteren als online LLM’s zonder dat een internetverbinding nodig is, is een aanzienlijk voordeel. Dit maakt het AI-model betrouwbaarder en veiliger, omdat het niet afhankelijk is van externe servers of netwerken.

De transformatieve impact op de efficiëntie van de gezondheidszorg en de patiëntenzorg

De integratie van dit AI-model in klinische workflows belooft een aanzienlijke transformatie in de efficiëntie van de gezondheidszorg en de patiëntenzorg. Het vermogen van het model om het proces van kankerstadiëring en risicoclassificatie te automatiseren, kan clinici vrijmaken om zich te concentreren op andere kritieke aspecten van patiëntenzorg, zoals behandelplanning en patiëntbegeleiding.

Het AI-model kan ook helpen om het risico op fouten en inconsistenties in het diagnostisch proces te verminderen, wat leidt tot meer geïnformeerde behandelbeslissingen en verbeterde resultaten voor de patiënt. Bovendien kan het model de toegang tot kwaliteitszorg voor patiënten in achtergestelde gebieden verbeteren door clinici in staat te stellen schildklierkanker efficiënter te diagnosticeren en te behandelen.

Ethische overwegingen aanpakken en een verantwoorde AI-implementatie waarborgen

Zoals met elke AI-technologie, is het essentieel om ethische overwegingen aan te pakken en een verantwoorde AI-implementatie te waarborgen. Het onderzoeksteam zet zich in voor het ontwikkelen en inzetten van het AI-model op een manier die ethisch, transparant en verantwoordelijk is.

Een belangrijke ethische overweging is ervoor te zorgen dat het AI-model niet bevooroordeeld is tegen een bepaalde groep patiënten. Het onderzoeksteam werkt aan het aanpakken van dit probleem door diverse trainingsgegevens te gebruiken en door de prestaties van het model zorgvuldig te volgen bij verschillende patiëntenpopulaties.

Een andere ethische overweging is ervoor te zorgen dat patiënten worden geïnformeerd over het gebruik van AI in hun zorg. Het onderzoeksteam zet zich in om patiënten duidelijke en beknopte informatie te verstrekken over hoe het AI-model wordt gebruikt en hoe dit hun zorg kan beïnvloeden.

Het onderzoeksteam werkt er ook aan om ervoor te zorgen dat het AI-model wordt gebruikt op een manier die in overeenstemming is met de principes van medische ethiek, zoals weldadigheid, niet-schadelijkheid, autonomie en rechtvaardigheid. Door deze principes te volgen, kan het onderzoeksteam helpen ervoor te zorgen dat het AI-model wordt gebruikt om de patiëntenzorg te verbeteren en de gelijkheid in de gezondheidszorg te bevorderen.