Die Entstehung des KI-Modells
Die Entwicklung dieses bahnbrechenden KI-Modells ist das Ergebnis einer Zusammenarbeit eines interdisziplinären Forschungsteams der LKS Faculty of Medicine der University of Hong Kong (HKUMed), des InnoHK Laboratory of Data Discovery for Health (InnoHK D24H) und der London School of Hygiene & Tropical Medicine (LSHTM). Ihre in der renommierten Zeitschrift npj Digital Medicine veröffentlichten Ergebnisse unterstreichen das Potenzial der KI, die klinische Praxis zu verändern und die Patientenergebnisse zu verbessern.
Schilddrüsenkrebs, eine sowohl in Hongkong als auch weltweit weit verbreitete bösartige Erkrankung, erfordert präzise Behandlungsstrategien. Der Erfolg dieser Strategien hängt von zwei kritischen Systemen ab:
- Das American Joint Committee on Cancer (AJCC) oder Tumor-Node-Metastasis (TNM) Krebsstadiumsystem: Dieses System, jetzt in seiner 8. Auflage, wird verwendet, um das Ausmaß und die Ausbreitung des Krebses zu bestimmen.
- Das American Thyroid Association (ATA) Risikoklassifizierungssystem: Dieses System kategorisiert das Risiko eines Wiederauftretens oder Fortschreitens des Krebses.
Diese Systeme sind unerlässlich, um die Überlebensraten der Patienten vorherzusagen und Behandlungsentscheidungen zu treffen. Die herkömmliche Methode, komplexe klinische Informationen manuell in diese Systeme zu integrieren, ist jedoch oft zeitaufwendig und anfällig für Ineffizienzen.
Wie der KI-Assistent funktioniert
Um diese Herausforderungen zu bewältigen, entwickelte das Forschungsteam einen KI-Assistenten, der Large Language Models (LLMs) nutzt, ähnlich denen, die in ChatGPT und DeepSeek verwendet werden. Diese LLMs sind darauf ausgelegt, menschliche Sprache zu verstehen und zu verarbeiten, wodurch sie klinische Dokumente analysieren und die Genauigkeit und Effizienz der Schilddrüsenkrebs-Stadieneinteilung und Risikoklassifizierung verbessern können.
Das KI-Modell verwendet vier Offline-Open-Source-LLMs – Mistral (Mistral AI), Llama (Meta), Gemma (Google) und Qwen (Alibaba) – um Freitext-Klinikdokumente zu analysieren. Dieser Ansatz stellt sicher, dass das Modell eine breite Palette klinischer Informationen verarbeiten kann, einschließlich Pathologieberichten, Operationsberichten und anderen relevanten medizinischen Aufzeichnungen.
Training und Validierung des KI-Modells
Das KI-Modell wurde sorgfältig mit einem in den USA ansässigen Open-Access-Datensatz trainiert, der Pathologieberichte von 50 Schilddrüsenkrebspatienten aus dem Cancer Genome Atlas Program (TCGA) enthält. Nach der Trainingsphase wurde die Leistung des Modells rigoros anhand von Pathologieberichten von 289 TCGA-Patienten und 35 von erfahrenen endokrinen Chirurgen erstellten Pseudo-Fällen validiert. Dieser umfassende Validierungsprozess stellte sicher, dass das Modell robust und zuverlässig über eine Vielzahl von klinischen Szenarien hinweg ist.
Leistung und Genauigkeit
Durch die Kombination der Ausgabe aller vier LLMs verbesserte das Forschungsteam die Gesamtleistung des KI-Modells erheblich. Das Modell erreichte eine beeindruckende Gesamtgenauigkeit von 88,5 % bis 100 % in der ATA-Risikoklassifizierung und 92,9 % bis 98,1 % in der AJCC-Krebsstadieneinteilung. Dieser Grad an Genauigkeit übertrifft den herkömmlicher manueller Dokumentenprüfungen, die oft menschlichen Fehlern und Inkonsistenzen unterliegen.
Einer der bedeutendsten Vorteile dieses KI-Modells ist seine Fähigkeit, die Zeit, die Kliniker für die Vorbereitung vor der Konsultation aufwenden, um etwa 50 % zu reduzieren. Diese Zeitersparnis ermöglicht es Klinikern, mehr Zeit der direkten Patientenversorgung zu widmen, das gesamte Patientenerlebnis zu verbessern und die Qualität der Versorgung zu verbessern.
Wichtige Erkenntnisse des Forschungsteams
Professor Joseph T Wu, Sir Kotewall Professor für Public Health und Managing Director von InnoHK D24H an der HKUMed, betonte die herausragende Leistung des Modells und erklärte: ‘Unser Modell erreicht eine Genauigkeit von über 90 % bei der Klassifizierung von AJCC-Krebsstadien und der ATA-Risikokategorie. Ein wesentlicher Vorteil dieses Modells ist seine Offline-Fähigkeit, die eine lokale Bereitstellung ermöglicht, ohne sensible Patientendaten weitergeben oder hochladen zu müssen, wodurch ein maximaler Patientendatenschutz gewährleistet wird.’
Professor Wu hob auch die Fähigkeit des Modells hervor, mit leistungsstarken Online-LLMs wie DeepSeek und GPT-4o gleichzuziehen, und merkte an: ‘Angesichts des jüngsten Debüts von DeepSeek haben wir weitere vergleichende Tests mit einem ‘Zero-Shot-Ansatz’ gegen die neuesten Versionen von DeepSeek – R1 und V3 – sowie GPT-4o durchgeführt. Wir waren erfreut festzustellen, dass unser Modell mit diesen leistungsstarken Online-LLMs gleichwertig abschneidet.’
Dr. Matrix Fung Man-him, klinischer Assistenzprofessor und Leiter der endokrinen Chirurgie, Abteilung für Chirurgie, School of Clinical Medicine, HKUMed, unterstrich die praktischen Vorteile des Modells und erklärte: ‘Neben der hohen Genauigkeit bei der Extraktion und Analyse von Informationen aus komplexen Pathologieberichten, Operationsberichten und klinischen Notizen reduziert unser KI-Modell auch die Vorbereitungszeit der Ärzte im Vergleich zur menschlichen Interpretation um fast die Hälfte. Es kann gleichzeitig Krebsstadien und klinische Risikostratifizierungen basierend auf zwei international anerkannten klinischen Systemen liefern.’
Dr. Fung betonte auch die Vielseitigkeit des Modells und sein Potenzial für eine breite Akzeptanz und erklärte: ‘Das KI-Modell ist vielseitig und kann problemlos in verschiedene Umgebungen im öffentlichen und privaten Sektor sowie in lokalen und internationalen Gesundheits- und Forschungseinrichtungen integriert werden. Wir sind optimistisch, dass die reale Implementierung dieses KI-Modells die Effizienz von Klinikern in der ersten Reihe verbessern und die Qualität der Versorgung verbessern kann. Darüber hinaus werden die Ärzte mehr Zeit haben, ihre Patienten zu beraten.’
Dr. Carlos Wong, Honorarprofessor in der Abteilung für Allgemeinmedizin und Primärversorgung, School of Clinical Medicine, HKUMed, hob die Bedeutung der Validierung des Modells mit realen Patientendaten hervor und erklärte: ‘Im Einklang mit der starken Befürwortung der Regierung für die Einführung von KI im Gesundheitswesen, wie sie durch die kürzliche Einführung des LLM-basierten medizinischen Berichtsschreibsystems in der Hospital Authority veranschaulicht wird, besteht unser nächster Schritt darin, die Leistung dieses KI-Assistenten mit einer großen Menge realer Patientendaten zu bewerten.’
Dr. Wong betonte auch das Potenzial des Modells, in klinischen Umgebungen und Krankenhäusern eingesetzt zu werden, und erklärte: ‘Sobald es validiert ist, kann das KI-Modell problemlos in realen klinischen Umgebungen und Krankenhäusern eingesetzt werden, um Klinikern zu helfen, die Betriebs- und Behandlungseffizienz zu verbessern.’
Auswirkungen auf die klinische Praxis
Die Entwicklung dieses KI-Modells hat tiefgreifende Auswirkungen auf die klinische Praxis im Bereich der Schilddrüsenkrebsdiagnose und -behandlung. Durch die Automatisierung des Prozesses der Krebsstadieneinteilung und Risikoklassifizierung kann das Modell Klinikern ermöglichen, sich auf andere kritische Aspekte der Patientenversorgung zu konzentrieren, wie z. B. Behandlungsplanung und Patientenberatung.
Darüber hinaus kann die hohe Genauigkeit und Zuverlässigkeit des Modells dazu beitragen, das Risiko von Fehlern und Inkonsistenzen im Diagnoseprozess zu verringern. Dies kann zu fundierteren Behandlungsentscheidungen und verbesserten Patientenergebnissen führen.
Das KI-Modell hat auch das Potenzial, den Zugang zu einer qualitativ hochwertigen Versorgung für Patienten in unterversorgten Gebieten zu verbessern. Indem es Klinikern ermöglicht, Schilddrüsenkrebs effizienter zu diagnostizieren und zu behandeln, kann das Modell dazu beitragen, Ungleichheiten beim Zugang zur Gesundheitsversorgung und bei den Ergebnissen zu verringern.
Zukünftige Ausrichtungen
Das Forschungsteam plant, das KI-Modell weiter zu verfeinern und zu verbessern, wobei der Schwerpunkt auf der Erweiterung seiner Fähigkeiten und der Verbesserung seiner Genauigkeit liegt. Zukünftige Forschungen werden auch das Potenzial des Modells untersuchen, in anderen Bereichen der Krebsdiagnose und -behandlung eingesetzt zu werden.
Darüber hinaus plant das Team, weitere Studien durchzuführen, um die Auswirkungen des KI-Modells auf die klinische Praxis und die Patientenergebnisse zu bewerten. Diese Studien werden dazu beitragen, die besten Möglichkeiten zur Integration des Modells in klinische Arbeitsabläufe zu ermitteln und sicherzustellen, dass es effektiv eingesetzt wird, um die Patientenversorgung zu verbessern.
Die Entwicklung dieses KI-Modells stellt einen bedeutenden Fortschritt im Kampf gegen Schilddrüsenkrebs dar. Durch die Nutzung der Leistungsfähigkeit der künstlichen Intelligenz arbeiten Forscher und Kliniker daran, die Genauigkeit, Effizienz und Zugänglichkeit der Krebsdiagnose und -behandlung zu verbessern, was letztendlich zu besseren Ergebnissen für die Patienten führt.
Detaillierte Untersuchung der Komponenten und Funktionen des KI-Modells
Die Architektur des KI-Modells ist eine hochentwickelte Mischung aus mehreren Spitzentechnologien, die entwickelt wurden, um die kognitiven Prozesse nachzubilden und zu verbessern, die an der medizinischen Diagnose beteiligt sind. Im Kern stützt sich das Modell auf Large Language Models (LLMs), eine Art künstliche Intelligenz, die bemerkenswerte Fähigkeiten im Verständnis, der Interpretation und der Generierung menschlicher Sprache bewiesen hat. Diese LLMs, wie Mistral, Llama, Gemma und Qwen, dienen als grundlegende Bausteine für die analytischen Fähigkeiten der KI.
Rolle von Large Language Models (LLMs)
LLMs werden mit riesigen Datensätzen aus Text und Code trainiert, wodurch sie Muster, Beziehungen und Nuancen innerhalb der Daten erkennen können. Im Kontext dieses KI-Modells werden die LLMs mit der Analyse klinischer Dokumente beauftragt, darunter Pathologieberichte, Operationsberichte und andere medizinische Aufzeichnungen. Diese Dokumente enthalten oft komplexe und technische Sprache, die ein hohes Maß an Verständnis erfordert, um relevante Informationen zu extrahieren.
Die LLMs verarbeiten den Text, indem sie ihn in kleinere Einheiten wie Wörter und Phrasen zerlegen und dann die Beziehungen zwischen diesen Einheiten analysieren. Dieser Prozess beinhaltet die Identifizierung wichtiger Entitäten wie Tumorgröße, Lymphknotenbeteiligung und Fernmetastasen, die für die Bestimmung des Stadiums und der Risikokategorie des Krebses entscheidend sind.
Offline-Open-Source-LLMs: Mistral, Llama, Gemma und Qwen
Das KI-Modell verwendet vier Offline-Open-Source-LLMs: Mistral (Mistral AI), Llama (Meta), Gemma (Google) und Qwen (Alibaba). Die Verwendung mehrerer LLMs ist eine strategische Entscheidung, die darauf abzielt, die Robustheit und Genauigkeit des Modells zu verbessern. Jedes LLM hat seine eigenen Stärken und Schwächen, und durch die Kombination ihrer Ausgaben kann das Modell die kollektive Intelligenz dieser Systeme nutzen.
- Mistral: Bekannt für seine Effizienz und Fähigkeit, bei einer Vielzahl von Aufgaben gute Leistungen zu erbringen.
- Llama: Entwickelt für Forschungszwecke und bietet eine starke Grundlage für das Sprachverständnis.
- Gemma: Das Angebot von Google, bekannt für seine Integration mit anderen Google-Diensten und seine starke Leistung bei der Beantwortung von Fragen.
- Qwen: Entwickelt von Alibaba und zeichnet sich durch die Bearbeitung komplexer chinesischer Sprachaufgaben aus.
Die Integration dieser verschiedenen LLMs ermöglicht es dem KI-Modell, von einer breiten Palette von Perspektiven und Ansätzen zu profitieren, was letztendlich zu genaueren und zuverlässigeren Ergebnissen führt.
Trainingsdatensatz: Cancer Genome Atlas Program (TCGA)
Der Trainingsdatensatz des KI-Modells stammt aus dem Cancer Genome Atlas Program (TCGA), einer umfassenden öffentlichen Ressource, die genomische, klinische und pathologische Daten für Tausende von Krebspatienten enthält. Der TCGA-Datensatz bietet eine Fülle von Informationen, die für das Training des KI-Modells unerlässlich sind, um Muster und Beziehungen innerhalb der Daten zu erkennen.
Der Trainingsdatensatz enthält Pathologieberichte von 50 Schilddrüsenkrebspatienten. Diese Berichte enthalten detaillierte Informationen über die Eigenschaften des Tumors, einschließlich seiner Größe, Form und Lage, sowie Informationen über das Vorhandensein von metastasierenden Erkrankungen. Das KI-Modell lernt, diese Eigenschaften zu identifizieren und sie zur Klassifizierung des Krebsstadiums und der Risikokategorie zu verwenden.
Validierungsprozess: Gewährleistung von Genauigkeit und Zuverlässigkeit
Die Leistung des KI-Modells wird rigoros anhand von Pathologieberichten von 289 TCGA-Patienten und 35 von erfahrenen endokrinen Chirurgen erstellten Pseudo-Fällen validiert. Der Validierungsprozess soll sicherstellen, dass das Modell über eine Vielzahl von klinischen Szenarien hinweg genau und zuverlässig ist.
Der Validierungsprozess beinhaltet den Vergleich der Klassifizierungen des KI-Modells mit den Klassifizierungen von menschlichen Experten. Die Genauigkeit des KI-Modells wird gemessen, indem der Prozentsatz der Fälle berechnet wird, in denen die Klassifizierungen des KI-Modells mit den Klassifizierungen der menschlichen Experten übereinstimmen.
Erzielung hoher Genauigkeit bei der ATA-Risikoklassifizierung und der AJCC-Krebsstadieneinteilung
Das KI-Modell erreicht eine beeindruckende Gesamtgenauigkeit von 88,5 % bis 100 % in der ATA-Risikoklassifizierung und 92,9 % bis 98,1 % in der AJCC-Krebsstadieneinteilung. Diese hohen Genauigkeitsraten zeigen das Potenzial von KI, die klinische Praxis zu verändern und die Patientenergebnisse zu verbessern. Die Fähigkeit des Modells, Krebsstadien und Risikokategorien genau zu klassifizieren, kann Klinikern helfen, fundiertere Behandlungsentscheidungen zu treffen, was zu besseren Ergebnissen für die Patienten führt.
Offline-Funktion: Gewährleistung des Patientendatenschutzes
Einer der bedeutendsten Vorteile dieses KI-Modells ist seine Offline-Funktion. Dies bedeutet, dass das Modell lokal bereitgestellt werden kann, ohne dass sensible Patientendaten weitergegeben oder hochgeladen werden müssen. Dies ist entscheidend für den Schutz der Privatsphäre der Patienten und die Gewährleistung der Einhaltung von Datensicherheitsbestimmungen.
Die Offline-Funktion macht das KI-Modell auch für Krankenhäuser und Kliniken in ressourcenbeschränkten Umgebungen zugänglicher. Diese Einrichtungen verfügen möglicherweise nicht über die Bandbreite oder Infrastruktur, um Online-KI-Modelle zu unterstützen, aber sie können dennoch von den Fähigkeiten des KI-Modells profitieren, indem sie es lokal bereitstellen.
Vergleich mit Online-LLMs: DeepSeek und GPT-4o
Das Forschungsteam führte vergleichende Tests mit den neuesten Versionen von DeepSeek und GPT-4o durch, zwei leistungsstarken Online-LLMs. Die Ergebnisse dieser Tests zeigten, dass das KI-Modell mit diesen Online-LLMs gleichwertig abschneidet, was seine Fähigkeit demonstriert, mit den besten KI-Systemen der Welt zu konkurrieren.
Die Tatsache, dass das KI-Modell ohne Internetverbindung mit Online-LLMs gleichwertig abschneiden kann, ist ein erheblicher Vorteil. Dies macht das KI-Modell zuverlässiger und sicherer, da es nicht von externen Servern oder Netzwerken abhängig ist.
Die transformative Auswirkung auf die Effizienz des Gesundheitswesens und die Patientenversorgung
Die Integration dieses KI-Modells in klinische Arbeitsabläufe verspricht eine signifikante Transformation der Effizienz des Gesundheitswesens und der Patientenversorgung. Die Fähigkeit des Modells, den Prozess der Krebsstadieneinteilung und Risikoklassifizierung zu automatisieren, kann Klinikern ermöglichen, sich auf andere kritische Aspekte der Patientenversorgung zu konzentrieren, wie z. B. Behandlungsplanung und Patientenberatung.
Das KI-Modell kann auch dazu beitragen, das Risiko von Fehlern und Inkonsistenzen im Diagnoseprozess zu verringern, was zu fundierteren Behandlungsentscheidungen und verbesserten Patientenergebnissen führt. Darüber hinaus kann das Modell den Zugang zu einer qualitativ hochwertigen Versorgung für Patienten in unterversorgten Gebieten verbessern, indem es Klinikern ermöglicht, Schilddrüsenkrebs effizienter zu diagnostizieren und zu behandeln.
Ethische Überlegungen und Gewährleistung einer verantwortungsvollen KI-Implementierung
Wie bei jeder KI-Technologie ist es unerlässlich, ethische Überlegungen zu berücksichtigen und eine verantwortungsvolle KI-Implementierung zu gewährleisten. Das Forschungsteam setzt sich dafür ein, das KI-Modell auf eine Weise zu entwickeln und bereitzustellen, die ethisch, transparent und rechenschaftspflichtig ist.
Eine wichtige ethische Überlegung ist die Gewährleistung, dass das KI-Modell nicht gegenüber einer bestimmten Patientengruppe voreingenommen ist. Das Forschungsteam arbeitet daran, dieses Problem zu beheben, indem es vielfältige Trainingsdaten verwendet und die Leistung des Modells in verschiedenen Patientenpopulationen sorgfältig überwacht.
Eine weitere ethische Überlegung ist die Gewährleistung, dass die Patienten über die Verwendung von KI in ihrer Versorgung informiert werden. Das Forschungsteam setzt sich dafür ein, Patienten klare und prägnante Informationen darüber zu geben, wie das KI-Modell verwendet wird und wie es sich auf ihre Versorgung auswirken kann.
Das Forschungsteam arbeitet auch daran sicherzustellen, dass das KI-Modell in einer Weise verwendet wird, die mit den Prinzipien der medizinischen Ethik übereinstimmt, wie z. B. Wohltätigkeit, Nichtschädigung, Autonomie und Gerechtigkeit. Durch die Einhaltung dieser Prinzipien kann das Forschungsteam dazu beitragen, dass das KI-Modell zur Verbesserung der Patientenversorgung und zur Förderung der gesundheitlichen Chancengleichheit eingesetzt wird.