AI Modelinin Doğuşu
Bu öncü yapay zeka modelinin geliştirilmesi, Hong Kong Üniversitesi Tıp Fakültesi (HKUMed), Sağlık için Veri Keşfi InnoHK Laboratuvarı (InnoHK D24H) ve Londra Hijyen ve Tropikal Tıp Okulu’ndan (LSHTM) uzmanların katılımıyla disiplinler arası bir araştırma ekibinin ortak çabalarının bir sonucudur. npj Digital Medicine dergisinde yayınlanan bulgular, yapay zekanın klinik uygulamaları dönüştürme ve hasta sonuçlarını iyileştirme potansiyelini vurgulamaktadır.
Hong Kong ve dünya genelinde yaygın bir malignite olan tiroid kanseri, hassas yönetim stratejileri gerektirmektedir. Bu stratejilerin başarısı, iki kritik sisteme bağlıdır:
- American Joint Committee on Cancer (AJCC) veya Tümör-Nod-Metastaz (TNM) kanser evreleme sistemi: Bu sistem, şu anda 8. baskısında olup, kanserin yaygınlığını ve yayılmasını belirlemek için kullanılır.
- American Thyroid Association (ATA) risk sınıflandırma sistemi: Bu sistem, kanserin tekrarlama veya ilerleme riskini kategorize eder.
Bu sistemler, hasta hayatta kalma oranlarını tahmin etmek ve tedavi kararlarını bilgilendirmek için vazgeçilmezdir. Bununla birlikte, karmaşık klinik bilgileri bu sistemlere manuel olarak entegre etme geleneksel yöntemi genellikle zaman alıcıdır ve verimsizliklere eğilimlidir.
AI Asistanı Nasıl Çalışır?
Bu zorlukların üstesinden gelmek için araştırma ekibi, ChatGPT ve DeepSeek’te kullanılanlara benzer büyük dil modellerini (LLM’ler) kullanan bir AI asistanı tasarladı. Bu LLM’ler, insan dilini anlamak ve işlemek üzere tasarlanmıştır, bu da klinik belgeleri analiz etmelerini ve tiroid kanseri evrelemesi ve risk sınıflandırmasının doğruluğunu ve verimliliğini artırmalarını sağlar.
AI modeli, serbest metin klinik belgelerini analiz etmek için dört çevrimdışı açık kaynaklı LLM kullanır - Mistral (Mistral AI), Llama (Meta), Gemma (Google) ve Qwen (Alibaba). Bu yaklaşım, modelin patoloji raporları, cerrahi notları ve diğer ilgili tıbbi kayıtlar dahil olmak üzere çok çeşitli klinik bilgileri işleyebilmesini sağlar.
AI Modelinin Eğitimi ve Doğrulanması
AI modeli, Kanser Genom Atlası Programı’ndan (TCGA) alınan 50 tiroid kanseri hastasının patoloji raporlarını içeren ABD merkezli açık erişimli bir veri kümesi kullanılarak titizlikle eğitildi. Eğitim aşamasının ardından, modelin performansı 289 TCGA hastasından ve deneyimli endokrin cerrahları tarafından oluşturulan 35 sahte vakadan alınan patoloji raporlarına karşı titizlikle doğrulandı. Bu kapsamlı doğrulama süreci, modelin çeşitli klinik senaryolarda sağlam ve güvenilir olmasını sağladı.
Performans ve Doğruluk
Dört LLM’in çıktısını birleştirerek, araştırma ekibi AI modelinin genel performansını önemli ölçüde iyileştirdi. Model, ATA risk sınıflandırmasında %88,5 ila %100 ve AJCC kanser evrelemesinde %92,9 ila %98,1 gibi etkileyici bir genel doğruluk elde etti. Bu doğruluk seviyesi, genellikle insan hatasına ve tutarsızlıklara tabi olan geleneksel manuel belge incelemelerini aşmaktadır.
Bu AI modelinin en önemli faydalarından biri, klinisyenlerin konsültasyon öncesi hazırlığa harcadığı süreyi yaklaşık %50 oranında azaltma yeteneğidir. Bu zaman tasarrufu, klinisyenlerin doğrudan hasta bakımına daha fazla zaman ayırmasına olanak tanır, bu da genel hasta deneyimini iyileştirir ve bakım kalitesini artırır.
Araştırma Ekibinden Önemli Bilgiler
HKUMed’de Halk Sağlığı Sir Kotewall Profesörü ve InnoHK D24H Genel Müdürü Profesör Joseph T Wu, modelin olağanüstü performansını vurgulayarak şunları söyledi: ‘Modelimiz AJCC kanser evrelerini ve ATA risk kategorisini sınıflandırmada %90’ın üzerinde doğruluk elde ediyor. Bu modelin önemli bir avantajı, hassas hasta bilgilerini paylaşmaya veya yüklemeye gerek kalmadan yerel dağıtıma olanak tanıyan ve böylece maksimum hasta gizliliği sağlayan çevrimdışı yeteneğidir.’
Profesör Wu ayrıca modelin DeepSeek ve GPT-4o gibi güçlü çevrimiçi LLM’lere eşdeğer performans gösterme yeteneğini vurgulayarak, ‘DeepSeek’in son çıkışını göz önünde bulundurarak, DeepSeek—R1 ve V3’ün en son sürümlerine ve GPT-4o’ya karşı bir ‘sıfır atış yaklaşımı’ ile daha ileri karşılaştırmalı testler yaptık. Modelimizin bu güçlü çevrimiçi LLM’lere eşdeğer performans gösterdiğini görmekten memnun olduk.’
HKUMed Klinik Tıp Fakültesi Cerrahi Bölümü’nde klinik asistan profesörü ve endokrin cerrahisi şefi Dr. Matrix Fung Man-him, modelin pratik faydalarının altını çizerek şunları söyledi: ‘Karmaşık patoloji raporlarından, operasyon kayıtlarından ve klinik notlarından bilgi çıkarma ve analiz etmede yüksek doğruluk sağlamanın yanı sıra, AI modelimiz doktorların hazırlık süresini insan yorumuna kıyasla neredeyse yarı yarıya azaltıyor. Aynı anda iki uluslararası kabul görmüş klinik sisteme göre kanser evrelemesi ve klinik risk sınıflandırması sağlayabilir.’
Dr. Fung ayrıca modelin çok yönlülüğünü ve yaygın olarak benimsenme potansiyelini vurgulayarak, ‘AI modeli çok yönlüdür ve kamu ve özel sektörlerdeki çeşitli ortamlara ve hem yerel hem de uluslararası sağlık hizmetleri ve araştırma enstitülerine kolayca entegre edilebilir. Bu AI modelinin gerçek dünyada uygulanmasının ön cephe klinisyenlerinin verimliliğini artırabileceğine ve bakım kalitesini artırabileceğine dair iyimseriz. Ek olarak, doktorların hastalarıyla görüşmek için daha fazla zamanı olacak.’
HKUMed Klinik Tıp Fakültesi Aile Hekimliği ve Temel Bakım Bölümü’nde Fahri Doçent Dr. Carlos Wong, modelin gerçek dünya hasta verileriyle doğrulanmasının önemini vurgulayarak şunları söyledi: ‘Hükümetin, Hastane Otoritesi’nde LLM tabanlı tıbbi rapor yazma sisteminin yakın zamanda başlatılmasıyla örneklendiği gibi, sağlık hizmetlerinde yapay zeka benimsenmesini güçlü bir şekilde savunmasıyla uyumlu olarak, bir sonraki adımımız bu AI asistanının performansını büyük miktarda gerçek dünya hasta verisiyle değerlendirmektir.’
Dr. Wong ayrıca modelin klinik ortamlarda ve hastanelerde konuşlandırılma potansiyelini vurgulayarak, ‘Doğrulandıktan sonra, AI modeli klinisyenlerin operasyonel ve tedavi verimliliğini artırmalarına yardımcı olmak için gerçek klinik ortamlarda ve hastanelerde kolayca konuşlandırılabilir.’
Klinik Uygulamalar için Etkileri
Bu AI modelinin geliştirilmesi, tiroid kanseri teşhisi ve yönetim alanındaki klinik uygulamalar için derin etkilere sahiptir. Model, kanser evrelemesi ve risk sınıflandırması sürecini otomatikleştirerek, klinisyenlerin tedavi planlaması ve hasta danışmanlığı gibi hasta bakımının diğer kritik yönlerine odaklanmalarını sağlayabilir.
Ayrıca, modelin yüksek doğruluğu ve güvenilirliği, tanı sürecindeki hata ve tutarsızlık riskini azaltmaya yardımcı olabilir. Bu, daha bilinçli tedavi kararlarına ve iyileştirilmiş hasta sonuçlarına yol açabilir.
AI modeli ayrıca yetersiz hizmet alan bölgelerdeki hastalar için kaliteli bakıma erişimi iyileştirme potansiyeline de sahiptir. Klinisyenlerin tiroid kanserini daha verimli bir şekilde teşhis etmelerini ve yönetmelerini sağlayarak, model sağlık hizmetlerine erişim ve sonuçlardaki eşitsizlikleri azaltmaya yardımcı olabilir.
Gelecek Yönler
Araştırma ekibi, AI modelinin yeteneklerini genişletmeye ve doğruluğunu artırmaya odaklanarak, AI modelini iyileştirmeye ve geliştirmeye devam etmeyi planlıyor. Gelecekteki araştırmalar ayrıca modelin kanser teşhisi ve yönetiminin diğer alanlarında kullanılma potansiyelini de araştıracaktır.
Ek olarak, ekip AI modelinin klinik uygulama ve hasta sonuçları üzerindeki etkisini değerlendirmek için daha fazla çalışma yapmayı planlıyor. Bu çalışmalar, modelin klinik iş akışlarına entegre edilmesinin en iyi yollarını belirlemeye ve hasta bakımını iyileştirmek için etkili bir şekilde kullanılmasını sağlamaya yardımcı olacaktır.
Bu AI modelinin geliştirilmesi, tiroid kanseriyle mücadelede önemli bir adımı temsil etmektedir. Araştırmacılar ve klinisyenler, yapay zekanın gücünden yararlanarak, kanser teşhisi ve yönetiminin doğruluğunu, verimliliğini ve erişilebilirliğini iyileştirmek için çalışıyor ve sonuçta hastalar için daha iyi sonuçlara yol açıyor.
AI Modelinin Bileşenlerinin ve İşlevselliğinin Ayrıntılı İncelenmesi
AI modelinin mimarisi, tıbbi teşhise dahil olan bilişsel süreçleri taklit etmek ve geliştirmek için tasarlanmış çeşitli son teknoloji teknolojilerin sofistike bir karışımıdır. Özünde, model, insan dilini anlama, yorumlama ve üretmede dikkate değer bir yeterlilik göstermiş olan bir yapay zeka türü olan Büyük Dil Modellerine (LLM’ler) dayanır. Mistral, Llama, Gemma ve Qwen gibi bu LLM’ler, AI’nın analitik yetenekleri için temel yapı taşları olarak hizmet eder.
Büyük Dil Modellerinin (LLM’ler) Rolü
LLM’ler, verilerdeki kalıpları, ilişkileri ve nüansları ayırt etmelerini sağlayan büyük metin ve kod veri kümelerinde eğitilir. Bu AI modelinin bağlamında, LLM’lere patoloji raporları, cerrahi notları ve diğer tıbbi kayıtlar dahil olmak üzere klinik belgeleri analiz etme görevi verilir. Bu belgeler genellikle ilgili bilgileri çıkarmak için yüksek düzeyde bir anlayış gerektiren karmaşık ve teknik bir dil içerir.
LLM’ler, metni kelimeler ve ifadeler gibi daha küçük birimlere ayırarak ve ardından bu birimler arasındaki ilişkileri analiz ederek işler. Bu süreç, tümör boyutu, lenf nodu tutulumu ve uzak metastaz gibi kanserin evresini ve risk kategorisini belirlemek için çok önemli olan temel varlıkların belirlenmesini içerir.
Çevrimdışı Açık Kaynaklı LLM’ler: Mistral, Llama, Gemma ve Qwen
AI modeli dört çevrimdışı açık kaynaklı LLM kullanır: Mistral (Mistral AI), Llama (Meta), Gemma (Google) ve Qwen (Alibaba). Birden fazla LLM’nin kullanımı, modelin sağlamlığını ve doğruluğunu artırmayı amaçlayan stratejik bir karardır. Her LLM’nin kendine özgü güçlü ve zayıf yönleri vardır ve çıktılarını birleştirerek, model bu sistemlerin kolektif zekasından yararlanabilir.
- Mistral: Verimliliği ve çeşitli görevlerde iyi performans gösterme yeteneği ile bilinir.
- Llama: Dil anlayışı için güçlü bir temel sağlayan araştırma amaçlı tasarlanmıştır.
- Gemma: Google’ın teklifi, diğer Google hizmetleriyle entegrasyonu ve soru cevaplamada güçlü performansı ile bilinir.
- Qwen: Alibaba tarafından geliştirilen, karmaşık Çince dil görevlerini işlemede mükemmeldir.
Bu çeşitli LLM’lerin entegrasyonu, AI modelinin çok çeşitli bakış açılarından ve yaklaşımlardan yararlanmasını sağlayarak sonuçta daha doğru ve güvenilir sonuçlara yol açar.
Eğitim Veri Kümesi: Kanser Genom Atlası Programı (TCGA)
AI modelinin eğitim veri kümesi, binlerce kanser hastası için genomik, klinik ve patolojik veriler içeren kapsamlı bir kamu kaynağı olan Kanser Genom Atlası Programı’ndan (TCGA) elde edilir. TCGA veri kümesi, AI modelini verilerdeki kalıpları ve ilişkileri tanımak için eğitmek için gerekli olan zengin bir bilgi sağlar.
Eğitim veri kümesi, 50 tiroid kanseri hastasından alınan patoloji raporlarını içerir. Bu raporlar, tümörün boyutu, şekli ve yeri dahil olmak üzere özellikleri hakkında ayrıntılı bilgilerin yanı sıra herhangi bir metastatik hastalığın varlığı hakkında bilgi içerir. AI modeli, bu özellikleri tanımlamayı ve bunları kanser evresini ve risk kategorisini sınıflandırmak için kullanmayı öğrenir.
Doğrulama Süreci: Doğruluğu ve Güvenilirliği Sağlama
AI modelinin performansı, 289 TCGA hastasından ve deneyimli endokrin cerrahları tarafından oluşturulan 35 sahte vakadan alınan patoloji raporları kullanılarak titizlikle doğrulanır. Doğrulama süreci, modelin çeşitli klinik senaryolarda doğru ve güvenilir olmasını sağlamak için tasarlanmıştır.
Doğrulama süreci, AI modelinin sınıflandırmalarını insan uzmanlar tarafından yapılan sınıflandırmalarla karşılaştırmayı içerir. AI modelinin doğruluğu, AI modelinin sınıflandırmalarının insan uzmanlar tarafından yapılan sınıflandırmalarla eşleştiği vakaların yüzdesini hesaplayarak ölçülür.
ATA Risk Sınıflandırmasında ve AJCC Kanser Evrelemesinde Yüksek Doğruluk Elde Etme
AI modeli, ATA risk sınıflandırmasında %88,5 ila %100 ve AJCC kanser evrelemesinde %92,9 ila %98,1 gibi etkileyici bir genel doğruluk elde eder. Bu yüksek doğruluk oranları, yapay zekanın klinik uygulamaları dönüştürme ve hasta sonuçlarını iyileştirme potansiyelini göstermektedir. Modelin kanser evrelerini ve risk kategorilerini doğru bir şekilde sınıflandırma yeteneği, klinisyenlerin daha bilinçli tedavi kararları almalarına yardımcı olabilir ve bu da hastalar için daha iyi sonuçlara yol açar.
Çevrimdışı Yetenek: Hasta Gizliliğini Sağlama
Bu AI modelinin en önemli avantajlarından biri çevrimdışı yeteneğidir. Bu, modelin hassas hasta bilgilerini paylaşmaya veya yüklemeye gerek kalmadan yerel olarak dağıtılabileceği anlamına gelir. Bu, hasta gizliliğini korumak ve veri güvenliği düzenlemelerine uyumu sağlamak için çok önemlidir.
Çevrimdışı yetenek, AI modelini kaynakları kısıtlı ortamlardaki hastaneler ve klinikler için daha erişilebilir hale getirir. Bu tesisler, çevrimiçi AI modellerini destekleyecek bant genişliğine veya altyapıya sahip olmayabilir, ancak AI modelinin yeteneklerinden yerel olarak dağıtarak hala yararlanabilirler.
Çevrimiçi LLM’lerle Karşılaştırma: DeepSeek ve GPT-4o
Araştırma ekibi, iki güçlü çevrimiçi LLM olan DeepSeek ve GPT-4o’nun en son sürümleriyle karşılaştırmalı testler yaptı. Bu testlerin sonuçları, AI modelinin bu çevrimiçi LLM’lere eşdeğer performans gösterdiğini ve dünyanın en iyi AI sistemleriyle rekabet edebileceğini gösterdi.
AI modelinin internet bağlantısı gerektirmeden çevrimiçi LLM’lere eşdeğer performans gösterebilmesi önemli bir avantajdır. Bu, AI modelini harici sunuculara veya ağlara bağlı olmadığından daha güvenilir ve güvenli hale getirir.
Sağlık Hizmetleri Verimliliği ve Hasta Bakımı Üzerindeki Dönüştürücü Etki
Bu AI modelinin klinik iş akışlarına entegrasyonu, sağlık hizmetleri verimliliği ve hasta bakımında önemli bir dönüşüm vaat ediyor. Modelin kanser evrelemesi ve risk sınıflandırması sürecini otomatikleştirme yeteneği, klinisyenlerin tedavi planlaması ve hasta danışmanlığı gibi hasta bakımının diğer kritik yönlerine odaklanmalarını sağlayabilir.
AI modeli ayrıca, tanı sürecindeki hata ve tutarsızlık riskini azaltmaya yardımcı olarak daha bilinçli tedavi kararlarına ve iyileştirilmiş hasta sonuçlarına yol açabilir. Dahası, model, klinisyenlerin tiroid kanserini daha verimli bir şekilde teşhis etmelerini ve yönetmelerini sağlayarak yetersiz hizmet alan bölgelerdeki hastalar için kaliteli bakıma erişimi iyileştirebilir.
Etik Hususları Ele Alma ve Sorumlu AI Uygulamasını Sağlama
Herhangi bir AI teknolojisinde olduğu gibi, etik hususları ele almak ve sorumlu AI uygulamasını sağlamak esastır. Araştırma ekibi, AI modelini etik, şeffaf ve hesap verebilir bir şekilde geliştirmeye ve dağıtmaya kararlıdır.
Temel bir etik husus, AI modelinin herhangi bir hasta grubuna karşı önyargılı olmamasını sağlamaktır. Araştırma ekibi, çeşitli eğitim verileri kullanarak ve modelin farklı hasta popülasyonlarındaki performansını dikkatle izleyerek bu sorunu ele almaya çalışmaktadır.
Diğer bir etik husus, hastaların bakımlarında AI kullanımından haberdar edilmesini sağlamaktır. Araştırma ekibi, hastalara AI modelinin nasıl kullanıldığı ve bakımlarını nasıl etkileyebileceği hakkında net ve öz bilgiler sağlamaya kararlıdır.
Araştırma ekibi ayrıca, AI modelinin tıbbi etik ilkeleriyle tutarlı bir şekilde kullanılmasını sağlamaya çalışmaktadır; örneğin fayda, zarar vermeme, özerklik ve adalet. Araştırma ekibi bu ilkelere uyarak, AI modelinin hasta bakımını iyileştirmek ve sağlıkta eşitliği teşvik etmek için kullanılmasına yardımcı olabilir.