AI Revolusi Diagnosis Kanker Tiroid, Akurasi 90%

Revolusi AI dalam Diagnosis Kanker Tiroid dengan Akurasi Lebih dari 90%

Sebuah kemajuan revolusioner dalam teknologi medis telah muncul dengan diciptakannya model kecerdasan buatan (AI) pertama di dunia yang mampu mengklasifikasikan baik stadium maupun kategori risiko kanker tiroid dengan akurasi luar biasa melebihi 90%. Alat inovatif ini menjanjikan pengurangan signifikan dalam waktu persiapan pra-konsultasi untuk klinisi garis depan sekitar 50%, menandai lompatan besar ke depan dalam efisiensi dan ketepatan diagnosis dan penanganan kanker.

Asal Mula Model AI

Pengembangan model AI perintis ini adalah hasil dari upaya kolaborasi dari tim riset interdisipliner yang terdiri dari para ahli dari Fakultas Kedokteran LKS Universitas Hong Kong (HKUMed), Laboratorium InnoHK untuk Penemuan Data untuk Kesehatan (InnoHK D24H), dan London School of Hygiene & Tropical Medicine (LSHTM). Temuan mereka, yang diterbitkan dalam jurnal terkemuka npj Digital Medicine, menyoroti potensi AI untuk mengubah praktik klinis dan meningkatkan hasil pasien.

Kanker tiroid, keganasan yang lazim baik di Hong Kong maupun di seluruh dunia, membutuhkan strategi pengelolaan yang tepat. Keberhasilan strategi ini bergantung pada dua sistem penting:

  • American Joint Committee on Cancer (AJCC) atau sistem penentuan stadium kanker Tumor-Node-Metastasis (TNM): Sistem ini, sekarang dalam edisi ke-8, digunakan untuk menentukan luas dan penyebaran kanker.
  • American Thyroid Association (ATA) sistem klasifikasi risiko: Sistem ini mengkategorikan risiko kekambuhan atau perkembangan kanker.

Sistem ini sangat diperlukan untuk memprediksi tingkat kelangsungan hidup pasien dan menginformasikan keputusan pengobatan. Namun, metode konvensional untuk secara manual mengintegrasikan informasi klinis yang kompleks ke dalam sistem ini seringkali memakan waktu dan rentan terhadap inefisiensi.

Cara Kerja Asisten AI

Untuk mengatasi tantangan ini, tim peneliti merekayasa asisten AI yang memanfaatkan model bahasa besar (LLM), mirip dengan yang digunakan dalam ChatGPT dan DeepSeek. LLM ini dirancang untuk memahami dan memproses bahasa manusia, memungkinkan mereka untuk menganalisis dokumen klinis dan meningkatkan akurasi dan efisiensi penentuan stadium kanker tiroid dan klasifikasi risiko.

Model AI menggunakan empat LLM sumber terbuka offline—Mistral (Mistral AI), Llama (Meta), Gemma (Google), dan Qwen (Alibaba)—untuk menganalisis dokumen klinis teks bebas. Pendekatan ini memastikan bahwa model dapat memproses berbagai informasi klinis, termasuk laporan patologi, catatan bedah, dan catatan medis relevan lainnya.

Pelatihan dan Validasi Model AI

Model AI dilatih dengan cermat menggunakan dataset akses terbuka berbasis di AS yang berisi laporan patologi dari 50 pasien kanker tiroid yang bersumber dari Cancer Genome Atlas Program (TCGA). Setelah fase pelatihan, kinerja model divalidasi secara ketat terhadap laporan patologi dari 289 pasien TCGA dan 35 kasus pseudo yang dibuat oleh ahli bedah endokrin berpengalaman. Proses validasi komprehensif ini memastikan bahwa model tersebut kuat dan andal di berbagai skenario klinis.

Kinerja dan Akurasi

Dengan menggabungkan keluaran dari keempat LLM, tim peneliti secara signifikan meningkatkan kinerja keseluruhan model AI. Model mencapai akurasi keseluruhan yang mengesankan sebesar 88,5% hingga 100% dalam klasifikasi risiko ATA dan 92,9% hingga 98,1% dalam penentuan stadium kanker AJCC. Tingkat akurasi ini melampaui tinjauan dokumen manual tradisional, yang sering kali tunduk pada kesalahan dan inkonsistensi manusia.

Salah satu manfaat paling signifikan dari model AI ini adalah kemampuannya untuk mengurangi waktu yang dihabiskan oleh klinisi untuk persiapan pra-konsultasi sekitar 50%. Penghematan waktu ini memungkinkan klinisi untuk mendedikasikan lebih banyak waktu untuk perawatan pasien langsung, meningkatkan pengalaman pasien secara keseluruhan dan meningkatkan kualitas perawatan.

Wawasan Utama dari Tim Peneliti

Profesor Joseph T Wu, Profesor Sir Kotewall dalam Kesehatan Masyarakat dan Direktur Pelaksana InnoHK D24H di HKUMed, menekankan kinerja model yang luar biasa, menyatakan, ‘Model kami mencapai akurasi lebih dari 90% dalam mengklasifikasikan stadium kanker AJCC dan kategori risiko ATA. Keuntungan signifikan dari model ini adalah kemampuan offline-nya, yang akan memungkinkan penerapan lokal tanpa perlu berbagi atau mengunggah informasi pasien sensitif, sehingga memberikan privasi pasien maksimum.’

Profesor Wu juga menyoroti kemampuan model untuk berkinerja setara dengan LLM online yang kuat seperti DeepSeek dan GPT-4o, mencatat, ‘Mengingat debut DeepSeek baru-baru ini, kami melakukan tes komparatif lebih lanjut dengan ‘pendekatan zero-shot’ terhadap versi terbaru DeepSeek—R1 dan V3—serta GPT-4o. Kami senang menemukan bahwa model kami berkinerja setara dengan LLM online yang kuat ini.’

Dr. Matrix Fung Man-him, profesor asisten klinis dan kepala bedah endokrin, Departemen Bedah, Fakultas Kedokteran Klinis, HKUMed, menggarisbawahi manfaat praktis model, menyatakan, ‘Selain memberikan akurasi tinggi dalam mengekstrak dan menganalisis informasi dari laporan patologi kompleks, catatan operasi dan catatan klinis, model AI kami juga secara dramatis mengurangi waktu persiapan dokter hingga hampir setengahnya dibandingkan dengan interpretasi manusia. Secara simultan dapat memberikan penentuan stadium kanker dan stratifikasi risiko klinis berdasarkan dua sistem klinis yang diakui secara internasional.’

Dr. Fung juga menekankan fleksibilitas model dan potensi untuk adopsi luas, menyatakan, ‘Model AI serbaguna dan dapat dengan mudah diintegrasikan ke berbagai pengaturan di sektor publik dan swasta, dan lembaga perawatan kesehatan dan penelitian lokal dan internasional. Kami optimis bahwa implementasi dunia nyata dari model AI ini dapat meningkatkan efisiensi klinisi garis depan dan meningkatkan kualitas perawatan. Selain itu, dokter akan memiliki lebih banyak waktu untuk berkonsultasi dengan pasien mereka.’

Dr. Carlos Wong, Profesor Rekanan Kehormatan di Departemen Kedokteran Keluarga dan Perawatan Primer, Fakultas Kedokteran Klinis, HKUMed, menyoroti pentingnya memvalidasi model dengan data pasien dunia nyata, menyatakan, ‘Sejalan dengan advokasi kuat pemerintah tentang adopsi AI dalam perawatan kesehatan, sebagaimana dicontohkan oleh peluncuran baru-baru ini dari sistem penulisan laporan medis berbasis LLM di Otoritas Rumah Sakit, langkah kami selanjutnya adalah mengevaluasi kinerja asisten AI ini dengan sejumlah besar data pasien dunia nyata.’

Dr. Wong juga menekankan potensi model untuk diterapkan di lingkungan klinis dan rumah sakit, menyatakan, ‘Setelah divalidasi, model AI dapat dengan mudah diterapkan di lingkungan klinis dan rumah sakit nyata untuk membantu klinisi meningkatkan efisiensi operasional dan pengobatan.’

Implikasi untuk Praktik Klinis

Pengembangan model AI ini memiliki implikasi mendalam untuk praktik klinis di bidang diagnosis dan penanganan kanker tiroid. Dengan mengotomatiskan proses penentuan stadium kanker dan klasifikasi risiko, model dapat membebaskan klinisi untuk fokus pada aspek-aspek penting lainnya dari perawatan pasien, seperti perencanaan pengobatan dan konseling pasien.

Selain itu, akurasi dan keandalan model yang tinggi dapat membantu mengurangi risiko kesalahan dan inkonsistensi dalam prosesdiagnostik. Hal ini dapat mengarah pada keputusan pengobatan yang lebih tepat dan hasil pasien yang lebih baik.

Model AI juga berpotensi untuk meningkatkan akses ke perawatan berkualitas bagi pasien di daerah yang kurang terlayani. Dengan memungkinkan klinisi untuk mendiagnosis dan menangani kanker tiroid dengan lebih efisien, model dapat membantu mengurangi disparitas dalam akses dan hasil perawatan kesehatan.

Arah Masa Depan

Tim peneliti berencana untuk terus menyempurnakan dan meningkatkan model AI, dengan fokus pada perluasan kemampuan dan peningkatan akurasinya. Penelitian di masa depan juga akan mengeksplorasi potensi model untuk digunakan di bidang lain dari diagnosis dan penanganan kanker.

Selain itu, tim berencana untuk melakukan studi lebih lanjut untuk mengevaluasi dampak model AI pada praktik klinis dan hasil pasien. Studi-studi ini akan membantu menentukan cara terbaik untuk mengintegrasikan model ke dalam alur kerja klinis dan untuk memastikan bahwa model tersebut digunakan secara efektif untuk meningkatkan perawatan pasien.

Pengembangan model AI ini merupakan langkah maju yang signifikan dalam perang melawan kanker tiroid. Dengan memanfaatkan kekuatan kecerdasan buatan, para peneliti dan klinisi bekerja untuk meningkatkan akurasi, efisiensi, dan aksesibilitas diagnosis dan penanganan kanker, yang pada akhirnya mengarah pada hasil yang lebih baik bagi pasien.

Pemeriksaan Mendalam tentang Komponen dan Fungsionalitas Model AI

Arsitektur model AI adalah perpaduan canggih dari beberapa teknologi mutakhir, yang dirancang untuk meniru dan meningkatkan proses kognitif yang terlibat dalam diagnosis medis. Inti dari model tersebut bergantung pada Model Bahasa Besar (LLM), sejenis kecerdasan buatan yang telah menunjukkan kemahiran luar biasa dalam memahami, menafsirkan, dan menghasilkan bahasa manusia. LLM ini, seperti Mistral, Llama, Gemma, dan Qwen, berfungsi sebagai blok bangunan dasar untuk kemampuan analitis AI.

Peran Model Bahasa Besar (LLM)

LLM dilatih pada dataset teks dan kode yang besar, memungkinkan mereka untuk membedakan pola, hubungan, dan nuansa dalam data. Dalam konteks model AI ini, LLM ditugaskan untuk menganalisis dokumen klinis, termasuk laporan patologi, catatan bedah, dan catatan medis lainnya. Dokumen-dokumen ini seringkali mengandung bahasa yang kompleks dan teknis, yang membutuhkan tingkat pemahaman yang tinggi untuk mengekstrak informasi yang relevan.

LLM memproses teks dengan memecahnya menjadi unit yang lebih kecil, seperti kata dan frasa, dan kemudian menganalisis hubungan antara unit-unit ini. Proses ini melibatkan identifikasi entitas kunci, seperti ukuran tumor, keterlibatan kelenjar getah bening, dan metastasis jauh, yang sangat penting untuk menentukan stadium dan kategori risiko kanker.

LLM Sumber Terbuka Offline: Mistral, Llama, Gemma, dan Qwen

Model AI menggunakan empat LLM sumber terbuka offline: Mistral (Mistral AI), Llama (Meta), Gemma (Google), dan Qwen (Alibaba). Pemanfaatan beberapa LLM adalah keputusan strategis yang bertujuan untuk meningkatkan ketahanan dan akurasi model. Setiap LLM memiliki kekuatan dan kelemahannya masing-masing, dan dengan menggabungkan keluarannya, model dapat memanfaatkan kecerdasan kolektif dari sistem ini.

  • Mistral: Dikenal karena efisiensinya dan kemampuannya untuk berkinerja baik pada berbagai tugas.
  • Llama: Dirancang untuk tujuan penelitian, memberikan dasar yang kuat untuk pemahaman bahasa.
  • Gemma: Penawaran Google, dikenal karena integrasinya dengan layanan Google lainnya dan kinerjanya yang kuat dalam menjawab pertanyaan.
  • Qwen: Dikembangkan oleh Alibaba, unggul dalam menangani tugas bahasa Mandarin yang kompleks.

Integrasi LLM yang beragam ini memungkinkan model AI untuk mendapatkan manfaat dari berbagai perspektif dan pendekatan, yang pada akhirnya mengarah pada hasil yang lebih akurat dan andal.

Dataset Pelatihan: Cancer Genome Atlas Program (TCGA)

Dataset pelatihan model AI berasal dari Cancer Genome Atlas Program (TCGA), sumber daya publik komprehensif yang berisi data genomik, klinis, dan patologis untuk ribuan pasien kanker. Dataset TCGA menyediakan banyak informasi yang penting untuk melatih model AI untuk mengenali pola dan hubungan dalam data.

Dataset pelatihan mencakup laporan patologi dari 50 pasien kanker tiroid. Laporan ini berisi informasi rinci tentang karakteristik tumor, termasuk ukuran, bentuk, dan lokasinya, serta informasi tentang keberadaan penyakit metastatik. Model AI belajar untuk mengidentifikasi karakteristik ini dan menggunakannya untuk mengklasifikasikan stadium dan kategori risiko kanker.

Proses Validasi: Memastikan Akurasi dan Keandalan

Kinerja model AI divalidasi secara ketat menggunakan laporan patologi dari 289 pasien TCGA dan 35 kasus pseudo yang dibuat oleh ahli bedah endokrin berpengalaman. Proses validasi dirancang untuk memastikan bahwa model tersebut akurat dan andal di berbagai skenario klinis.

Proses validasi melibatkan perbandingan klasifikasi model AI dengan klasifikasi yang dibuat oleh para ahli manusia. Akurasi model AI diukur dengan menghitung persentase kasus di mana klasifikasi model AI sesuai dengan klasifikasi yang dibuat oleh para ahli manusia.

Mencapai Akurasi Tinggi dalam Klasifikasi Risiko ATA dan Penentuan Stadium Kanker AJCC

Model AI mencapai akurasi keseluruhan yang mengesankan sebesar 88,5% hingga 100% dalam klasifikasi risiko ATA dan 92,9% hingga 98,1% dalam penentuan stadium kanker AJCC. Tingkat akurasi yang tinggi ini menunjukkan potensi AI untuk mengubah praktik klinis dan meningkatkan hasil pasien. Kemampuan model untuk secara akurat mengklasifikasikan stadium kanker dan kategori risiko dapat membantu klinisi membuat keputusan pengobatan yang lebih tepat, yang mengarah pada hasil yang lebih baik bagi pasien.

Kemampuan Offline: Memastikan Privasi Pasien

Salah satu keuntungan paling signifikan dari model AI ini adalah kemampuan offline-nya. Ini berarti bahwa model dapat diterapkan secara lokal tanpa perlu berbagi atau mengunggah informasi pasien sensitif. Ini sangat penting untuk melindungi privasi pasien dan memastikan kepatuhan terhadap peraturan keamanan data.

Kemampuan offline juga membuat model AI lebih mudah diakses oleh rumah sakit dan klinik di lingkungan yang kekurangan sumber daya. Fasilitas ini mungkin tidak memiliki bandwidth atau infrastruktur untuk mendukung model AI online, tetapi mereka tetap dapat memperoleh manfaat dari kemampuan model AI dengan menerapkannya secara lokal.

Perbandingan dengan LLM Online: DeepSeek dan GPT-4o

Tim peneliti melakukan tes komparatif dengan versi terbaru DeepSeek dan GPT-4o, dua LLM online yang kuat. Hasil tes ini menunjukkan bahwa model AI berkinerja setara dengan LLM online ini, menunjukkan kemampuannya untuk bersaing dengan sistem AI terbaik di dunia.

Fakta bahwa model AI dapat berkinerja setara dengan LLM online tanpa memerlukan koneksi internet merupakan keuntungan yang signifikan. Ini membuat model AI lebih andal dan aman, karena tidak bergantung pada server atau jaringan eksternal.

Dampak Transformasi pada Efisiensi Perawatan Kesehatan dan Perawatan Pasien

Integrasi model AI ini ke dalam alur kerja klinis menjanjikan transformasi signifikan dalam efisiensi perawatan kesehatan dan perawatan pasien. Kemampuan model untuk mengotomatiskan proses penentuan stadium kanker dan klasifikasi risiko dapat membebaskan klinisi untuk fokus pada aspek-aspek penting lainnya dari perawatan pasien, seperti perencanaan pengobatan dan konseling pasien.

Model AI juga dapat membantu mengurangi risiko kesalahan dan inkonsistensi dalam proses diagnostik, yang mengarah pada keputusan pengobatan yang lebih tepat dan hasil pasien yang lebih baik. Selain itu, model dapat meningkatkan akses ke perawatan berkualitas bagi pasien di daerah yang kurang terlayani dengan memungkinkan klinisi untuk mendiagnosis dan menangani kanker tiroid dengan lebih efisien.

Mengatasi Pertimbangan Etika dan Memastikan Implementasi AI yang Bertanggung Jawab

Seperti halnya teknologi AI lainnya, penting untuk mengatasi pertimbangan etika dan memastikan implementasi AI yang bertanggung jawab. Tim peneliti berkomitmen untuk mengembangkan dan menerapkan model AI dengan cara yang etis, transparan, dan akuntabel.

Salah satu pertimbangan etika utama adalah memastikan bahwa model AI tidak bias terhadap kelompok pasien tertentu. Tim peneliti bekerja untuk mengatasi masalah ini dengan menggunakan data pelatihan yang beragam dan dengan hati-hati memantau kinerja model di berbagai populasi pasien.

Pertimbangan etika lainnya adalah memastikan bahwa pasien diberi tahu tentang penggunaan AI dalam perawatan mereka. Tim peneliti berkomitmen untuk memberikan pasien informasi yang jelas dan ringkas tentang bagaimana model AI digunakan dan bagaimana hal itu dapat memengaruhi perawatan mereka.

Tim peneliti juga berupaya memastikan bahwa model AI digunakan dengan cara yang konsisten dengan prinsip-prinsip etika medis, seperti kebajikan, tidak membahayakan, otonomi, dan keadilan. Dengan mematuhi prinsip-prinsip ini, tim peneliti dapat membantu memastikan bahwa model AI digunakan untuk meningkatkan perawatan pasien dan meningkatkan kesetaraan kesehatan.