AI Merevolusikan Diagnosis Kanser Tiroid

Model kecerdasan buatan (AI) yang pertama di dunia telah dicipta yang mampu mengklasifikasikan kedua-dua peringkat dan kategori risiko kanser tiroid dengan ketepatan yang luar biasa melebihi 90%. Alat inovatif ini berjanji untuk mengurangkan masa persediaan pra-rundingan untuk doktor barisan hadapan sebanyak kira-kira 50%, menandakan lonjakan besar ke hadapan dalam kecekapan dan ketepatan diagnosis dan pengurusan kanser.

Kejadian Model AI

Pembangunan model AI perintis ini adalah hasil usaha sama daripada pasukan penyelidik antara disiplin yang terdiri daripada pakar dari Fakulti Perubatan LKS Universiti Hong Kong (HKUMed), Makmal InnoHK Penemuan Data untuk Kesihatan (InnoHK D24H), dan London School of Hygiene & Tropical Medicine (LSHTM). Penemuan mereka, yang diterbitkan dalam jurnal berprestij npj Digital Medicine, menyoroti potensi AI untuk mengubah amalan klinikal dan meningkatkan hasil pesakit.

Kanser tiroid, keganasan yang lazim di Hong Kong dan di seluruh dunia, memerlukan strategi pengurusan yang tepat. Kejayaan strategi ini bergantung pada dua sistem kritikal:

  • Jawatankuasa Bersama Amerika mengenai Kanser (AJCC) atau sistem pementasan kanser Tumor-Nod-Metastasis (TNM): Sistem ini, kini dalam edisi ke-8, digunakan untuk menentukan tahap dan penyebaran kanser.
  • Sistem klasifikasi risiko Persatuan Tiroid Amerika (ATA): Sistem ini mengkategorikan risiko berulangnya atau perkembangan kanser.

Sistem ini sangat diperlukan untuk meramalkan kadar kelangsungan hidup pesakit dan memaklumkan keputusan rawatan. Walau bagaimanapun, kaedah konvensional untuk menyepadukan maklumat klinikal yang kompleks ke dalam sistem ini secara manual sering memakan masa dan terdedah kepada ketidakcekapan.

Bagaimana Pembantu AI Berfungsi

Untuk menangani cabaran ini, pasukan penyelidik merekayasa pembantu AI yang memanfaatkan model bahasa besar (LLM), sama seperti yang digunakan dalam ChatGPT dan DeepSeek. LLM ini direka untuk memahami dan memproses bahasa manusia, membolehkan mereka menganalisis dokumen klinikal dan meningkatkan ketepatan dan kecekapan pementasan kanser tiroid dan klasifikasi risiko.

Model AI menggunakan empat LLM sumber terbuka luar talian—Mistral (Mistral AI), Llama (Meta), Gemma (Google), dan Qwen (Alibaba)—untuk menganalisis dokumen klinikal teks bebas. Pendekatan ini memastikan bahawa model boleh memproses pelbagai maklumat klinikal, termasuk laporan patologi, nota pembedahan dan rekod perubatan lain yang berkaitan.

Latihan dan Pengesahan Model AI

Model AI dilatih dengan teliti menggunakan set data akses terbuka berasaskan A.S. yang mengandungi laporan patologi daripada 50 pesakit kanser tiroid yang diperoleh daripada Program Atlas Genom Kanser (TCGA). Selepas fasa latihan, prestasi model disahkan dengan ketat terhadap laporan patologi daripada 289 pesakit TCGA dan 35 kes pseudo yang dicipta oleh pakar bedah endokrin yang berpengalaman. Proses pengesahan komprehensif ini memastikan bahawa model itu teguh dan boleh dipercayai merentas pelbagai senario klinikal.

Prestasi dan Ketepatan

Dengan menggabungkan output keempat-empat LLM, pasukan penyelidik meningkatkan dengan ketara prestasi keseluruhan model AI. Model ini mencapai ketepatan keseluruhan yang mengagumkan sebanyak 88.5% hingga 100% dalam klasifikasi risiko ATA dan 92.9% hingga 98.1% dalam pementasan kanser AJCC. Tahap ketepatan ini melebihi semakan dokumen manual tradisional, yang sering tertakluk kepada kesilapan dan ketidakkonsistenan manusia.

Salah satu faedah paling ketara dari model AI ini adalah keupayaannya untuk mengurangkan masa yang dihabiskan oleh doktor untuk persiapan pra-perundingan sebanyak kira-kira 50%. Penjimatan masa ini membolehkan doktor untuk menumpukan lebih banyak masa untuk penjagaan pesakit secara langsung, meningkatkan pengalaman pesakit secara keseluruhan dan meningkatkan kualiti penjagaan.

Wawasan Utama daripada Pasukan Penyelidik

Profesor Joseph T Wu, Profesor Sir Kotewall dalam Kesihatan Awam dan Pengarah Urusan InnoHK D24H di HKUMed, menekankan prestasi cemerlang model itu, dengan menyatakan, ‘Model kami mencapai ketepatan lebih daripada 90% dalam mengklasifikasikan peringkat kanser AJCC dan kategori risiko ATA. Kelebihan ketara model ini adalah keupayaan luar taliannya, yang akan membolehkan penggunaan tempatan tanpa perlu berkongsi atau memuat naik maklumat pesakit sensitif, dengan itu memberikan privasi pesakit yang maksimum.’

Profesor Wu juga menyoroti keupayaan model untuk berprestasi setanding dengan LLM dalam talian yang berkuasa seperti DeepSeek dan GPT-4o, dengan menyatakan, ‘Memandangkan kemunculan DeepSeek baru-baru ini, kami menjalankan ujian perbandingan lanjut dengan ‘pendekatan sifar tangkapan’ terhadap versi terkini DeepSeek—R1 dan V3—serta GPT-4o. Kami gembira mendapati bahawa model kami berprestasi setanding dengan LLM dalam talian yang berkuasa ini.’

Dr. Matrix Fung Man-him, profesor penolong klinikal dan ketua pembedahan endokrin, Jabatan Pembedahan, Sekolah Perubatan Klinikal, HKUMed, menggariskan faedah praktikal model itu, dengan menyatakan, ‘Selain memberikan ketepatan yang tinggi dalam mengekstrak dan menganalisis maklumat daripada laporan patologi yang kompleks, rekod operasi dan nota klinikal, model AI kami juga mengurangkan masa persiapan doktor dengan ketara sebanyak hampir separuh berbanding dengan tafsiran manusia. Ia boleh memberikan pementasan kanser dan stratifikasi risiko klinikal secara serentak berdasarkan dua sistem klinikal yang diiktiraf di peringkat antarabangsa.’

Dr. Fung juga menekankan kepelbagaian model dan potensi untuk penerimaan meluas, dengan menyatakan, ‘Model AI adalah serba boleh dan boleh disepadukan dengan mudah ke dalam pelbagai tetapan dalam sektor awam dan swasta, dan kedua-dua institusi penjagaan kesihatan dan penyelidikan tempatan dan antarabangsa. Kami optimis bahawa pelaksanaan model AI ini dalam dunia nyata boleh meningkatkan kecekapan doktor barisan hadapan dan meningkatkan kualiti penjagaan. Di samping itu, doktor akan mempunyai lebih banyak masa untuk kaunseling dengan pesakit mereka.’

Dr. Carlos Wong, Profesor Bersekutu Kehormat di Jabatan Perubatan Keluarga dan Penjagaan Primer, Sekolah Perubatan Klinikal, HKUMed, menyoroti kepentingan mengesahkan model dengan data pesakit dunia nyata, dengan menyatakan, ‘Selaras dengan sokongan kuat kerajaan terhadap penggunaan AI dalam penjagaan kesihatan, seperti yang dicontohkan oleh pelancaran baru-baru ini sistem penulisan laporan perubatan berasaskan LLM di Lembaga Hospital, langkah kami seterusnya adalah untuk menilai prestasi pembantu AI ini dengan sejumlah besar data pesakit dunia nyata.’

Dr. Wong juga menekankan potensi model untuk digunakan dalam tetapan klinikal dan hospital, dengan menyatakan, ‘Sebaik sahaja disahkan, model AI boleh digunakan dengan mudah dalam tetapan klinikal dan hospital sebenar untuk membantu doktor meningkatkan kecekapan operasi dan rawatan.’

Implikasi untuk Amalan Klinikal

Pembangunan model AI ini mempunyai implikasi yang mendalam untuk amalan klinikal dalam bidang diagnosis dan pengurusan kanser tiroid. Dengan mengautomasikan proses pementasan kanser dan klasifikasi risiko, model boleh membebaskan doktor untuk menumpukan perhatian pada aspek penting lain dalam penjagaan pesakit, seperti perancangan rawatan dan kaunseling pesakit.

Selain itu, ketepatan dan kebolehpercayaan model yang tinggi dapat membantu mengurangkan risiko kesalahan dan ketidakkonsistenan dalam proses diagnostik. Ini boleh membawa kepada keputusan rawatan yang lebih tepat dan hasil pesakit yang lebih baik.

Model AI juga berpotensi untuk meningkatkan akses kepada penjagaan berkualiti bagi pesakit di kawasan yang kurang mendapat perkhidmatan. Dengan membolehkan doktor untuk mendiagnosis dan menguruskan kanser tiroid dengan lebih cekap, model ini dapat membantu mengurangkan perbezaan dalam akses dan hasil penjagaan kesihatan.

Hala Tuju Masa Depan

Pasukan penyelidik merancang untuk terus memperhalusi dan memperbaiki model AI, dengan fokus untuk mengembangkan keupayaannya dan meningkatkan ketepatannya. Penyelidikan masa depan juga akan meneroka potensi model untuk digunakan dalam bidang lain dalam diagnosis dan pengurusan kanser.

Di samping itu, pasukan merancang untuk menjalankan kajian lanjut untuk menilai kesan model AI terhadap amalan klinikal dan hasil pesakit. Kajian ini akan membantu menentukan cara terbaik untuk menyepadukan model ke dalam aliran kerja klinikal dan untuk memastikan ia digunakan dengan berkesan untuk meningkatkan penjagaan pesakit.

Pembangunan model AI ini mewakili langkah penting ke hadapan dalam memerangi kanser tiroid. Dengan memanfaatkan kuasa kecerdasan buatan, penyelidik dan doktor bekerja untuk meningkatkan ketepatan, kecekapan dan kebolehaksesan diagnosis dan pengurusan kanser, yang akhirnya membawa kepada hasil yang lebih baik bagi pesakit.

Pemeriksaan Terperinci Komponen dan Kefungsian Model AI

Seni bina model AI adalah gabungan canggih beberapa teknologi termaju, yang direka untuk meniru dan meningkatkan proses kognitif yang terlibat dalam diagnosis perubatan. Pada terasnya, model ini bergantung pada Model Bahasa Besar (LLM), sejenis kecerdasan buatan yang telah menunjukkan kecekapan yang luar biasa dalam memahami, mentafsir dan menjana bahasa manusia. LLM ini, seperti Mistral, Llama, Gemma dan Qwen, berfungsi sebagai blok binaan asas untuk keupayaan analisis AI.

Peranan Model Bahasa Besar (LLM)

LLM dilatih pada set data teks dan kod yang besar, membolehkan mereka membezakan corak, hubungan dan nuansa dalam data. Dalam konteks model AI ini, LLM ditugaskan untuk menganalisis dokumen klinikal, termasuk laporan patologi, nota pembedahan dan rekod perubatan lain. Dokumen ini sering mengandungi bahasa yang kompleks dan teknikal, yang memerlukan tahap pemahaman yang tinggi untuk mengekstrak maklumat yang berkaitan.

LLM memproses teks dengan memecahkannya kepada unit yang lebih kecil, seperti perkataan dan frasa, dan kemudian menganalisis hubungan antara unit ini. Proses ini melibatkan mengenal pasti entiti utama, seperti saiz tumor, penglibatan nodus limfa, dan metastasis jauh, yang penting untuk menentukan peringkat dan kategori risiko kanser.

LLM Sumber Terbuka Luar Talian: Mistral, Llama, Gemma dan Qwen

Model AI menggunakan empat LLM sumber terbuka luar talian: Mistral (Mistral AI), Llama (Meta), Gemma (Google) dan Qwen (Alibaba). Penggunaan berbilang LLM adalah keputusan strategik yang bertujuan untuk meningkatkan keteguhan dan ketepatan model. Setiap LLM mempunyai kekuatan dan kelemahan yang unik, dan dengan menggabungkan outputnya, model dapat memanfaatkan kecerdasan kolektif sistem ini.

  • Mistral: Terkenal dengan kecekapan dan keupayaan untuk berprestasi dengan baik pada pelbagai tugas.
  • Llama: Direka untuk tujuan penyelidikan, memberikan asas yang kukuh untuk pemahaman bahasa.
  • Gemma: Tawaran Google, terkenal dengan integrasinya dengan perkhidmatan Google lain dan prestasinya yang kukuh dalam menjawab soalan.
  • Qwen: Dibangunkan oleh Alibaba, cemerlang dalam mengendalikan tugas bahasa Cina yang kompleks.

Penyepaduan LLM yang pelbagai ini membolehkan model AI untuk mendapat manfaat daripada pelbagai perspektif dan pendekatan, yang akhirnya membawa kepada hasil yang lebih tepat dan boleh dipercayai.

Set Data Latihan: Program Atlas Genom Kanser (TCGA)

Set data latihan model AI diperoleh daripada Program Atlas Genom Kanser (TCGA), sumber awam yang komprehensif yang mengandungi data genomik, klinikal dan patologi untuk beribu-ribu pesakit kanser. Set data TCGA menyediakan banyak maklumat yang penting untuk melatih model AI untuk mengenali corak dan hubungan dalam data.

Set data latihan termasuk laporan patologi daripada 50 pesakit kanser tiroid. Laporan ini mengandungi maklumat terperinci tentang ciri-ciri tumor, termasuk saiz, bentuk dan lokasinya, serta maklumat tentang kehadiran sebarang penyakit metastatik. Model AI belajar untuk mengenal pasti ciri-ciri ini dan menggunakannya untuk mengklasifikasikan peringkat dan kategori risiko kanser.

Proses Pengesahan: Memastikan Ketepatan dan Kebolehpercayaan

Prestasi model AI disahkan dengan ketat menggunakan laporan patologi daripada 289 pesakit TCGA dan 35 kes pseudo yang dicipta oleh pakar bedah endokrin yang berpengalaman. Proses pengesahan direka untuk memastikan bahawa model itu tepat dan boleh dipercayai merentas pelbagai senario klinikal.

Proses pengesahan melibatkan perbandingan klasifikasi model AI dengan klasifikasi yang dibuat oleh pakar manusia. Ketepatan model AI diukur dengan mengira peratusan kes di mana klasifikasi model AI sepadan dengan klasifikasi yang dibuat oleh pakar manusia.

Mencapai Ketepatan Tinggi dalam Klasifikasi Risiko ATA dan Pementasan Kanser AJCC

Model AI mencapai ketepatan keseluruhan yang mengagumkan sebanyak 88.5% hingga 100% dalam klasifikasi risiko ATA dan 92.9% hingga 98.1% dalam pementasan kanser AJCC. Kadar ketepatan yang tinggi ini menunjukkan potensi AI untuk mengubah amalan klinikal dan meningkatkan hasil pesakit. Keupayaan model untuk mengklasifikasikan peringkat dan kategori risiko kanser dengan tepat dapat membantu doktor membuat keputusan rawatan yang lebih tepat, yang membawa kepada hasil yang lebih baik bagi pesakit.

Keupayaan Luar Talian: Memastikan Privasi Pesakit

Salah satu kelebihan paling ketara dari model AI ini adalah keupayaan luar taliannya. Ini bermakna bahawa model boleh digunakan secara tempatan tanpa perlu berkongsi atau memuat naik maklumat pesakit sensitif. Ini adalah penting untuk melindungi privasi pesakit dan memastikan pematuhan dengan peraturan keselamatan data.

Keupayaan luar talian juga menjadikan model AI lebih mudah diakses oleh hospital dan klinik dalam tetapan yang terhad sumber. Kemudahan ini mungkin tidak mempunyai jalur lebar atau infrastruktur untuk menyokong model AI dalam talian, tetapi mereka masih boleh mendapat manfaat daripada keupayaan model AI dengan menggunakannya secara tempatan.

Perbandingan dengan LLM Dalam Talian: DeepSeek dan GPT-4o

Pasukan penyelidik menjalankan ujian perbandingan dengan versi terkini DeepSeek dan GPT-4o, dua LLM dalam talian yang berkuasa. Hasil ujian ini menunjukkan bahawa model AI berprestasi setanding dengan LLM dalam talian ini, menunjukkan keupayaannya untuk bersaing dengan sistem AI terbaik di dunia.

Fakta bahawa model AI boleh berprestasi setanding dengan LLM dalam talian tanpa memerlukan sambungan internet adalah kelebihan yang ketara. Ini menjadikan model AI lebih dipercayai dan selamat, kerana ia tidak bergantung pada pelayan atau rangkaian luaran.

Kesan Transformasi terhadap Kecekapan Penjagaan Kesihatan dan Penjagaan Pesakit

Penyepaduan model AI ini ke dalam aliran kerja klinikal menjanjikan transformasi yang ketara dalam kecekapan penjagaan kesihatan dan penjagaan pesakit. Keupayaan model untuk mengautomasikan proses pementasan kanser dan klasifikasi risiko dapat membebaskan doktor untuk menumpukan perhatian pada aspek penting lain dalam penjagaan pesakit, seperti perancangan rawatan dan kaunseling pesakit.

Model AI juga dapat membantu mengurangkan risiko kesalahan dan ketidakkonsistenan dalam proses diagnostik, yang membawa kepada keputusan rawatan yang lebih tepat dan hasil pesakit yang lebih baik. Tambahan pula, model dapat meningkatkan akses kepada penjagaan berkualiti bagi pesakit di kawasan yang kurang mendapat perkhidmatan dengan membolehkan doktor untuk mendiagnosis dan menguruskan kanser tiroid dengan lebih cekap.

Menangani Pertimbangan Etika dan Memastikan Pelaksanaan AI yang Bertanggungjawab

Seperti mana-mana teknologi AI, adalah penting untuk menangani pertimbangan etika dan memastikan pelaksanaan AI yang bertanggungjawab. Pasukan penyelidik komited untuk membangunkan dan menggunakan model AI dengan cara yang beretika, telus dan bertanggungjawab.

Satu pertimbangan etika utama adalah memastikan bahawa model AI tidak berat sebelah terhadap mana-mana kumpulan pesakit tertentu. Pasukan penyelidik sedang berusaha untuk menangani isu ini dengan menggunakan data latihan yang pelbagai dan dengan memantau dengan teliti prestasi model di pelbagai populasi pesakit.

Satu lagi pertimbangan etika adalah memastikan bahawa pesakit dimaklumkan tentang penggunaan AI dalam penjagaan mereka. Pasukan penyelidik komited untuk memberikan pesakit maklumat yang jelas dan ringkas tentang bagaimana model AI sedang digunakan dan bagaimana ia boleh memberi kesan kepada penjagaan mereka.

Pasukan penyelidik juga sedang berusaha untuk memastikan bahawa model AI digunakan dengan cara yang konsisten dengan prinsip etika perubatan, seperti kebaikan, bukan-mudarat, autonomi, dan keadilan. Dengan mematuhi prinsip ini, pasukan penyelidik dapat membantu memastikan bahawa model AI digunakan untuk meningkatkan penjagaan pesakit dan menggalakkan ekuiti kesihatan.