AI: Menjembatani Kesenjangan Jargon Medis Antar Spesialis?

Dalam jaringan perawatan kesehatan modern yang rumit, komunikasi antara spesialis dan dokter umum adalah hal yang terpenting. Namun, bahasa yang sangat khusus yang sering digunakan dalam catatan medis dapat menciptakan hambatan yang signifikan, terutama ketika berhadapan dengan bidang yang kompleks seperti oftalmologi. Sebuah investigasi baru-baru ini menggali solusi teknologi potensial: memanfaatkan kekuatan kecerdasan buatan, khususnya model bahasa besar (LLM), untuk menerjemahkan laporan oftalmologi yang padat dan penuh jargon menjadi ringkasan yang jelas dan ringkas yang dapat dipahami oleh mereka di luar spesialisasi tersebut. Temuan ini menunjukkan jalan yang menjanjikan untuk meningkatkan komunikasi antar-klinisi dan berpotensi meningkatkan koordinasi perawatan pasien, meskipun tidak tanpa peringatan penting mengenai akurasi dan pengawasan.

Tantangan Komunikasi Khusus

Dunia medis berkembang pesat dengan presisi, seringkali mengarah pada pengembangan terminologi yang sangat spesifik dalam setiap disiplin ilmu. Meskipun penting untuk diskusi bernuansa di antara rekan sejawat, kosakata khusus ini dapat menjadi rintangan signifikan ketika informasi perlu mengalir melintasi departemen yang berbeda atau ke penyedia layanan primer. Oftalmologi, dengan istilah anatomi uniknya, prosedur diagnostik yang kompleks, dan singkatan khusus, mencontohkan tantangan ini. Pemeriksaan mata dapat menghasilkan wawasan kritis tentang kondisi kesehatan sistemik – mengungkapkan tanda-tanda diabetes, multiple sclerosis, atau bahkan stroke yang akan datang. Namun, jika temuan rinci dokter mata diungkapkan dalam istilah yang tidak dikenal oleh dokter penerima, petunjuk diagnostik vital ini berisiko diabaikan atau disalahartikan. Konsekuensi potensial berkisar dari keterlambatan pengobatan hingga diagnosis yang terlewat, yang pada akhirnya berdampak pada hasil pasien.

Pertimbangkan dokter perawatan primer atau hospitalis yang menangani pasien dengan berbagai masalah kesehatan. Mereka mengandalkan laporan dari berbagai spesialis untuk membentuk pandangan holistik tentang kondisi pasien. Catatan oftalmologi yang penuh dengan akronim seperti ‘Tmax’ (tekanan intraokular maksimum), ‘CCT’ (ketebalan kornea sentral), atau singkatan obat spesifik seperti ‘cosopt’ (obat glaukoma kombinasi) dapat membingungkan dan memakan waktu untuk diuraikan. Kurangnya kejelasan langsung ini dapat menghambat pengambilan keputusan yang efisien dan mempersulit diskusi dengan pasien dan keluarga mereka tentang signifikansi temuan mata dalam konteks kesehatan mereka yang lebih luas. Selain itu, paparan terbatas yang diterima banyak profesional medis terhadap oftalmologi selama pelatihan mereka – terkadang hanya berjumlah beberapa kuliah – memperburuk kesenjangan pemahaman ini.

AI Memasuki Ruang Pemeriksaan: Studi dalam Kejelasan

Menyadari hambatan komunikasi ini, para peneliti memulai studi peningkatan kualitas untuk mengeksplorasi apakah AI dapat berfungsi sebagai penerjemah yang efektif. Pertanyaan intinya adalah apakah teknologi LLM saat ini memiliki kecanggihan, akurasi, dan basis pengetahuan terkini yang diperlukan untuk mengubah catatan oftalmologi yang rumit menjadi ringkasan yang dapat dicerna secara universal. Bisakah AI secara efektif menjembatani kesenjangan terminologi antara spesialis mata dan rekan mereka di bidang medis lain?

Studi yang dilakukan di Mayo Clinic antara Februari dan Mei 2024 ini melibatkan 20 dokter mata. Para spesialis ini secara acak ditugaskan ke salah satu dari dua jalur setelah mendokumentasikan pertemuan pasien. Satu kelompok mengirimkan catatan klinis standar mereka langsung ke anggota tim perawatan yang relevan (dokter, residen, fellow, praktisi perawat, asisten dokter, dan staf kesehatan terkait). Kelompok lain pertama-tama memproses catatan mereka melalui program AI yang dirancang untuk menghasilkan ringkasan bahasa sederhana. Ringkasan yang dihasilkan AI ini ditinjau oleh dokter mata, yang dapat mengoreksi kesalahan faktual tetapi diinstruksikan untuk tidak melakukan perubahan gaya. Anggota tim perawatan yang menerima catatan dari kelompok kedua ini menerima baik catatan spesialis asli maupun ringkasan bahasa sederhana yang dihasilkan AI.

Untuk mengukur efektivitas intervensi ini, survei didistribusikan kepada dokter dan profesional non-oftalmologi yang menerima catatan ini. Sebanyak 362 tanggapan dikumpulkan, mewakili tingkat respons sekitar 33%. Sekitar setengah dari responden hanya meninjau catatan standar, sementara separuh lainnya meninjau catatan dan ringkasan AI. Survei ini bertujuan untuk menilai kejelasan, pemahaman, kepuasan dengan tingkat detail, dan preferensi keseluruhan.

Hasil yang Mencolok: Preferensi dan Peningkatan Pemahaman

Umpan balik dari para profesional non-oftalmologi sangat positif terhadap ringkasan yang dibantu AI. 85% responden yang luar biasa menunjukkan preferensi untuk menerima ringkasan bahasa sederhana bersama catatan asli, dibandingkan dengan menerima catatan standar saja. Preferensi ini didukung oleh peningkatan signifikan dalam persepsi kejelasan dan pemahaman.

  • Kejelasan: Ketika ditanya apakah catatan itu ‘sangat jelas’, 62,5% dari mereka yang menerima ringkasan AI setuju, dibandingkan dengan hanya 39,5% dari mereka yang menerima catatan standar – perbedaan yang signifikan secara statistik (P<0,001). Ini menunjukkan AI berhasil menghilangkan jargon yang membingungkan dan menyajikan informasi inti dengan lebih mudah diakses.
  • Pemahaman: Ringkasan juga secara nyata meningkatkan pemahaman. 33% penerima merasa ringkasan AI meningkatkan pemahaman mereka ‘secara signifikan’, jauh lebih tinggi daripada 24% yang merasakan hal yang sama tentang catatan standar (P=0,001). Ini menunjukkan bahwa ringkasan tidak hanya menyederhanakan bahasa tetapi secara aktif membantu dalam memahami substansi klinis laporan tersebut.
  • Kepuasan dengan Detail: Menariknya, meskipun berupa ringkasan, versi AI menghasilkan kepuasan yang lebih besar dengan tingkat informasi yang diberikan. 63,6% puas dengan detail dalam format ringkasan AI, dibandingkan dengan 42,2% untuk catatan standar (P<0,001). Ini mungkin menunjukkan bahwa kejelasan mengalahkan volume data teknis semata; memahami poin-poin penting dengan baik lebih memuaskan daripada memiliki akses ke jargon ekstensif yang tidak dapat dengan mudah ditafsirkan.

Salah satu temuan yang paling menarik terkait dengan menjembatani kesenjangan pengetahuan. Para peneliti mengamati bahwa dokter yang awalnya melaporkan merasa tidak nyaman dengan terminologi oftalmologi mengalami manfaat yang lebih signifikan dari ringkasan AI. Penambahan ringkasan bahasa sederhana secara dramatis mengurangi kesenjangan pemahaman antara mereka yang nyaman dan tidak nyaman dengan jargon terkait mata, menyusutkan kesenjangan dari 26,1% menjadi 14,4%. ‘Efek pemerataan’ ini diamati di berbagai peran profesional, termasuk dokter, perawat, dan staf kesehatan terkait lainnya, menyoroti potensi alat semacam itu untuk mendemokratisasi pemahaman di antara tim perawatan kesehatan yang beragam. Para dokter secara khusus berkomentar bahwa ringkasan AI mahir dalam mendefinisikan akronim dan menjelaskan istilah khusus, yang pada gilirannya menyederhanakan percakapan mereka selanjutnya dengan pasien dan keluarga tentang temuan mata.

Kekuatan Bahasa Sederhana: Sebuah Contoh

Untuk mengilustrasikan perbedaan praktis, pertimbangkan contoh hipotetis berdasarkan deskripsi studi. Catatan dokter mata untuk pasien dengan glaukoma sudut terbuka primer mungkin berbunyi seperti ini:

‘Pt c/o blurred vision. Exam: VA OD 20/40, OS 20/30. IOPs 24 OD, 22 OS (Tmax 28). CCT 540 OU. Gonio: Open angles Gr III OU. ONH: C/D 0.7 OD, 0.6 OS, NRR thinning inf OD > OS. HVF: Sup arcuate defect OD. Plan: Cont Cosopt BID OU. F/U 3 mos. RTC sooner if sx worsen. Discussed SLT option.’

Bagi non-spesialis, ini padat dengan singkatan (Pt, c/o, VA, OD, OS, IOPs, Tmax, CCT, OU, Gonio, Gr, ONH, C/D, NRR, HVF, Cont, BID, F/U, RTC, sx, SLT) dan metrik spesifik yang memerlukan interpretasi.

Sebaliknya, ringkasan bahasa sederhana yang dihasilkan AI, berdasarkan deskripsi studi tentang fungsinya, mungkin menyerupai:

‘Pasien ini menderita glaukoma, suatu kondisi yang melibatkan tekanan tinggi di dalam mata yang dapat merusak saraf optik dan menyebabkan kehilangan penglihatan. Tekanan mata hari ini sedikit meningkat (24 di mata kanan, 22 di mata kiri). Saraf optik menunjukkan beberapa tanda kerusakan, lebih banyak di mata kanan. Tes lapang pandang mengkonfirmasi adanya kehilangan penglihatan di bagian perifer atas mata kanan. Pasien akan melanjutkan penggunaan tetes mata Cosopt dua kali sehari di kedua mata. Cosopt adalah obat kombinasi yang mengandung dua obat (dorzolamide dan timolol) untuk membantu menurunkan tekanan mata. Kami membahas Selective Laser Trabeculoplasty (SLT), prosedur laser untuk menurunkan tekanan mata, sebagai pilihan di masa depan. Pasien harus kembali untuk tindak lanjut dalam 3 bulan, atau lebih cepat jika penglihatan berubah atau gejala lain muncul.’

Versi ini segera mengklarifikasi diagnosis, menjelaskan tujuan pengobatan (mendefinisikan ‘Cosopt’), menerjemahkan temuan kunci ke dalam konsep yang dapat dipahami, dan menghindari singkatan samar. Kejelasan yang ditingkatkan ini memungkinkan penyedia layanan primer atau dokter konsultan untuk dengan cepat memahami status pasien dan rencana dokter mata.

Kekhawatiran Akurasi dan Keharusan Pengawasan

Meskipun penerimaan yang sangat positif dan manfaat yang ditunjukkan dalam pemahaman, studi ini juga menyuarakan nada peringatan kritis mengenai keakuratan ringkasan yang dihasilkan AI. Ketika dokter mata meninjau ringkasan awal yang dihasilkan oleh LLM sebelum dikirim, mereka mengidentifikasi kesalahan dalam 26% kasus. Sementara sebagian besar kesalahan ini (83,9%) diklasifikasikan memiliki risiko rendah menyebabkan kerugian pasien, dan yang terpenting, tidak ada yang dianggap menimbulkan risiko bahaya parah atau kematian, tingkat kesalahan awal ini signifikan.

Yang lebih mengkhawatirkan, analisis independen selanjutnya yang dilakukan oleh dokter mata eksternal meninjau 235 ringkasan bahasa sederhana setelah ringkasan tersebut ditinjau dan diedit oleh dokter mata studi. Tinjauan ini menemukan bahwa 15% dari ringkasan masih mengandung kesalahan. Tingkat kesalahan yang persisten ini, bahkan setelah pengawasan spesialis, menggarisbawahi poin penting: alat AI dalam pengaturan klinis tidak dapat berfungsi secara otonom tanpa pengawasan manusia yang ketat.

Studi ini tidak mendalami sifat spesifik dari kesalahan ini, yang merupakan keterbatasan. Potensi kesalahan dapat berkisar dari ketidakakuratan kecil dalam menerjemahkan data numerik, salah menafsirkan tingkat keparahan temuan, menghilangkan nuansa penting dari catatan asli, atau bahkan memperkenalkan informasi yang tidak ada dalam teks sumber (halusinasi). Meskipun profil risiko dalam studi ini tampak rendah, potensi kesalahan memerlukan alur kerja yang kuat yang menggabungkan tinjauan dan koreksi dokter wajib sebelum mengandalkan ringkasan yang dihasilkan AI untuk pengambilan keputusan klinis atau komunikasi. Perlu juga dicatat, seperti yang ditunjukkan oleh penulis studi dengan merujuk pada penelitian lain, bahwa kesalahan tidak eksklusif untuk AI; kesalahan dapat dan memang ada dalam catatan asli yang ditulis oleh dokter juga. Namun, memperkenalkan lapisan AI menambahkan sumber potensi kesalahan baru yang harus dikelola.

Perspektif dari Para Spesialis

Dokter mata yang berpartisipasi dalam studi ini juga memberikan umpan balik. Berdasarkan 489 tanggapan survei (tingkat respons 84% dari spesialis), pandangan mereka tentang ringkasan AI umumnya positif, meskipun mungkin diimbangi oleh kesadaran mereka akan perlunya koreksi.

  • Representasi Diagnosis: Persentase tinggi, 90%, merasa bahwa ringkasan bahasa sederhana mewakili diagnosis pasien ‘secara signifikan’. Ini menunjukkan AI umumnya menangkap gambaran klinis inti secara akurat dari perspektif spesialis.
  • Kepuasan Keseluruhan: 75% dari tanggapan dokter mata menunjukkan bahwa mereka ‘sangat puas’ dengan ringkasan yang dihasilkan untuk catatan mereka (kemungkinan setelah tinjauan dan koreksi mereka).

Meskipun puas, upaya yang terlibat dalam meninjau dan mengoreksi ringkasan tidak dikuantifikasi tetapi tetap menjadi pertimbangan penting untuk integrasi alur kerja. Tingkat kesalahan 15% yang ditemukan bahkan setelah tinjauan mereka menyoroti tantangan – spesialis sibuk, dan pengawasan, meskipun perlu, harus efisien dan dapat diandalkan.

Implikasi Lebih Luas dan Arah Masa Depan

Studi ini membuka jendela tentang bagaimana teknologi, khususnya AI, dapat dimanfaatkan bukan untuk menggantikan interaksi manusia tetapi untuk meningkatkannya dengan mengatasi hambatan komunikasi yang melekat dalam kedokteran khusus. Keberhasilan AI dalam menerjemahkan catatan oftalmologi yang kompleks ke dalam bahasa sederhana menjanjikan aplikasi yang lebih luas.

  • Komunikasi Antar-Klinisi: Model ini berpotensi dapat diadaptasi untuk bidang lain yang sangat terspesialisasi (misalnya, kardiologi, neurologi, patologi) di mana terminologi yang kompleks dapat menghambat pemahaman oleh non-spesialis, meningkatkan koordinasi perawatan lintas disiplin.
  • Edukasi Pasien: Mungkin salah satu ekstensi potensial yang paling menarik adalah menggunakan alat AI serupa untuk menghasilkan ringkasan yang ramah pasien dari catatan kunjungan mereka sendiri. Memberdayakan pasien dengan informasi yang jelas dan dapat dipahami tentang kondisi dan rencana perawatan mereka dapat secara signifikan meningkatkan literasi kesehatan, memfasilitasi pengambilan keputusan bersama, dan berpotensi meningkatkan kepatuhan pengobatan. Bayangkan portal pasien secara otomatis menyediakan ringkasan bahasa sederhana di samping catatan klinis resmi.

Namun, para peneliti dengan tepat mengakui keterbatasan di luar tingkat kesalahan. Studi ini dilakukan di satu pusat akademik, berpotensi membatasi generalisasi temuan ke pengaturan praktik lain (misalnya, rumah sakit komunitas, praktik swasta). Informasi demografis tentang peserta survei tidak dikumpulkan, mencegah analisis tentang bagaimana faktor-faktor seperti pengalaman bertahun-tahun atau peran spesifik dapat mempengaruhi persepsi. Yang terpenting, studi ini tidak melacak hasil pasien, sehingga signifikansi klinis langsung – apakah ringkasan yang ditingkatkan ini benar-benar mengarah pada keputusan pengobatan yang lebih baik atau hasil kesehatan – tetap tidak diketahui dan merupakan area vital untuk penelitian di masa depan.

Perjalanan mengintegrasikan AI ke dalam alur kerja klinis jelas sedang berlangsung. Penelitian ini memberikan bukti kuat bahwa LLM dapat berfungsi sebagai alat yang ampuh untuk meningkatkan kejelasan komunikasi antara para profesional medis. Namun, ini juga berfungsi sebagai pengingat kuat bahwa teknologi adalah alat, bukan obat mujarab. Jalan ke depan membutuhkan implementasi yang hati-hati, validasi berkelanjutan, dan komitmen yang tak tergoyahkan terhadap pengawasan manusia untuk memastikan akurasi dan keselamatan pasien. Potensi untuk mendobrak hambatan komunikasi yang sudah berlangsung lama sangat besar, tetapi harus dikejar dengan ketekunan dan pemahaman yang jelas tentang kemampuan dan keterbatasan kecerdasan buatan dalam lanskap perawatan kesehatan yang kompleks.