AI 助跨專科溝通:破解醫學術語隔閡?

在現代醫療保健錯綜複雜的網絡中,專科醫生與一般執業醫生之間的溝通至關重要。然而,醫療紀錄中經常使用的極度專業化語言可能造成顯著障礙,尤其是在處理像 ophthalmology(眼科)這樣複雜的領域時。最近一項調查深入探討了一種潛在的技術解決方案:利用人工智能,特別是大型語言模型 (LLMs) 的力量,將充滿術語、晦澀難懂的 ophthalmology 報告翻譯成清晰、簡潔、非專科人士也能理解的摘要。研究結果顯示,這為加強臨床醫生間的溝通、並可能改善病人照護協調提供了一條充滿希望的途徑,儘管在準確性和監督方面存在重要的警示。

專業化溝通的挑戰

醫學界仰賴精確性,這往往導致每個學科內部發展出高度特定的術語。雖然這對於同行間進行細緻入微的討論至關重要,但當資訊需要在不同部門之間或向基層醫療提供者流動時,這種專業詞彙可能成為一個重大的障礙。Ophthalmology 以其獨特的解剖學術語、複雜的診斷程序和專門的縮寫,正是這種挑戰的例證。眼科檢查可以提供對全身健康狀況的關鍵見解——揭示糖尿病、多發性硬化症甚至即將發生的中風跡象。然而,如果眼科醫生的詳細發現是以接收方臨床醫生不熟悉的術語表達,這些重要的診斷線索就有被忽略或誤解的風險。潛在後果從延遲治療到錯失診斷不等,最終影響病人預後。

試想一位基層醫療醫生或管理著有多重健康問題病人的住院醫生。他們依賴來自各專科醫生的報告來形成對病人狀況的整體看法。一份充滿縮寫如 ‘Tmax’(最高眼內壓)、’CCT’(中央角膜厚度)或特定藥物簡稱如 ‘cosopt’(一種複方青光眼藥物)的 ophthalmology 紀錄,可能會令人困惑且耗時去解讀。這種缺乏即時清晰度的情況會阻礙有效的決策制定,並使與病人及其家屬就眼科發現在其整體健康背景下的重要性進行討論變得複雜。此外,許多醫療專業人員在培訓期間接觸 ophthalmology 的機會有限——有時僅相當於幾堂講座——更加劇了這種理解上的差距。

AI 進入檢查室:一項關於清晰度的研究

意識到這種溝通瓶頸,研究人員展開了一項品質改善研究,以探索 AI 是否能作為有效的翻譯器。核心問題是,當前的 LLM 技術是否具備所需的複雜性、準確性和最新的知識庫,以將錯綜複雜的 ophthalmology 紀錄轉化為普遍易懂的摘要?AI 能否有效彌合眼科專家與其他醫學領域同事之間的術語鴻溝?

該研究於 2024 年 2 月至 5 月在 Mayo Clinic 進行,涉及 20 位眼科醫生。這些專家在記錄病人就診情況後,被隨機分配到兩條路徑之一。一組將其標準的臨床紀錄直接發送給相關的照護團隊成員(醫生、住院醫生、研究員、執業護士、醫生助理和聯合健康人員)。另一組則先將其紀錄通過一個旨在生成淺白語言摘要的 AI 程式處理。這些 AI 生成的摘要由眼科醫生審閱,他們可以糾正事實錯誤,但被指示不要進行風格上的修改。接收來自第二組紀錄的照護團隊成員會收到原始的專科紀錄 AI 生成的淺白語言摘要。

為了評估這種干預措施的有效性,研究人員向接收這些紀錄的非眼科臨床醫生和專業人員分發了問卷。共收集到 362 份回覆,回覆率約為 33%。大約一半的回覆者只審閱了標準紀錄,而另一半則審閱了紀錄和 AI 摘要。問卷旨在評估清晰度、理解度、對細節程度的滿意度以及總體偏好。

驚人的結果:偏好與理解度的提升

非眼科專業人員對 AI 輔助摘要的反饋壓倒性地正面。高達 85% 的回覆者表示偏好在收到原始紀錄的同時也收到淺白語言摘要,相較於只收到標準紀錄。這種偏好得到了在感知清晰度和理解度方面顯著改善的支持。

  • 清晰度: 當被問及紀錄是否「非常清晰」時,收到 AI 摘要的人中有 62.5% 表示同意,而只收到標準紀錄的人中只有 39.5% 同意——這是一個統計學上顯著的差異 (P<0.001)。這表明 AI 成功地去除了令人困惑的術語,並以更易於理解的方式呈現了核心資訊。
  • 理解度: 摘要也明顯提高了理解力。33% 的接收者認為 AI 摘要「極大地」改善了他們的理解,顯著高於對標準紀錄有相同感受的 24% (P=0.001)。這表明摘要不僅簡化了語言,而且積極地幫助掌握了報告的臨床實質內容。
  • 對細節的滿意度: 有趣的是,儘管是摘要,AI 版本卻帶來了對所提供資訊水平更高的滿意度。63.6% 的人對 AI 摘要格式的細節感到滿意,而標準紀錄則為 42.2% (P<0.001)。這可能表明清晰度勝過純粹的技術數據量;充分理解關鍵點比擁有大量難以輕易解釋的術語更令人滿意。

其中一個最引人注目的發現與彌合知識差距有關。研究人員觀察到,那些最初表示對 ophthalmology 術語感到不自在的臨床醫生,從 AI 摘要中獲益更為顯著。淺白語言摘要的加入,極大地縮小了對眼科相關術語感到自在和不自在者之間的理解差距,將差距從 26.1% 縮小到 14.4%。這種「均等化效應」在各種專業角色中都觀察到,包括醫生、護士和其他聯合健康人員,突顯了此類工具在不同醫療團隊中普及理解的潛力。臨床醫生特別評論說,AI 摘要擅長定義縮寫和解釋專業術語,這反過來簡化了他們隨後與病人和家屬就眼科發現進行的對話。

淺白語言的力量:一個例子

為了說明實際差異,讓我們根據研究的描述考慮一個假設的例子。一位患有原發性開角型青光眼 (primary open-angle glaucoma) 病人的眼科醫生紀錄可能如下所示:

‘Pt c/o blurred vision. Exam: VA OD 20/40, OS 20/30. IOPs 24 OD, 22 OS (Tmax 28). CCT 540 OU. Gonio: Open angles Gr III OU. ONH: C/D 0.7 OD, 0.6 OS, NRR thinning inf OD > OS. HVF: Sup arcuate defect OD. Plan: Cont Cosopt BID OU. F/U 3 mos. RTC sooner if sx worsen. Discussed SLT option.’

對於非專科醫生來說,這段文字充滿了縮寫(Pt, c/o, VA, OD, OS, IOPs, Tmax, CCT, OU, Gonio, Gr, ONH, C/D, NRR, HVF, Cont, BID, F/U, RTC, sx, SLT)和需要解釋的特定指標。

相比之下,根據研究對其功能的描述,AI 生成的淺白語言摘要可能類似於:

‘這位病人患有青光眼 (glaucoma),這是一種眼內壓力過高可能損害視神經並導致視力喪失的疾病。今天的眼壓略有升高(右眼 24,左眼 22)。視神經顯示出一些損傷跡象,右眼更為明顯。視野檢查證實右眼上部周邊視力有部分喪失。病人將繼續在雙眼每天使用兩次 Cosopt 眼藥水。Cosopt 是一種包含兩種藥物(dorzolamide 和 timolol)的複方藥物,有助於降低眼壓。我們討論了選擇性激光小樑成形術 (Selective Laser Trabeculoplasty, SLT),一種降低眼壓的激光手術,作為未來的選項。病人應在 3 個月後回診追蹤,如果視力變化或其他症狀出現則應提早回診。’

這個版本立即闡明了診斷,解釋了藥物的目的(定義了 ‘Cosopt’),將關鍵發現轉化為易於理解的概念,並避免了神秘的縮寫。這種增強的清晰度使基層醫療提供者或會診醫生能夠快速掌握病人的狀況和眼科醫生的計劃。

準確性擔憂與監督的必要性

儘管在理解度方面獲得了壓倒性的正面評價和顯著的益處,該研究也對 AI 生成摘要的準確性發出了關鍵的警示音。當眼科醫生在摘要發送出去之前審閱 LLM 最初生成的摘要時,他們在 26% 的案例中發現了錯誤。雖然這些錯誤中的絕大多數(83.9%)被歸類為對病人造成傷害的風險較低,且至關重要的是,沒有任何錯誤被認為會構成嚴重傷害或死亡的風險,但這個初始錯誤率仍然相當顯著。

更令人擔憂的是,隨後由一位外部眼科醫生進行的獨立分析,審查了那 235 份已經經過研究中眼科醫生審閱和編輯的淺白語言摘要。這次審查發現,15% 的摘要仍然包含錯誤。這種即使在專家監督之後仍然存在的錯誤率,突顯了一個關鍵點:臨床環境中的 AI 工具不能在沒有嚴格人工監督的情況下自主運作。

該研究沒有深入探討這些錯誤的具體性質,這是一個限制。潛在的錯誤可能範圍很廣,從翻譯數值數據的微小不準確、誤解發現的嚴重性、遺漏原始紀錄中的關鍵細微差別,甚至引入源文本中不存在的資訊(幻覺)。雖然本研究中的風險狀況似乎較低,但錯誤的可能性使得建立包含強制性臨床醫生審查和糾正的穩健工作流程變得必要,然後才能依賴 AI 生成的摘要進行臨床決策或溝通。正如研究作者引用其他研究所指出的那樣,值得注意的是,錯誤並非 AI 獨有;錯誤也可能存在於臨床醫生撰寫的原始紀錄中。然而,引入 AI 層增加了一個必須管理的新潛在錯誤來源。

來自專科醫生的觀點

參與研究的眼科醫生也提供了反饋。根據 489 份問卷回覆(來自專科醫生的回覆率為 84%),他們對 AI 摘要的看法總體上是正面的,儘管可能因意識到需要進行修正而有所保留。

  • 診斷的代表性: 高達 90% 的人認為淺白語言摘要「極大地」代表了病人的診斷。這表明從專科醫生的角度來看,AI 通常能準確捕捉核心臨床情況。
  • 總體滿意度: 75% 的眼科醫生回覆表示,他們對為其紀錄生成的摘要(推測是在他們審閱和修正之後)「非常滿意」。

雖然滿意,但審閱和修正摘要所涉及的工作量並未量化,但對於工作流程整合而言,這仍然是一個重要的考慮因素。即使在他們審閱後仍發現 15% 的錯誤率,突顯了挑戰所在——專科醫生很忙碌,監督雖然必要,但需要高效且可靠。

更廣泛的影響與未來方向

這項研究為我們揭示了如何利用技術,特別是 AI,不是為了取代人際互動,而是通過克服專業化醫學中固有的溝通障礙來增強互動。AI 在將複雜的 ophthalmology 紀錄翻譯成淺白語言方面的成功,為更廣泛的應用帶來了希望。

  • 臨床醫生間溝通: 該模型可能適用於其他高度專業化的領域(例如,心臟科、神經科、病理科),在這些領域,複雜的術語可能會阻礙非專科醫生的理解,從而改善跨學科的照護協調。
  • 病人教育: 也許最令人興奮的潛在擴展之一是使用類似的 AI 工具為病人生成他們自己就診紀錄的易懂摘要。賦予病人關於其狀況和治療計劃的清晰、易懂的資訊,可以顯著提高健康素養,促進共享決策,並可能提高治療依從性。想像一下,一個病人門戶網站自動在官方臨床紀錄旁邊提供淺白語言摘要。

然而,研究人員也正確地承認了除錯誤率之外的限制。該研究是在單一學術中心進行的,這可能限制了研究結果對其他執業環境(例如,社區醫院、私人診所)的普遍適用性。未收集問卷參與者的人口統計資訊,無法分析經驗年資或特定角色等因素可能如何影響看法。至關重要的是,該研究沒有追蹤病人預後,因此直接的臨床意義——這些改進的摘要是否實際導致了更好的治療決策或健康結果——仍然未知,並且是未來研究的一個重要領域。

將 AI 整合到臨床工作流程的旅程顯然正在進行中。這項研究提供了令人信服的證據,表明 LLMs 可以作為強大的工具,改善醫療專業人員之間的溝通清晰度。然而,它也強烈提醒我們,技術是一種工具,而非萬靈丹。前進的道路需要謹慎實施、持續驗證,以及對人工監督的堅定承諾,以確保準確性和病人安全。打破長期存在的溝通障礙的潛力是巨大的,但必須以勤勉的態度,並清晰理解人工智能在複雜醫療領域的能力和局限性來追求。