Trong mạng lưới phức tạp của hệ thống chăm sóc sức khỏe hiện đại, giao tiếp giữa các chuyên gia và bác sĩ đa khoa là tối quan trọng. Tuy nhiên, ngôn ngữ chuyên ngành cao thường được sử dụng trong các ghi chú y khoa có thể tạo ra những rào cản đáng kể, đặc biệt khi xử lý các lĩnh vực phức tạp như nhãn khoa. Một cuộc điều tra gần đây đi sâu vào một giải pháp công nghệ tiềm năng: tận dụng sức mạnh của trí tuệ nhân tạo, cụ thể là các mô hình ngôn ngữ lớn (LLM), để dịch các báo cáo nhãn khoa dày đặc, đầy biệt ngữ thành các bản tóm tắt rõ ràng, súc tích, dễ hiểu đối với những người ngoài chuyên khoa. Các phát hiện cho thấy một hướng đi đầy hứa hẹn để tăng cường giao tiếp giữa các bác sĩ lâm sàng và có khả năng cải thiện sự phối hợp chăm sóc bệnh nhân, mặc dù không phải không có những lưu ý quan trọng về độ chính xác và sự giám sát.
Thách thức của Giao tiếp Chuyên ngành
Thế giới y khoa phát triển dựa trên sự chính xác, thường dẫn đến sự phát triển của thuật ngữ chuyên biệt cao trong mỗi chuyên ngành. Mặc dù cần thiết cho các cuộc thảo luận tinh tế giữa các đồng nghiệp, vốn từ vựng chuyên ngành này có thể trở thành một trở ngại đáng kể khi thông tin cần được luân chuyển giữa các khoa khác nhau hoặc đến các nhà cung cấp dịch vụ chăm sóc ban đầu. Nhãn khoa, với các thuật ngữ giải phẫu độc đáo, quy trình chẩn đoán phức tạp và các chữ viết tắt chuyên ngành, là một ví dụ điển hình cho thách thức này. Một cuộc kiểm tra mắt có thể mang lại những hiểu biết quan trọng về các tình trạng sức khỏe hệ thống – tiết lộ các dấu hiệu của bệnh tiểu đường (diabetes), đa xơ cứng (multiple sclerosis), hoặc thậm chí là đột quỵ sắp xảy ra. Tuy nhiên, nếu những phát hiện chi tiết của bác sĩ nhãn khoa được diễn đạt bằng những thuật ngữ không quen thuộc với bác sĩ tiếp nhận, những manh mối chẩn đoán quan trọng này có nguy cơ bị bỏ qua hoặc giải thích sai. Hậu quả tiềm ẩn bao gồm từ việc trì hoãn điều trị đến bỏ lỡ chẩn đoán, cuối cùng ảnh hưởng đến kết quả của bệnh nhân.
Hãy xem xét trường hợp bác sĩ chăm sóc ban đầu hoặc bác sĩ nội trú bệnh viện đang quản lý một bệnh nhân có nhiều vấn đề sức khỏe. Họ dựa vào các báo cáo từ nhiều chuyên gia khác nhau để có cái nhìn tổng thể về tình trạng của bệnh nhân. Một ghi chú nhãn khoa chứa đầy các từ viết tắt như ‘Tmax’ (áp lực nội nhãn tối đa), ‘CCT’ (độ dày giác mạc trung tâm), hoặc các từ viết tắt thuốc cụ thể như ‘cosopt’ (một loại thuốc kết hợp điều trị glaucoma) có thể gây khó hiểu và tốn thời gian để giải mã. Sự thiếu rõ ràng ngay lập tức này có thể cản trở việc ra quyết định hiệu quả và làm phức tạp các cuộc thảo luận với bệnh nhân và gia đình họ về tầm quan trọng của các phát hiện về mắt trong bối cảnh sức khỏe rộng lớn hơn của họ. Hơn nữa, việc nhiều chuyên gia y tế ít được tiếp xúc với nhãn khoa trong quá trình đào tạo – đôi khi chỉ giới hạn trong một vài bài giảng – càng làm trầm trọng thêm khoảng cách hiểu biết này.
AI Bước vào Phòng khám: Một Nghiên cứu về Sự Rõ ràng
Nhận thức được nút thắt giao tiếp này, các nhà nghiên cứu đã bắt tay vào một nghiên cứu cải tiến chất lượng để khám phá xem liệu AI có thể đóng vai trò như một người phiên dịch hiệu quả hay không. Câu hỏi cốt lõi là liệu công nghệ LLM hiện tại có đủ sự tinh vi, độ chính xác và cơ sở kiến thức cập nhật cần thiết để chuyển đổi các ghi chú nhãn khoa phức tạp thành các bản tóm tắt dễ hiểu phổ quát hay không. Liệu AI có thể thu hẹp khoảng cách thuật ngữ giữa các chuyên gia mắt và đồng nghiệp của họ trong các lĩnh vực y tế khác một cách hiệu quả?
Nghiên cứu, được thực hiện tại Mayo Clinic từ tháng 2 đến tháng 5 năm 2024, có sự tham gia của 20 bác sĩ nhãn khoa. Các chuyên gia này được phân ngẫu nhiên vào một trong hai lộ trình sau khi ghi lại các cuộc gặp gỡ với bệnh nhân. Một nhóm gửi trực tiếp các ghi chú lâm sàng tiêu chuẩn của họ đến các thành viên nhóm chăm sóc liên quan (bác sĩ, bác sĩ nội trú, nghiên cứu sinh, y tá thực hành, trợ lý bác sĩ và nhân viên y tế liên quan). Nhóm còn lại trước tiên xử lý ghi chú của họ thông qua một chương trình AI được thiết kế để tạo ra một bản tóm tắt bằng ngôn ngữ đơn giản. Các bản tóm tắt do AI tạo ra này đã được bác sĩ nhãn khoa xem xét, người có thể sửa lỗi thực tế nhưng được hướng dẫn không thực hiện các thay đổi về văn phong. Các thành viên nhóm chăm sóc nhận được ghi chú từ nhóm thứ hai này đã nhận được cả ghi chú chuyên khoa gốc và bản tóm tắt bằng ngôn ngữ đơn giản do AI tạo ra.
Để đánh giá hiệu quả của sự can thiệp này, các cuộc khảo sát đã được phân phát cho các bác sĩ lâm sàng và chuyên gia không thuộc chuyên khoa nhãn khoa đã nhận được những ghi chú này. Tổng cộng có 362 phản hồi đã được thu thập, chiếm tỷ lệ phản hồi khoảng 33%. Khoảng một nửa số người trả lời chỉ xem xét các ghi chú tiêu chuẩn, trong khi nửa còn lại xem xét cả ghi chú và bản tóm tắt AI. Cuộc khảo sát nhằm đánh giá sự rõ ràng, mức độ hiểu, sự hài lòng với mức độ chi tiết và sự ưa thích chung.
Kết quả Nổi bật: Sự Ưa chuộng và Hiểu biết Nâng cao
Phản hồi từ các chuyên gia không thuộc chuyên khoa nhãn khoa là cực kỳ tích cực đối với các bản tóm tắt có sự hỗ trợ của AI. Một con số đáng chú ý là 85% người trả lời cho biết họ thích nhận bản tóm tắt bằng ngôn ngữ đơn giản cùng với ghi chú gốc, so với việc chỉ nhận ghi chú tiêu chuẩn. Sự ưa thích này được củng cố bởi những cải thiện đáng kể về nhận thức về sự rõ ràng và khả năng hiểu.
- Sự rõ ràng: Khi được hỏi liệu các ghi chú có “rất rõ ràng” hay không, 62.5% những người nhận được bản tóm tắt AI đã đồng ý, so với chỉ 39.5% những người nhận được ghi chú tiêu chuẩn – một sự khác biệt có ý nghĩa thống kê (P<0.001). Điều này cho thấy AI đã thành công trong việc loại bỏ biệt ngữ khó hiểu và trình bày thông tin cốt lõi một cách dễ tiếp cận hơn.
- Mức độ hiểu: Các bản tóm tắt cũng cải thiện rõ rệt khả năng hiểu. 33% người nhận cảm thấy bản tóm tắt AI cải thiện sự hiểu biết của họ “rất nhiều”, cao hơn đáng kể so với 24% người cảm thấy tương tự về các ghi chú tiêu chuẩn (P=0.001). Điều này chỉ ra rằng các bản tóm tắt không chỉ đơn giản hóa ngôn ngữ mà còn tích cực hỗ trợ việc nắm bắt nội dung lâm sàng của báo cáo.
- Sự hài lòng với Mức độ chi tiết: Điều thú vị là, mặc dù là bản tóm tắt, các phiên bản AI lại dẫn đến sự hài lòng cao hơn với mức độ thông tin được cung cấp. 63.6% hài lòng với mức độ chi tiết trong định dạng tóm tắt AI, so với 42.2% đối với các ghi chú tiêu chuẩn (P<0.001). Điều này có thể cho thấy rằng sự rõ ràng quan trọng hơn khối lượng dữ liệu kỹ thuật đơn thuần; hiểu rõ các điểm chính sẽ thỏa mãn hơn là có quyền truy cập vào biệt ngữ rộng lớn mà người ta không thể dễ dàng giải thích.
Một trong những phát hiện thuyết phục nhất liên quan đến việc thu hẹp khoảng cách kiến thức. Các nhà nghiên cứu quan sát thấy rằng các bác sĩ lâm sàng ban đầu báo cáo cảm thấy không thoải mái với thuật ngữ nhãn khoa đã trải nghiệm lợi ích đáng kể hơn từ các bản tóm tắt AI. Việc bổ sung bản tóm tắt bằng ngôn ngữ đơn giản đã làm giảm đáng kể sự chênh lệch về khả năng hiểu giữa những người cảm thấy thoải mái và không thoải mái với biệt ngữ liên quan đến mắt, thu hẹp khoảng cách từ 26.1% xuống còn 14.4%. “Hiệu ứng cân bằng” này được quan sát thấy ở các vai trò chuyên môn khác nhau, bao gồm bác sĩ, y tá và các nhân viên y tế liên quan khác, nhấn mạnh tiềm năng của các công cụ như vậy trong việc dân chủ hóa sự hiểu biết giữa các nhóm chăm sóc sức khỏe đa dạng. Các bác sĩ lâm sàng đặc biệt nhận xét rằng các bản tóm tắt AI rất thành thạo trong việc định nghĩa các từ viết tắt và giải thích các thuật ngữ chuyên ngành, điều này đến lượt nó đã đơn giản hóa các cuộc trò chuyện tiếp theo của họ với bệnh nhân và gia đình về các phát hiện về mắt.
Sức mạnh của Ngôn ngữ Đơn giản: Một Ví dụ
Để minh họa sự khác biệt thực tế, hãy xem xét một ví dụ giả định dựa trên mô tả của nghiên cứu. Ghi chú của bác sĩ nhãn khoa cho bệnh nhân bị glaucoma góc mở nguyên phát có thể đọc như sau:
“Pt c/o blurred vision. Exam: VA OD 20/40, OS 20/30. IOPs 24 OD, 22 OS (Tmax 28). CCT 540 OU. Gonio: Open angles Gr III OU. ONH: C/D 0.7 OD, 0.6 OS, NRR thinning inf OD > OS. HVF: Sup arcuate defect OD. Plan: Cont Cosopt BID OU. F/U 3 mos. RTC sooner if sx worsen. Discussed SLT option.”
Đối với một người không chuyên, điều này dày đặc các chữ viết tắt (Pt, c/o, VA, OD, OS, IOPs, Tmax, CCT, OU, Gonio, Gr, ONH, C/D, NRR, HVF, Cont, BID, F/U, RTC, sx, SLT) và các chỉ số cụ thể đòi hỏi sự giải thích.
Ngược lại, bản tóm tắt bằng ngôn ngữ đơn giản do AI tạo ra, dựa trên mô tả chức năng của chúng trong nghiên cứu, có thể giống như sau:
“Bệnh nhân này bị glaucoma, một tình trạng liên quan đến áp lực cao bên trong mắt có thể làm hỏng dây thần kinh thị giác và gây mất thị lực. Áp lực mắt hôm nay hơi cao (24 ở mắt phải, 22 ở mắt trái). Dây thần kinh thị giác cho thấy một số dấu hiệu tổn thương, nhiều hơn ở mắt phải. Một xét nghiệm thị trường đã xác nhận một số mất thị lực ở phần nhìn ngoại vi phía trên của mắt phải. Bệnh nhân sẽ tiếp tục sử dụng thuốc nhỏ mắt Cosopt hai lần mỗi ngày ở cả hai mắt. Cosopt là một loại thuốc kết hợp chứa hai loại thuốc (dorzolamide và timolol) để giúp hạ nhãn áp. Chúng tôi đã thảo luận về Selective Laser Trabeculoplasty (SLT), một thủ thuật laser để hạ nhãn áp, như một lựa chọn trong tương lai. Bệnh nhân nên quay lại tái khám sau 3 tháng, hoặc sớm hơn nếu thị lực thay đổi hoặc các triệu chứng khác xảy ra.”
Phiên bản này ngay lập tức làm rõ chẩn đoán, giải thích mục đích của thuốc (định nghĩa “Cosopt”), dịch các phát hiện chính thành các khái niệm dễ hiểu và tránh các chữ viết tắt khó hiểu. Sự rõ ràng nâng cao này cho phép bác sĩ chăm sóc ban đầu hoặc bác sĩ tư vấn nhanh chóng nắm bắt tình trạng của bệnh nhân và kế hoạch của bác sĩ nhãn khoa.
Mối lo ngại về Độ chính xác và Sự cần thiết của Giám sát
Mặc dù nhận được sự đón nhận tích cực và lợi ích rõ ràng về khả năng hiểu, nghiên cứu cũng đưa ra một lưu ý cảnh báo quan trọng về độ chính xác của các bản tóm tắt do AI tạo ra. Khi các bác sĩ nhãn khoa xem xét các bản tóm tắt ban đầu do LLM tạo ra trước khi chúng được gửi đi, họ đã xác định được lỗi trong 26% trường hợp. Mặc dù đại đa số các lỗi này (83.9%) được phân loại là có nguy cơ gây hại thấp cho bệnh nhân, và quan trọng là, không có lỗi nào được coi là có nguy cơ gây hại nghiêm trọng hoặc tử vong, tỷ lệ lỗi ban đầu này là đáng kể.
Đáng lo ngại hơn nữa, một phân tích độc lập sau đó được thực hiện bởi một bác sĩ nhãn khoa bên ngoài đã xem xét 235 bản tóm tắt bằng ngôn ngữ đơn giản sau khi chúng đã được các bác sĩ nhãn khoa của nghiên cứu xem xét và chỉnh sửa. Đánh giá này cho thấy 15% các bản tóm tắt vẫn chứa lỗi. Tỷ lệ lỗi dai dẳng này, ngay cả sau khi có sự giám sát của chuyên gia, nhấn mạnh một điểm quan trọng: các công cụ AI trong môi trường lâm sàng không thể hoạt động tự chủ mà không có sự giám sát chặt chẽ của con người.
Nghiên cứu không đi sâu vào bản chất cụ thể của những lỗi này, đây là một hạn chế. Các lỗi tiềm ẩn có thể bao gồm từ những điểm không chính xác nhỏ trong việc dịch dữ liệu số, giải thích sai mức độ nghiêm trọng của một phát hiện, bỏ sót các sắc thái quan trọng từ ghi chú gốc, hoặc thậm chí giới thiệu thông tin không có trong văn bản nguồn (hallucinations - ảo giác). Mặc dù hồ sơ rủi ro trong nghiên cứu này có vẻ thấp, tiềm năng xảy ra lỗi đòi hỏi các quy trình làm việc mạnh mẽ kết hợp việc xem xét và sửa chữa bắt buộc của bác sĩ lâm sàng trước khi dựa vào các bản tóm tắt do AI tạo ra cho việc ra quyết định lâm sàng hoặc giao tiếp. Cũng cần lưu ý, như các tác giả nghiên cứu đã chỉ ra bằng cách tham khảo các nghiên cứu khác, rằng lỗi không chỉ xảy ra với AI; lỗi có thể và thực sự tồn tại trong các ghi chú gốc do bác sĩ lâm sàng soạn thảo. Tuy nhiên, việc giới thiệu một lớp AI sẽ bổ sung thêm một nguồn lỗi tiềm ẩn mới cần được quản lý.
Góc nhìn từ các Chuyên gia
Các bác sĩ nhãn khoa tham gia nghiên cứu cũng cung cấp phản hồi. Dựa trên 489 phản hồi khảo sát (tỷ lệ phản hồi 84% từ các chuyên gia), quan điểm của họ về các bản tóm tắt AI nhìn chung là tích cực, mặc dù có lẽ bị giảm nhẹ bởi nhận thức của họ về sự cần thiết phải sửa chữa.
- Đại diện cho Chẩn đoán: Một tỷ lệ cao, 90%, cảm thấy rằng các bản tóm tắt bằng ngôn ngữ đơn giản đại diện cho chẩn đoán của bệnh nhân “rất nhiều”. Điều này cho thấy AI nhìn chung đã nắm bắt chính xác bức tranh lâm sàng cốt lõi từ góc độ của chuyên gia.
- Sự hài lòng chung: 75% phản hồi của bác sĩ nhãn khoa cho biết họ “rất hài lòng” với các bản tóm tắt được tạo ra cho ghi chú của họ (có lẽ là sau khi họ xem xét và sửa chữa).
Mặc dù hài lòng, nỗ lực liên quan đến việc xem xét và sửa chữa các bản tóm tắt không được định lượng nhưng vẫn là một yếu tố quan trọng cần cân nhắc để tích hợp quy trình làm việc. Tỷ lệ lỗi 15% được tìm thấy ngay cả sau khi họ xem xét nhấn mạnh thách thức – các chuyên gia rất bận rộn, và việc giám sát, mặc dù cần thiết, cần phải hiệu quả và đáng tin cậy.
Ý nghĩa Rộng hơn và Hướng đi Tương lai
Nghiên cứu này mở ra một cửa sổ về cách công nghệ, cụ thể là AI, có thể được khai thác không phải để thay thế tương tác của con người mà để tăng cường nó bằng cách khắc phục các rào cản giao tiếp vốn có trong y học chuyên ngành. Sự thành công của AI trong việc dịch các ghi chú nhãn khoa phức tạp sang ngôn ngữ đơn giản hứa hẹn các ứng dụng rộng rãi hơn.
- Giao tiếp giữa các Bác sĩ lâm sàng: Mô hình này có khả năng được điều chỉnh cho các lĩnh vực chuyên ngành cao khác (ví dụ: tim mạch, thần kinh, bệnh học) nơi thuật ngữ phức tạp có thể cản trở sự hiểu biết của những người không chuyên, cải thiện sự phối hợp chăm sóc giữa các chuyên ngành.
- Giáo dục Bệnh nhân: Có lẽ một trong những phần mở rộng tiềm năng thú vị nhất là sử dụng các công cụ AI tương tự để tạo ra các bản tóm tắt thân thiện với bệnh nhân về ghi chú thăm khám của chính họ. Trao quyền cho bệnh nhân bằng thông tin rõ ràng, dễ hiểu về tình trạng và kế hoạch điều trị của họ có thể cải thiện đáng kể kiến thức sức khỏe, tạo điều kiện cho việc ra quyết định chung và có khả năng tăng cường tuân thủ điều trị. Hãy tưởng tượng một cổng thông tin bệnh nhân tự động cung cấp bản tóm tắt bằng ngôn ngữ đơn giản cùng với ghi chú lâm sàng chính thức.
Tuy nhiên, các nhà nghiên cứu đã thừa nhận một cách đúng đắn những hạn chế ngoài tỷ lệ lỗi. Nghiên cứu được thực hiện tại một trung tâm học thuật duy nhất, có khả năng hạn chế khả năng khái quát hóa các phát hiện cho các môi trường thực hành khác (ví dụ: bệnh viện cộng đồng, phòng khám tư). Thông tin nhân khẩu học về những người tham gia khảo sát không được thu thập, ngăn cản việc phân tích các yếu tố như số năm kinh nghiệm hoặc vai trò cụ thể có thể ảnh hưởng đến nhận thức như thế nào. Quan trọng là, nghiên cứu không theo dõi kết quả của bệnh nhân, vì vậy ý nghĩa lâm sàng trực tiếp – liệu những bản tóm tắt cải tiến này có thực sự dẫn đến các quyết định điều trị tốt hơn hoặc kết quả sức khỏe tốt hơn hay không – vẫn chưa được biết và là một lĩnh vực quan trọng cho nghiên cứu trong tương lai.
Hành trình tích hợp AI vào quy trình làm việc lâm sàng rõ ràng đang diễn ra. Nghiên cứu này cung cấp bằng chứng thuyết phục rằng LLM có thể đóng vai trò là công cụ mạnh mẽ để cải thiện sự rõ ràng trong giao tiếp giữa các chuyên gia y tế. Tuy nhiên, nó cũng đóng vai trò như một lời nhắc nhở mạnh mẽ rằng công nghệ là một công cụ, không phải là thuốc chữa bách bệnh. Con đường phía trước đòi hỏi sự triển khai cẩn thận, xác nhận liên tục và cam kết không ngừng đối với sự giám sát của con người để đảm bảo tính chính xác và an toàn cho bệnh nhân. Tiềm năng phá vỡ các rào cản giao tiếp lâu đời là rất lớn, nhưng nó phải được theo đuổi một cách siêng năng và với sự hiểu biết rõ ràng về cả khả năng và hạn chế của trí tuệ nhân tạo trong bối cảnh phức tạp của chăm sóc sức khỏe.