AI Cách Mạng Hóa Chẩn Đoán Ung Thư Tuyến Giáp

Sự Ra Đời Của Mô Hình AI

Sự phát triển của mô hình AI tiên phong này là kết quả của sự hợp tác giữa các chuyên gia từ Khoa Y LKS thuộc Đại học Hồng Kông (HKUMed), Phòng thí nghiệm InnoHK về Khám phá Dữ liệu cho Sức khỏe (InnoHK D24H) và Trường Vệ sinh & Y học Nhiệt đới London (LSHTM). Các phát hiện của họ, được công bố trên tạp chí uy tín npj Digital Medicine, nhấn mạnh tiềm năng của AI trong việc chuyển đổi thực hành lâm sàng và cải thiện kết quả điều trị cho bệnh nhân.

Ung thư tuyến giáp, một bệnh ác tính phổ biến ở cả Hồng Kông và trên toàn thế giới, đòi hỏi các chiến lược quản lý chính xác. Sự thành công của các chiến lược này phụ thuộc vào hai hệ thống quan trọng:

  • Hệ thống phân giai đoạn ung thư của Ủy ban Ung thư Hợp nhất Hoa Kỳ (AJCC) hoặc Hệ thống di căn hạch bạch huyết (TNM): Hệ thống này, hiện ở phiên bản thứ 8, được sử dụng để xác định mức độ và sự lây lan của ung thư.
  • Hệ thống phân loại rủi ro của Hiệp hội Tuyến giáp Hoa Kỳ (ATA): Hệ thống này phân loại nguy cơ tái phát hoặc tiến triển của ung thư.

Các hệ thống này không thể thiếu để dự đoán tỷ lệ sống sót của bệnh nhân và thông báo các quyết định điều trị. Tuy nhiên, phương pháp thông thường là tích hợp thủ công thông tin lâm sàng phức tạp vào các hệ thống này thường tốn thời gian và dễ xảy ra sai sót.

Cách Trợ Lý AI Hoạt Động

Để giải quyết những thách thức này, nhóm nghiên cứu đã thiết kế một trợ lý AI tận dụng các mô hình ngôn ngữ lớn (LLM), tương tự như các mô hình được sử dụng trong ChatGPT và DeepSeek. Các LLM này được thiết kế để hiểu và xử lý ngôn ngữ của con người, cho phép chúng phân tích các tài liệu lâm sàng và nâng cao độ chính xác và hiệu quả của việc phân giai đoạn ung thư tuyến giáp và phân loại rủi ro.

Mô hình AI sử dụng bốn LLM mã nguồn mở ngoại tuyến—Mistral (Mistral AI), Llama (Meta), Gemma (Google) và Qwen (Alibaba)—để phân tích các tài liệu lâm sàng dạng văn bản tự do. Cách tiếp cận này đảm bảo rằng mô hình có thể xử lý một loạt các thông tin lâm sàng, bao gồm các báo cáo bệnh lý, ghi chú phẫu thuật và các hồ sơ y tế liên quan khác.

Đào Tạo và Xác Thực Mô Hình AI

Mô hình AI đã được đào tạo tỉ mỉ bằng cách sử dụng bộ dữ liệu truy cập mở có trụ sở tại Hoa Kỳ chứa các báo cáo bệnh lý từ 50 bệnh nhân ung thư tuyến giáp có nguồn gốc từ Chương trình Atlas Bộ gen Ung thư (TCGA). Sau giai đoạn đào tạo, hiệu suất của mô hình đã được xác thực nghiêm ngặt dựa trên các báo cáo bệnh lý từ 289 bệnh nhân TCGA và 35 trường hợp giả được tạo bởi các bác sĩ phẫu thuật nội tiết có kinh nghiệm. Quá trình xác thực toàn diện này đảm bảo rằng mô hình này mạnh mẽ và đáng tin cậy trên một loạt các kịch bản lâm sàng đa dạng.

Hiệu Suất và Độ Chính Xác

Bằng cách kết hợp đầu ra của cả bốn LLM, nhóm nghiên cứu đã cải thiện đáng kể hiệu suất tổng thể của mô hình AI. Mô hình đạt được độ chính xác tổng thể ấn tượng từ 88,5% đến 100% trong phân loại rủi ro ATA và từ 92,9% đến 98,1% trong phân giai đoạn ung thư AJCC. Mức độ chính xác này vượt qua các đánh giá tài liệu thủ công truyền thống, vốn thường có thể bị sai sót và không nhất quán do con người.

Một trong những lợi ích quan trọng nhất của mô hình AI này là khả năng giảm thời gian mà các bác sĩ lâm sàng dành cho việc chuẩn bị trước tư vấn khoảng 50%. Tiết kiệm thời gian này cho phép các bác sĩ lâm sàng dành nhiều thời gian hơn cho việc chăm sóc trực tiếp bệnh nhân, cải thiện trải nghiệm tổng thể của bệnh nhân và nâng cao chất lượng chăm sóc.

Những Thông Tin Quan Trọng Từ Nhóm Nghiên Cứu

Giáo sư Joseph T Wu, Giáo sư Sir Kotewall về Sức khỏe Cộng đồng và Giám đốc điều hành của InnoHK D24H tại HKUMed, nhấn mạnh hiệu suất vượt trội của mô hình, nói rằng, ‘Mô hình của chúng tôi đạt được độ chính xác hơn 90% trong việc phân loại giai đoạn ung thư AJCC và loại rủi ro ATA. Một lợi thế đáng kể của mô hình này là khả năng ngoại tuyến của nó, cho phép triển khai cục bộ mà không cần chia sẻ hoặc tải lên thông tin bệnh nhân nhạy cảm, do đó cung cấp sự riêng tư tối đa cho bệnh nhân.’

Giáo sư Wu cũng nhấn mạnh khả năng của mô hình để thực hiện ngang bằng với các LLM trực tuyến mạnh mẽ như DeepSeek và GPT-4o, lưu ý rằng, ‘Trước sự ra mắt gần đây của DeepSeek, chúng tôi đã tiến hành các thử nghiệm so sánh thêm với ‘cách tiếp cận không phát’ chống lại các phiên bản mới nhất của DeepSeek—R1 và V3—cũng như GPT-4o. Chúng tôi rất vui khi thấy rằng mô hình của chúng tôi hoạt động ngang bằng với các LLM trực tuyến mạnh mẽ này.’

Tiến sĩ Matrix Fung Man-him, giáo sư trợ lý lâm sàng và trưởng khoa phẫu thuật nội tiết, Khoa Phẫu thuật, Trường Y học Lâm sàng, HKUMed, nhấn mạnh những lợi ích thiết thực của mô hình, nói rằng, ‘Ngoài việc cung cấp độ chính xác cao trong việc trích xuất và phân tích thông tin từ các báo cáo bệnh lý phức tạp, hồ sơ phẫu thuật và ghi chú lâm sàng, mô hình AI của chúng tôi cũng giảm đáng kể thời gian chuẩn bị của bác sĩ gần một nửa so với diễn giải của con người. Nó có thể đồng thời cung cấp giai đoạn ung thư và phân tầng rủi ro lâm sàng dựa trên hai hệ thống lâm sàng được quốc tế công nhận.’

Tiến sĩ Fung cũng nhấn mạnh tính linh hoạt và tiềm năng áp dụng rộng rãi của mô hình, nói rằng, ‘Mô hình AI rất linh hoạt và có thể dễ dàng tích hợp vào các cài đặt khác nhau trong khu vực công và tư nhân, và cả các viện nghiên cứu và chăm sóc sức khỏe trong và ngoài nước. Chúng tôi lạc quan rằng việc triển khai thực tế mô hình AI này có thể nâng cao hiệu quả của các bác sĩ lâm sàng tuyến đầu và cải thiện chất lượng chăm sóc. Ngoài ra, các bác sĩ sẽ có nhiều thời gian hơn để tư vấn cho bệnh nhân của họ.’

Tiến sĩ Carlos Wong, Phó Giáo sư Danh dự tại Khoa Y học Gia đình và Chăm sóc Ban đầu, Trường Y học Lâm sàng, HKUMed, nhấn mạnh tầm quan trọng của việc xác thực mô hình với dữ liệu bệnh nhân thực tế, nói rằng, ‘Phù hợp với sự ủng hộ mạnh mẽ của chính phủ về việc áp dụng AI trong chăm sóc sức khỏe, như được minh chứng bằng việc ra mắt gần đây hệ thống viết báo cáo y tế dựa trên LLM trong Cơ quan Bệnh viện, bước tiếp theo của chúng tôi là đánh giá hiệu suất của trợ lý AI này với một lượng lớn dữ liệu bệnh nhân thực tế.’

Tiến sĩ Wong cũng nhấn mạnh tiềm năng để mô hình được triển khai trong các cơ sở lâm sàng và bệnh viện, nói rằng, ‘Sau khi được xác thực, mô hình AI có thể dễ dàng được triển khai trong các cơ sở lâm sàng và bệnh viện thực tế để giúp các bác sĩ lâm sàng cải thiện hiệu quả hoạt động và điều trị.’

Ý Nghĩa Đối Với Thực Hành Lâm Sàng

Sự phát triển của mô hình AI này có ý nghĩa sâu sắc đối với thực hành lâm sàng trong lĩnh vực chẩn đoán và quản lý ung thư tuyến giáp. Bằng cách tự động hóa quá trình phân giai đoạn ung thư và phân loại rủi ro, mô hình có thể giải phóng các bác sĩ lâm sàng để tập trung vào các khía cạnh quan trọng khác của việc chăm sóc bệnh nhân, chẳng hạn như lập kế hoạch điều trị và tư vấn cho bệnh nhân.

Hơn nữa, độ chính xác và độ tin cậy cao của mô hình có thể giúp giảm nguy cơ sai sót và không nhất quán trong quá trình chẩn đoán. Điều này có thể dẫn đến các quyết định điều trị sáng suốt hơn và cải thiện kết quả điều trị cho bệnh nhân.

Mô hình AI cũng có tiềm năng cải thiện khả năng tiếp cận chăm sóc chất lượng cho bệnh nhân ở các khu vực khó khăn. Bằng cách cho phép các bác sĩ lâm sàng chẩn đoán và quản lý ung thư tuyến giáp hiệu quả hơn, mô hình có thể giúp giảm sự khác biệt trong khả năng tiếp cận và kết quả chăm sóc sức khỏe.

Hướng Phát Triển Trong Tương Lai

Nhóm nghiên cứu có kế hoạch tiếp tục tinh chỉnh và cải thiện mô hình AI, tập trung vào việc mở rộng khả năng và nâng cao độ chính xác của nó. Nghiên cứu trong tương lai cũng sẽ khám phá tiềm năng của mô hình để được sử dụng trong các lĩnh vực khác của chẩn đoán và quản lý ung thư.

Ngoài ra, nhóm nghiên cứu có kế hoạch tiến hành các nghiên cứu sâu hơn để đánh giá tác động của mô hình AI đối với thực hành lâm sàng và kết quả điều trị cho bệnh nhân. Những nghiên cứu này sẽ giúp xác định những cách tốt nhất để tích hợp mô hình vào quy trình làm việc lâm sàng và để đảm bảo rằng nó được sử dụng hiệu quả để cải thiện việc chăm sóc bệnh nhân.

Sự phát triển của mô hình AI này đại diện cho một bước tiến quan trọng trong cuộc chiến chống lại ung thư tuyến giáp. Bằng cách khai thác sức mạnh của trí tuệ nhân tạo, các nhà nghiên cứu và bác sĩ lâm sàng đang làm việc để cải thiện độ chính xác, hiệu quả và khả năng tiếp cận của chẩn đoán và quản lý ung thư, cuối cùng dẫn đến kết quả tốt hơn cho bệnh nhân.

Kiểm Tra Chi Tiết Các Thành Phần và Chức Năng Của Mô Hình AI

Kiến trúc của mô hình AI là sự pha trộn tinh vi của một số công nghệ tiên tiến, được thiết kế để mô phỏng và tăng cường các quy trình nhận thức liên quan đến chẩn đoán y tế. Về cốt lõi, mô hình này dựa vào các Mô hình Ngôn ngữ Lớn (LLM), một loại trí tuệ nhân tạo đã chứng minh được khả năng vượt trội trong việc hiểu, giải thích và tạo ra ngôn ngữ của con người. Các LLM này, chẳng hạn như Mistral, Llama, Gemma và Qwen, đóng vai trò là các khối xây dựng nền tảng cho khả năng phân tích của AI.

Vai Trò Của Các Mô Hình Ngôn Ngữ Lớn (LLM)

LLM được đào tạo trên các tập dữ liệu văn bản và mã khổng lồ, cho phép chúng phân biệt các mẫu, mối quan hệ và sắc thái trong dữ liệu. Trong bối cảnh của mô hình AI này, các LLM được giao nhiệm vụ phân tích các tài liệu lâm sàng, bao gồm các báo cáo bệnh lý, ghi chú phẫu thuật và các hồ sơ y tế khác. Các tài liệu này thường chứa ngôn ngữ phức tạp và kỹ thuật, đòi hỏi mức độ hiểu biết cao để trích xuất thông tin liên quan.

Các LLM xử lý văn bản bằng cách chia nó thành các đơn vị nhỏ hơn, chẳng hạn như từ và cụm từ, và sau đó phân tích các mối quan hệ giữa các đơn vị này. Quá trình này bao gồm việc xác định các thực thể chính, chẳng hạn như kích thước khối u, sự tham gia của hạch bạch huyết và di căn xa, những yếu tố rất quan trọng để xác định giai đoạn và loại rủi ro của ung thư.

LLM Mã Nguồn Mở Ngoại Tuyến: Mistral, Llama, Gemma và Qwen

Mô hình AI sử dụng bốn LLM mã nguồn mở ngoại tuyến: Mistral (Mistral AI), Llama (Meta), Gemma (Google) và Qwen (Alibaba). Việc sử dụng nhiều LLM là một quyết định chiến lược nhằm nâng cao tính mạnh mẽ và độ chính xác của mô hình. Mỗi LLM có những điểm mạnh và điểm yếu riêng, và bằng cách kết hợp đầu ra của chúng, mô hình có thể tận dụng trí thông minh tập thể của các hệ thống này.

  • Mistral: Nổi tiếng với hiệu quả và khả năng hoạt động tốt trên nhiều tác vụ khác nhau.
  • Llama: Được thiết kế cho mục đích nghiên cứu, cung cấp một nền tảng vững chắc cho việc hiểu ngôn ngữ.
  • Gemma: Sản phẩm của Google, được biết đến với khả năng tích hợp với các dịch vụ khác của Google và hiệu suất mạnh mẽ trong việc trả lời câu hỏi.
  • Qwen: Được phát triển bởi Alibaba, vượt trội trong việc xử lý các tác vụ ngôn ngữ tiếng Trung phức tạp.

Việc tích hợp các LLM đa dạng này cho phép mô hình AI hưởng lợi từ nhiều quan điểm và cách tiếp cận khác nhau, cuối cùng dẫn đến kết quả chính xác và đáng tin cậy hơn.

Tập Dữ Liệu Đào Tạo: Chương Trình Atlas Bộ Gen Ung Thư (TCGA)

Tập dữ liệu đào tạo của mô hình AI được lấy từ Chương trình Atlas Bộ gen Ung thư (TCGA), một nguồn tài nguyên công cộng toàn diện chứa dữ liệu bộ gen, lâm sàng và bệnh lý cho hàng nghìn bệnh nhân ung thư. Tập dữ liệu TCGA cung cấp một lượng lớn thông tin cần thiết cho việc đào tạo mô hình AI để nhận ra các mẫu và mối quan hệ trong dữ liệu.

Tập dữ liệu đào tạo bao gồm các báo cáo bệnh lý từ 50 bệnh nhân ung thư tuyến giáp. Các báo cáo này chứa thông tin chi tiết về các đặc điểm của khối u, bao gồm kích thước, hình dạng và vị trí của nó, cũng như thông tin về sự hiện diện của bất kỳ bệnh di căn nào. Mô hình AI học cách xác định các đặc điểm này và sử dụng chúng để phân loại giai đoạn và loại rủi ro của ung thư.

Quy Trình Xác Thực: Đảm Bảo Độ Chính Xác và Độ Tin Cậy

Hiệu suất của mô hình AI được xác thực nghiêm ngặt bằng cách sử dụng các báo cáo bệnh lý từ 289 bệnh nhân TCGA và 35 trường hợp giả được tạo bởi các bác sĩ phẫu thuật nội tiết có kinh nghiệm. Quy trình xác thực được thiết kế để đảm bảo rằng mô hình này chính xác và đáng tin cậy trên một loạt các kịch bản lâm sàng đa dạng.

Quy trình xác thực bao gồm việc so sánh các phân loại của mô hình AI với các phân loại được thực hiện bởi các chuyên gia là con người. Độ chính xác của mô hình AI được đo bằng cách tính tỷ lệ phần trăm các trường hợp mà các phân loại của mô hình AI khớp với các phân loại được thực hiện bởi các chuyên gia là con người.

Đạt Được Độ Chính Xác Cao Trong Phân Loại Rủi Ro ATA và Phân Giai Đoạn Ung Thư AJCC

Mô hình AI đạt được độ chính xác tổng thể ấn tượng từ 88,5% đến 100% trong phân loại rủi ro ATA và từ 92,9% đến 98,1% trong phân giai đoạn ung thư AJCC. Các tỷ lệ chính xác cao này chứng minh tiềm năng của AI trong việc chuyển đổi thực hành lâm sàng và cải thiện kết quả điều trị cho bệnh nhân. Khả năng phân loại chính xác giai đoạn ung thư và loại rủi ro của mô hình có thể giúp các bác sĩ lâm sàng đưa ra các quyết định điều trị sáng suốt hơn, dẫn đến kết quả tốt hơn cho bệnh nhân.

Khả Năng Ngoại Tuyến: Đảm Bảo Quyền Riêng Tư Của Bệnh Nhân

Một trong những lợi thế quan trọng nhất của mô hình AI này là khả năng ngoại tuyến của nó. Điều này có nghĩa là mô hình có thể được triển khai cục bộ mà không cần chia sẻ hoặc tải lên thông tin bệnh nhân nhạy cảm. Điều này rất quan trọng để bảo vệ quyền riêng tư của bệnh nhân và đảm bảo tuân thủ các quy định về bảo mật dữ liệu.

Khả năng ngoại tuyến cũng giúp mô hình AI dễ tiếp cận hơn với các bệnh viện và phòng khám trong các môi trường hạn chế về nguồn lực. Các cơ sở này có thể không có băng thông hoặc cơ sở hạ tầng để hỗ trợ các mô hình AI trực tuyến, nhưng họ vẫn có thể hưởng lợi từ các khả năng của mô hình AI bằng cách triển khai nó cục bộ.

So Sánh Với Các LLM Trực Tuyến: DeepSeek và GPT-4o

Nhóm nghiên cứu đã tiến hành các thử nghiệm so sánh với các phiên bản mới nhất của DeepSeek và GPT-4o, hai LLM trực tuyến mạnh mẽ. Kết quả của các thử nghiệm này cho thấy rằng mô hình AI hoạt động ngang bằng với các LLM trực tuyến này, chứng minh khả năng cạnh tranh với các hệ thống AI tốt nhất trên thế giới.

Thực tế là mô hình AI có thể hoạt động ngang bằng với các LLM trực tuyến mà không cần kết nối internet là một lợi thế đáng kể. Điều này làm cho mô hình AI trở nên đáng tin cậy và an toàn hơn, vì nó không phụ thuộc vào các máy chủ hoặc mạng bên ngoài.

Tác Động Chuyển Đổi Đến Hiệu Quả Chăm Sóc Sức Khỏe và Chăm Sóc Bệnh Nhân

Việc tích hợp mô hình AI này vào quy trình làm việc lâm sàng hứa hẹn một sự chuyển đổi đáng kể trong hiệu quả chăm sóc sức khỏe và chăm sóc bệnh nhân. Khả năng tự động hóa quá trình phân giai đoạn ung thư và phân loại rủi ro của mô hình có thể giải phóng các bác sĩ lâm sàng để tập trung vào các khía cạnh quan trọng khác của việc chăm sóc bệnh nhân, chẳng hạn như lập kế hoạch điều trị và tư vấn cho bệnh nhân.

Mô hình AI cũng có thể giúp giảm nguy cơ sai sót và không nhất quán trong quá trình chẩn đoán, dẫn đến các quyết định điều trị sáng suốt hơn và cải thiện kết quả điều trị cho bệnh nhân. Hơn nữa, mô hình có thể cải thiện khả năng tiếp cận chăm sóc chất lượng cho bệnh nhân ở các khu vực khó khăn bằng cách cho phép các bác sĩ lâm sàng chẩn đoán và quản lý ung thư tuyến giáp hiệu quả hơn.

Giải Quyết Các Vấn Đề Đạo Đức và Đảm Bảo Triển Khai AI Có Trách Nhiệm

Cũng như bất kỳ công nghệ AI nào, điều cần thiết là phải giải quyết các vấn đề đạo đức và đảm bảo triển khai AI có trách nhiệm. Nhóm nghiên cứu cam kết phát triển và triển khai mô hình AI theo cách đạo đức, minh bạch và có trách nhiệm giải trình.

Một vấn đề đạo đức quan trọng là đảm bảo rằng mô hình AI không bị thiên vị đối với bất kỳ nhóm bệnh nhân cụ thể nào. Nhóm nghiên cứu đang làm việc để giải quyết vấn đề này bằng cách sử dụng dữ liệu đào tạo đa dạng và bằng cách theo dõi cẩn thận hiệu suất của mô hình trên các quần thể bệnh nhân khác nhau.

Một vấn đề đạo đức khác là đảm bảo rằng bệnh nhân được thông báo về việc sử dụng AI trong quá trình chăm sóc của họ. Nhóm nghiên cứu cam kết cung cấp cho bệnh nhân thông tin rõ ràng và ngắn gọn về cách mô hình AI đang được sử dụng và nó có thể ảnh hưởng đến việc chăm sóc của họ như thế nào.

Nhóm nghiên cứu cũng đang làm việc để đảm bảo rằng mô hình AI được sử dụng theo cách phù hợp với các nguyên tắc đạo đức y học, chẳng hạn như lợi ích, không gây hại, quyền tự chủ và công bằng. Bằng cách tuân thủ các nguyên tắc này, nhóm nghiên cứu có thể giúp đảm bảo rằng mô hình AI được sử dụng để cải thiện việc chăm sóc bệnh nhân và thúc đẩy sự công bằng về sức khỏe.