AI: Точность > 90% в диагнозе рака щитовидной железы

Революция в диагностике рака щитовидной железы с помощью искусственного интеллекта: точность превышает 90%

Прорыв в медицинской технологии – создание первой в мире модели искусственного интеллекта (AI), способной классифицировать как стадию, так и категорию риска рака щитовидной железы с замечательной точностью, превышающей 90%. Этот инновационный инструмент обещает значительно сократить время подготовки к консультации для врачей первой линии примерно на 50%, что является большим шагом вперед в эффективности и точности диагностики и лечения рака.

Происхождение AI-модели

Разработка этой новаторской AI-модели является результатом совместных усилий междисциплинарной исследовательской группы, состоящей из экспертов факультета медицины им. Ли Ка Шина Гонконгского университета (HKUMed), ИнноХК лаборатории обнаружения данных для здоровья (InnoHK D24H) и Лондонской школы гигиены и тропической медицины (LSHTM). Их выводы, опубликованные в уважаемом журнале npj Digital Medicine, подчеркивают потенциал AI для преобразования клинической практики и улучшения результатов лечения пациентов.

Рак щитовидной железы, распространенное злокачественное новообразование как в Гонконге, так и во всем мире, требует точных стратегий лечения. Успех этих стратегий зависит от двух критических систем:

  • Система стадирования рака Американского объединенного комитета по раку (AJCC) или система “Опухоль-Узел-Метастаз” (TNM): Эта система, в настоящее время в 8-м издании, используется для определения степени и распространения рака.
  • Система классификации риска Американской тиреоидной ассоциации (ATA): Эта система классифицирует риск рецидива или прогрессирования рака.

Эти системы незаменимы для прогнозирования показателей выживаемости пациентов и информирования о решениях о лечении. Однако обычный метод ручной интеграции сложной клинической информации в эти системы часто занимает много времени и подвержен неэффективности.

Как работает AI-помощник

Для решения этих проблем исследовательская группа разработала AI-помощника, который использует большие языковые модели (LLM), аналогичные тем, которые используются в ChatGPT и DeepSeek. Эти LLM предназначены для понимания и обработки человеческого языка, что позволяет им анализировать клинические документы и повышать точность и эффективность стадирования рака щитовидной железы и классификации риска.

AI-модель использует четыре автономные LLM с открытым исходным кодом – Mistral (Mistral AI), Llama (Meta), Gemma (Google) и Qwen (Alibaba) – для анализа клинических документов в свободной форме. Такой подход гарантирует, что модель может обрабатывать широкий спектр клинической информации, включая отчеты о патологических исследованиях, хирургические заметки и другие соответствующие медицинские записи.

Обучение и проверка AI-модели

AI-модель была тщательно обучена с использованием общедоступного набора данных из США, содержащего отчеты о патологических исследованиях 50 пациентов с раком щитовидной железы, полученных из Программы атласа генома рака (TCGA). После этапа обучения производительность модели была тщательно проверена на отчетах о патологических исследованиях 289 пациентов TCGA и 35 псевдослучаях, созданных опытными хирургами-эндокринологами. Этот всесторонний процесс проверки гарантировал, что модель была надежной и надежной в различных клинических сценариях.

Производительность и точность

Объединив выходные данные всех четырех LLM, исследовательская группа значительно улучшила общую производительность AI-модели. Модель достигла впечатляющей общей точности от 88,5% до 100% в классификации риска ATA и от 92,9% до 98,1% в стадировании рака AJCC. Этот уровень точности превосходит традиционные ручные проверки документов, которые часто подвержены человеческим ошибкам и несоответствиям.

Одним из наиболее значительных преимуществ этой AI-модели является ее способность сократить время, которое врачи тратят на подготовку к консультации, примерно на 50%. Эта экономия времени позволяет врачам уделять больше времени непосредственному уходу за пациентами, улучшая общее впечатление пациента и повышая качество ухода.

Ключевые выводы от исследовательской группы

Профессор Джозеф Т. Ву, профессор общественного здравоохранения им. сэра Котеволла и управляющий директор InnoHK D24H в HKUMed, подчеркнул выдающуюся производительность модели, заявив: “Наша модель достигает более 90% точности в классификации стадий рака AJCC и категории риска ATA. Значительным преимуществом этой модели является ее автономная возможность, которая позволит локальное развертывание без необходимости обмена или загрузки конфиденциальной информации о пациентах, тем самым обеспечивая максимальную конфиденциальность пациентов”.

Профессор Ву также подчеркнул способность модели работать наравне с мощными онлайн LLM, такими как DeepSeek и GPT-4o, отметив: “Ввиду недавнего дебюта DeepSeek мы провели дополнительные сравнительные тесты с ‘подходом с нулевым количеством выстрелов’ против последних версий DeepSeek – R1 и V3 – а также GPT-4o. Мы были рады обнаружить, что наша модель работала наравне с этими мощными онлайн LLM”.

Д-р Матрикс Фунг Мэн-хим, клинический доцент и заведующий эндокринной хирургией, отделение хирургии, Школа клинической медицины, HKUMed, подчеркнул практические преимущества модели, заявив: “В дополнение к обеспечению высокой точности извлечения и анализа информации из сложных отчетов о патологических исследованиях, операционных записей и клинических заметок, наша AI-модель также значительно сокращает время подготовки врачей почти наполовину по сравнению с человеческой интерпретацией. Она может одновременно обеспечить стадирование рака и клиническую стратификацию риска на основе двух международно признанных клинических систем”.

Д-р Фунг также подчеркнул универсальность модели и потенциал для широкого внедрения, заявив: “AI-модель универсальна и может быть легко интегрирована в различные настройки в государственном и частном секторах, а также в местные и международные институты здравоохранения и исследований. Мы оптимистичны в отношении того, что реальное внедрение этой AI-модели может повысить эффективность врачей первой линии и улучшить качество ухода. Кроме того, у врачей будет больше времени для консультаций со своими пациентами”.

Д-р Карлос Вонг, почетный доцент отделения семейной медицины и первичной медико-санитарной помощи, Школа клинической медицины, HKUMed, подчеркнул важность проверки модели с данными реальных пациентов, заявив: “В соответствии с сильной поддержкой правительства внедрения AI в здравоохранение, примером чего является недавний запуск системы написания медицинских отчетов на основе LLM в Управлении больниц, нашим следующим шагом является оценка производительности этого AI-помощника с большим количеством данных реальных пациентов”.

Д-р Вонг также подчеркнул потенциал для развертывания модели в клинических условиях и больницах, заявив: “После проверки AI-модель может быть легко развернута в реальных клинических условиях и больницах, чтобы помочь врачам повысить операционную и лечебную эффективность”.

Последствия для клинической практики

Разработка этой AI-модели имеет глубокие последствия для клинической практики в области диагностики и лечения рака щитовидной железы. Автоматизируя процесс стадирования рака и классификации риска, модель может освободить врачей, чтобы они могли сосредоточиться на других критических аспектах ухода за пациентами, таких как планирование лечения и консультирование пациентов.

Более того, высокая точность и надежность модели могут помочь снизить риск ошибок и несоответствий в процессе диагностики. Это может привести к более обоснованным решениям о лечении и улучшению результатов лечения пациентов.

AI-модель также имеет потенциал для улучшения доступа к качественному уходу для пациентов в недостаточно обслуживаемых районах. Позволяя врачам более эффективно диагностировать и лечить рак щитовидной железы, модель может помочь уменьшить различия в доступе к здравоохранению и результатах лечения.

Будущие направления

Исследовательская группа планирует продолжать совершенствовать и улучшать AI-модель, уделяя особое внимание расширению ее возможностей и повышению ее точности. В будущих исследованиях также будет изучен потенциал использования модели в других областях диагностики и лечения рака.

Кроме того, команда планирует провести дальнейшие исследования для оценки влияния AI-модели на клиническую практику и результаты лечения пациентов. Эти исследования помогут определить наилучшие способы интеграции модели в клинические рабочие процессы и обеспечить ее эффективное использование для улучшения ухода за пациентами.

Разработка этой AI-модели представляет собой значительный шаг вперед в борьбе с раком щитовидной железы. Используя возможности искусственного интеллекта, исследователи и врачи работают над повышением точности, эффективности и доступности диагностики и лечения рака, что в конечном итоге приводит к улучшению результатов лечения пациентов.

Подробное изучение компонентов и функциональности AI-модели

Архитектура AI-модели представляет собой сложную смесь нескольких передовых технологий, предназначенных для эмуляции и улучшения когнитивных процессов, связанных с медицинской диагностикой. В своей основе модель опирается на большие языковые модели (LLM), тип искусственного интеллекта, который продемонстрировал замечательную способность понимать, интерпретировать и генерировать человеческий язык. Эти LLM, такие как Mistral, Llama, Gemma и Qwen, служат основой для аналитических возможностей AI.

Роль больших языковых моделей (LLM)

LLM обучаются на огромных наборах текстовых и кодовых данных, что позволяет им различать закономерности, взаимосвязи и нюансы в данных. В контексте этой AI-модели LLM поручено анализировать клинические документы, включая отчеты о патологических исследованиях, хирургические заметки и другие медицинские записи. Эти документы часто содержат сложный и технический язык, требующий высокого уровня понимания для извлечения соответствующей информации.

LLM обрабатывают текст, разбивая его на более мелкие единицы, такие как слова и фразы, а затем анализируя отношения между этими единицами. Этот процесс включает в себя выявление ключевых сущностей, таких как размер опухоли, поражение лимфатических узлов и отдаленные метастазы, которые имеют решающее значение для определения стадии и категории риска рака.

Автономные LLM с открытым исходным кодом: Mistral, Llama, Gemma и Qwen

AI-модель использует четыре автономные LLM с открытым исходным кодом: Mistral (Mistral AI), Llama (Meta), Gemma (Google) и Qwen (Alibaba). Использование нескольких LLM является стратегическим решением, направленным на повышение надежности и точности модели. Каждый LLM имеет свои уникальные сильные и слабые стороны, и, объединяя их выходные данные, модель может использовать коллективный интеллект этих систем.

  • Mistral: Известен своей эффективностью и способностью хорошо выполнять различные задачи.
  • Llama: Разработан для исследовательских целей, обеспечивая прочную основу для понимания языка.
  • Gemma: Предложение Google, известное своей интеграцией с другими сервисами Google и высокой производительностью в ответах на вопросы.
  • Qwen: Разработанный Alibaba, превосходно справляется со сложными задачами китайского языка.

Интеграция этих разнообразных LLM позволяет AI-модели извлекать выгоду из широкого спектра перспектив и подходов, что в конечном итоге приводит к более точным и надежным результатам.

Набор данных для обучения: Программа атласа генома рака (TCGA)

Набор данных для обучения AI-модели получен из Программы атласа генома рака (TCGA), комплексного общедоступного ресурса, содержащего геномные, клинические и патологические данные тысяч пациентов с раком. Набор данных TCGA предоставляет обширную информацию, необходимую для обучения AI-модели распознаванию закономерностей и взаимосвязей в данных.

Набор данных для обучения включает отчеты о патологических исследованиях 50 пациентов с раком щитовидной железы. Эти отчеты содержат подробную информацию о характеристиках опухоли, включая ее размер, форму и местоположение, а также информацию о наличии каких-либо метастатических заболеваний. AI-модель учится определять эти характеристики и использовать их для классификации стадии рака и категории риска.

Процесс проверки: Обеспечение точности и надежности

Производительность AI-модели тщательно проверяется с использованием отчетов о патологических исследованиях 289 пациентов TCGA и 35 псевдослучаев, созданных опытными хирургами-эндокринологами. Процесс проверки предназначен для обеспечения точности и надежности модели в различных клинических сценариях.

Процесс проверки включает сравнение классификаций AI-модели с классификациями, сделанными экспертами-людьми. Точность AI-модели измеряется путем вычисления процента случаев, в которых классификации AI-модели совпадают с классификациями, сделанными экспертами-людьми.

Достижение высокой точности в классификации риска ATA и стадировании рака AJCC

AI-модель достигает впечатляющей общей точности от 88,5% до 100% в классификации риска ATA и от 92,9% до 98,1% в стадировании рака AJCC. Эти высокие показатели точности демонстрируют потенциал AI для преобразования клинической практики и улучшения результатов лечения пациентов. Способность модели точно классифицировать стадии рака и категории риска может помочь врачам принимать более обоснованные решения о лечении, что приведет к лучшим результатам для пациентов.

Автономная возможность: Обеспечение конфиденциальности пациентов

Одним из наиболее значительных преимуществ этой AI-модели является ее автономная возможность. Это означает, что модель может быть развернута локально без необходимости обмена или загрузки конфиденциальной информации о пациентах. Это имеет решающее значение для защиты конфиденциальности пациентов и обеспечения соблюдения правил безопасности данных.

Автономная возможность также делает AI-модель более доступной для больниц и клиник в условиях ограниченных ресурсов. Эти учреждения могут не иметь пропускной способности или инфраструктуры для поддержки онлайн AI-моделей, но они по-прежнему могут извлечь выгоду из возможностей AI-модели, развернув ее локально.

Сравнение с онлайн LLM: DeepSeek и GPT-4o

Исследовательская группа провела сравнительные тесты с последними версиями DeepSeek и GPT-4o, двух мощных онлайн LLM. Результаты этих тестов показали, что AI-модель работала наравне с этими онлайн LLM, демонстрируя свою способность конкурировать с лучшими AI-системами в мире.

Тот факт, что AI-модель может работать наравне с онлайн LLM, не требуя подключения к Интернету, является значительным преимуществом. Это делает AI-модель более надежной и безопасной, поскольку она не зависит от внешних серверов или сетей.

Преобразующее влияние на эффективность здравоохранения и уход за пациентами

Интеграция этой AI-модели в клинические рабочие процессы обещает значительное преобразование в эффективности здравоохранения и уходе за пациентами. Способность модели автоматизировать процесс стадирования рака и классификации риска может освободить врачей, чтобы они могли сосредоточиться на других критических аспектах ухода за пациентами, таких как планирование лечения и консультирование пациентов.

AI-модель также может помочь снизить риск ошибок и несоответствий в процессе диагностики, что приведет к более обоснованным решениям о лечении и улучшению результатов лечения пациентов. Кроме того, модель может улучшить доступ к качественному уходу для пациентов в недостаточно обслуживаемых районах, позволяя врачам более эффективно диагностировать и лечить рак щитовидной железы.

Рассмотрение этических аспектов и обеспечение ответственного внедрения AI

Как и в случае с любой AI-технологией, важно рассмотреть этические аспекты и обеспечить ответственное внедрение AI. Исследовательская группа привержена разработке и развертыванию AI-модели таким образом, чтобы она была этичной, прозрачной и подотчетной.

Одним из ключевых этических соображений является обеспечение того, чтобы AI-модель не была предвзятой по отношению к какой-либо конкретной группе пациентов. Исследовательская группа работает над решением этой проблемы, используя разнообразные данные для обучения и тщательно контролируя производительность модели в различных группах пациентов.

Другим этическим соображением является обеспечение того, чтобы пациенты были проинформированы об использовании AI в их уходе. Исследовательская группа привержена предоставлению пациентам четкой и краткой информации о том, как используется AI-модель и как она может повлиять на их уход.

Исследовательская группа также работает над обеспечением того, чтобы AI-модель использовалась таким образом, который соответствует принципам медицинской этики, таким как благодеяние, непричинение вреда, автономия и справедливость. Придерживаясь этих принципов, исследовательская группа может помочь обеспечить использование AI-модели для улучшения ухода за пациентами и содействия справедливости в здравоохранении.