В сложной сети современного здравоохранения коммуникация между специалистами и врачами общей практики имеет первостепенное значение. Тем не менее, узкоспециализированный язык, часто используемый в медицинских записях, может создавать значительные барьеры, особенно при работе со сложными областями, такими как офтальмология. Недавнее исследование изучает потенциальное технологическое решение: использование возможностей искусственного интеллекта, в частности больших языковых моделей (LLM), для перевода насыщенных жаргоном офтальмологических отчетов в четкие, краткие резюме, понятные тем, кто не является специалистом в этой области. Результаты указывают на многообещающий путь для улучшения межклинической коммуникации и потенциального улучшения координации ухода за пациентами, хотя и с важными оговорками относительно точности и надзора.
Проблема специализированной коммуникации
Медицинский мир процветает благодаря точности, что часто приводит к разработке узкоспециализированной терминологии в каждой дисциплине. Хотя это необходимо для детального обсуждения среди коллег, этот специализированный словарь может стать серьезным препятствием, когда информация должна передаваться между различными отделениями или врачам первичной медико-санитарной помощи. Офтальмология, с ее уникальными анатомическими терминами, сложными диагностическими процедурами и специализированными сокращениями, является примером этой проблемы. Осмотр глаз может дать критически важную информацию о системных заболеваниях, выявляя признаки диабета, рассеянного склероза или даже надвигающегося инсульта. Однако, если подробные выводы офтальмолога изложены в терминах, незнакомых принимающему врачу, эти жизненно важные диагностические подсказки рискуют быть упущенными или неверно истолкованными. Потенциальные последствия варьируются от задержки лечения до пропущенных диагнозов, что в конечном итоге влияет на исходы пациентов.
Рассмотрим врача первичной медико-санитарной помощи или госпитального врача, ведущего пациента с множественными проблемами со здоровьем. Они полагаются на отчеты различных специалистов, чтобы составить целостное представление о состоянии пациента. Офтальмологическая запись, наполненная такими акронимами, как ‘Tmax’ (максимальное внутриглазное давление), ‘CCT’ (центральная толщина роговицы) или специфическими сокращениями лекарств, такими как ‘cosopt’ (комбинированный препарат от глаукомы), может сбивать с толку и требовать много времени для расшифровки. Отсутствие немедленной ясности может препятствовать эффективному принятию решений и усложнять обсуждение с пациентом и его семьей значения результатов обследования глаз в более широком контексте их здоровья. Кроме того, ограниченное знакомство многих медицинских работников с офтальмологией во время их обучения – иногда сводящееся всего к нескольким лекциям – усугубляет этот разрыв в понимании.
ИИ входит в кабинет обследования: Исследование ясности
Признавая это узкое место в коммуникации, исследователи предприняли исследование по улучшению качества, чтобы изучить, может ли ИИ служить эффективным переводчиком. Основной вопрос заключался в том, обладает ли современная технология LLM достаточной сложностью, точностью и актуальной базой знаний, необходимой для преобразования сложных офтальмологических записей в универсально понятные резюме. Сможет ли ИИ эффективно преодолеть терминологический разрыв между глазными специалистами и их коллегами в других областях медицины?
Исследование, проведенное в Mayo Clinic с февраля по май 2024 года, включало 20 офтальмологов. Эти специалисты были случайным образом распределены по одному из двух путей после документирования встреч с пациентами. Одна группа отправляла свои стандартные клинические записи непосредственно соответствующим членам команды по уходу (врачам, резидентам, стипендиатам, практикующим медсестрам, ассистентам врачей и вспомогательному медицинскому персоналу). Другая группа сначала обрабатывала свои записи с помощью программы ИИ, предназначенной для создания резюме на простом языке. Эти сгенерированные ИИ резюме проверялись офтальмологом, который мог исправлять фактические ошибки, но ему было предписано не вносить стилистических изменений. Члены команды по уходу, получавшие записи от этой второй группы, получали как оригинальную запись специалиста, так и сгенерированное ИИ резюме на простом языке.
Для оценки эффективности этого вмешательства были распространены опросы среди не-офтальмологических клиницистов и специалистов, получивших эти записи. Всего было собрано 362 ответа, что составляет около 33% ответивших. Примерно половина респондентов просматривала только стандартные записи, в то время как другая половина просматривала как записи, так и резюме ИИ. Опрос был направлен на оценку ясности, понимания, удовлетворенности уровнем детализации и общего предпочтения.
Поразительные результаты: Предпочтение и улучшенное понимание
Отзывы от не-офтальмологических специалистов были в подавляющем большинстве положительными в отношении резюме, созданных с помощью ИИ. Замечательные 85% респондентов указали на предпочтение получать резюме на простом языке вместе с оригинальной записью по сравнению с получением только стандартной записи. Это предпочтение подкреплялось значительными улучшениями в воспринимаемой ясности и понимании.
- Ясность: На вопрос, были ли записи ‘очень ясными’, 62.5% тех, кто получил резюме ИИ, согласились, по сравнению только с 39.5% тех, кто получил стандартные записи – статистически значимая разница (P<0.001). Это говорит о том, что ИИ успешно устранил запутанный жаргон и представил основную информацию более доступно.
- Понимание: Резюме также заметно улучшили понимание. 33% получателей почувствовали, что резюме ИИ улучшило их понимание ‘в значительной степени’, что значительно выше, чем 24%, которые чувствовали то же самое в отношении стандартных записей (P=0.001). Это указывает на то, что резюме не просто упрощали язык, но и активно помогали в осмыслении клинической сути отчета.
- Удовлетворенность детализацией: Интересно, что, несмотря на то, что это были резюме, версии ИИ привели к большей удовлетворенности уровнем предоставленной информации. 63.6% были удовлетворены детализацией в формате резюме ИИ, по сравнению с 42.2% для стандартных записей (P<0.001). Это может указывать на то, что ясность превосходит чистый объем технических данных; хорошее понимание ключевых моментов более удовлетворительно, чем доступ к обширному жаргону, который трудно интерпретировать.
Одно из самых убедительных открытий касалось преодоления разрыва в знаниях. Исследователи заметили, что клиницисты, которые изначально сообщали о дискомфорте с офтальмологической терминологией, получили более значительную пользу от резюме ИИ. Добавление резюме на простом языке резко сократило разницу в понимании между теми, кто чувствовал себя комфортно и некомфортно с глазным жаргоном, уменьшив разрыв с 26.1% до 14.4%. Этот ‘выравнивающий эффект’ наблюдался среди различных профессиональных ролей, включая врачей, медсестер и другой вспомогательный медицинский персонал, подчеркивая потенциал таких инструментов для демократизации понимания в разнообразных медицинских командах. Клиницисты особо отмечали, что резюме ИИ умело определяли акронимы и объясняли специализированные термины, что, в свою очередь, упрощало их последующие беседы с пациентами и семьями о результатах обследования глаз.
Сила простого языка: Пример
Чтобы проиллюстрировать практическую разницу, рассмотрим гипотетический пример, основанный на описаниях исследования. Запись офтальмолога для пациента с первичной открытоугольной глаукомой может выглядеть примерно так:
‘Pt c/o blurred vision. Exam: VA OD 20/40, OS 20/30. IOPs 24 OD, 22 OS (Tmax 28). CCT 540 OU. Gonio: Open angles Gr III OU. ONH: C/D 0.7 OD, 0.6 OS, NRR thinning inf OD > OS. HVF: Sup arcuate defect OD. Plan: Cont Cosopt BID OU. F/U 3 mos. RTC sooner if sx worsen. Discussed SLT option.’
Для неспециалиста это плотный текст с сокращениями (Pt, c/o, VA, OD, OS, IOPs, Tmax, CCT, OU, Gonio, Gr, ONH, C/D, NRR, HVF, Cont, BID, F/U, RTC, sx, SLT) и специфическими показателями, требующими интерпретации.
В отличие от этого, сгенерированное ИИ резюме на простом языке, основанное на описании их функции в исследовании, может выглядеть так:
‘У этого пациента глаукома – состояние, связанное с высоким давлением внутри глаза, которое может повредить зрительный нерв и привести к потере зрения. Сегодняшнее глазное давление было слегка повышено (24 в правом глазу, 22 в левом глазу). Зрительные нервы показывают некоторые признаки повреждения, больше в правом глазу. Тест поля зрения подтвердил некоторую потерю зрения в верхнем периферическом поле зрения правого глаза. Пациент продолжит использовать глазные капли Cosopt дважды в день в оба глаза. Cosopt – это комбинированный препарат, содержащий два лекарства (дорзоламид и тимолол), помогающие снизить глазное давление. Мы обсудили селективную лазерную трабекулопластику (SLT), лазерную процедуру для снижения глазного давления, как вариант на будущее. Пациент должен вернуться для контрольного осмотра через 3 месяца или раньше, если зрение изменится или появятся другие симптомы.’
Эта версия немедленно проясняет диагноз, объясняет цель лекарства (определяя ‘Cosopt’), переводит ключевые выводы в понятные концепции и избегает загадочных сокращений. Эта улучшенная ясность позволяет врачу первичной медико-санитарной помощи или консультирующему врачу быстро понять статус пациента и план офтальмолога.
Опасения по поводу точности и необходимость надзора
Несмотря на подавляюще положительный прием и продемонстрированные преимущества в понимании, исследование также вызвало критическую ноту предостережения относительно точности сгенерированных ИИ резюме. Когда офтальмологи просматривали первоначальные резюме, созданные LLM перед их отправкой, они выявили ошибки в 26% случаев. Хотя подавляющее большинство этих ошибок (83.9%) были классифицированы как имеющие низкий риск причинения вреда пациенту, и, что крайне важно, ни одна не была сочтена представляющей риск серьезного вреда или смерти, эта начальная частота ошибок значительна.
Еще более тревожным является то, что последующий независимый анализ, проведенный внешним офтальмологом, рассмотрел 235 резюме на простом языке после того, как они уже были просмотрены и отредактированы офтальмологами исследования. Этот обзор показал, что 15% резюме все еще содержали ошибки. Эта сохраняющаяся частота ошибок, даже после надзора специалиста, подчеркивает ключевой момент: инструменты ИИ в клинических условиях не могут функционировать автономно без строгого человеческого контроля.
Исследование не углублялось в конкретную природу этих ошибок, что является ограничением. Потенциальные ошибки могут варьироваться от незначительных неточностей в переводе числовых данных, неверной интерпретации серьезности находки, упущения важных нюансов из оригинальной записи или даже введения информации, отсутствующей в исходном тексте (галлюцинации). Хотя профиль риска в этом исследовании казался низким, потенциал для ошибок требует надежных рабочих процессов, включающих обязательный обзор и исправление клиницистом перед тем, как полагаться на сгенерированные ИИ резюме для принятия клинических решений или коммуникации. Также стоит отметить, как указали авторы исследования, ссылаясь на другие исследования, что ошибки не являются исключительной прерогативой ИИ; ошибки могут существовать и существуют в оригинальных записях, составленных клиницистами. Однако введение слоя ИИ добавляет новый потенциальный источник ошибок, которым необходимо управлять.
Мнения специалистов
Офтальмологи, участвовавшие в исследовании, также предоставили обратную связь. На основе 489 ответов на опрос (84% ответивших специалистов), их взгляд на резюме ИИ был в целом положительным, хотя, возможно, и смягченным их осведомленностью о необходимости исправлений.
- Отражение диагноза: Высокий процент, 90%, считали, что резюме на простом языке отражали диагнозы пациента ‘в значительной степени’. Это говорит о том, что ИИ в целом точно улавливал основную клиническую картину с точки зрения специалиста.
- Общая удовлетворенность: 75% ответов офтальмологов указывали на то, что они были ‘очень удовлетворены’ резюме, сгенерированными для их записей (предположительно, после их обзора и исправления).
Хотя они были удовлетворены, усилия, затраченные на просмотр и исправление резюме, не были количественно оценены, но остаются важным фактором для интеграции в рабочий процесс. 15%-ная частота ошибок, обнаруженная даже после их обзора, подчеркивает проблему – специалисты заняты, и надзор, хотя и необходим, должен быть эффективным и надежным.
Более широкие последствия и будущие направления
Это исследование открывает окно в то, как технологии, в частности ИИ, могут быть использованы не для замены человеческого взаимодействия, а для его улучшения путем преодоления коммуникационных барьеров, присущих специализированной медицине. Успех ИИ в переводе сложных офтальмологических записей на простой язык обещает более широкое применение.
- Межклиническая коммуникация: Модель потенциально может быть адаптирована для других узкоспециализированных областей (например, кардиологии, неврологии, патологии), где сложная терминология может препятствовать пониманию неспециалистами, улучшая координацию ухода между дисциплинами.
- Обучение пациентов: Возможно, одним из самых захватывающих потенциальных расширений является использование аналогичных инструментов ИИ для создания понятных для пациентов резюме их собственных записей о визитах. Предоставление пациентам четкой, понятной информации об их состояниях и планах лечения может значительно повысить медицинскую грамотность, способствовать совместному принятию решений и потенциально улучшить приверженность лечению. Представьте себе портал для пациентов, автоматически предоставляющий резюме на простом языке вместе с официальной клинической записью.
Однако исследователи справедливо признали ограничения помимо частоты ошибок. Исследование проводилось в одном академическом центре, что потенциально ограничивает обобщаемость результатов на другие условия практики (например, общественные больницы, частные практики). Демографическая информация об участниках опроса не собиралась, что не позволяет проанализировать, как такие факторы, как стаж работы или конкретные роли, могут влиять на восприятие. Крайне важно, что исследование не отслеживало исходы пациентов, поэтому прямое клиническое значение – привели ли эти улучшенные резюме к лучшим решениям о лечении или результатам для здоровья – остается неизвестным и является жизненно важной областью для будущих исследований.
Путь интеграции ИИ в клинические рабочие процессы явно начался. Это исследование предоставляет убедительные доказательства того, что LLM могут служить мощными инструментами для улучшения ясности коммуникации между медицинскими работниками. Тем не менее, оно также служит мощным напоминанием о том, что технология – это инструмент, а не панацея. Путь вперед требует тщательного внедрения, непрерывной валидации и непоколебимой приверженности человеческому надзору для обеспечения точности и безопасности пациентов. Потенциал для разрушения давних коммуникационных барьеров огромен, но его необходимо реализовывать с усердием и четким пониманием как возможностей, так и ограничений искусственного интеллекта в сложном ландшафте здравоохранения.