در دنیای پزشکی، پیشرفتی بیسابقه رخ داده است: نخستین مدل هوش مصنوعی (AI) در جهان با دقت بیش از ۹۰٪ قادر به طبقهبندی مرحله و گروه خطر سرطان تیروئید است. این ابزار نوآورانه وعده میدهد که زمان آمادهسازی پیش از مشاوره برای پزشکان خط مقدم را تقریباً ۵۰٪ کاهش دهد، که نشاندهنده جهشی بزرگ در کارایی و دقت تشخیص و مدیریت سرطان است.
پیدایش مدل هوش مصنوعی
توسعه این مدل هوش مصنوعی پیشگام، نتیجه تلاشهای مشترک یک تیم تحقیقاتی بینرشتهای متشکل از متخصصان دانشکده پزشکی LKS دانشگاه هنگ کنگ (HKUMed)، آزمایشگاه InnoHK برای کشف دادههای سلامت (InnoHK D24H) و دانشکده بهداشت و پزشکی گرمسیری لندن (LSHTM) است. یافتههای آنها، که در مجله معتبر npj Digital Medicine منتشر شده است، پتانسیل هوش مصنوعی را برای متحول کردن عمل بالینی و بهبود نتایج بیماران برجسته میکند.
سرطان تیروئید، یک بدخیمی شایع در هنگ کنگ و سراسر جهان، نیازمند استراتژیهای مدیریتی دقیق است. موفقیت این استراتژیها به دو سیستم حیاتی بستگی دارد:
- کمیته مشترک سرطان آمریکا (AJCC) یا سیستم مرحلهبندی سرطان تومور-گره-متاستاز (TNM): این سیستم که اکنون در نسخه هشتم خود قرار دارد، برای تعیین میزان و گسترش سرطان استفاده میشود.
- سیستم طبقهبندی خطر انجمن تیروئید آمریکا (ATA): این سیستم خطر عود یا پیشرفت سرطان را طبقهبندی میکند.
این سیستمها برای پیشبینی میزان بقای بیمار و اطلاعرسانی به تصمیمات درمانی ضروری هستند. با این حال، روش معمول ادغام دستی اطلاعات بالینی پیچیده در این سیستمها اغلب زمانبر و مستعد ناکارآمدی است.
نحوه کار دستیار هوش مصنوعی
برای رفع این چالشها، تیم تحقیقاتی یک دستیار هوش مصنوعی طراحی کرده است که از مدلهای زبان بزرگ (LLM) مشابه آنچه در ChatGPT و DeepSeek استفاده میشود، استفاده میکند. این LLMها برای درک و پردازش زبان انسانی طراحی شدهاند و آنها را قادر میسازند تا اسناد بالینی را تجزیه و تحلیل کنند و دقت و کارایی مرحلهبندی سرطان تیروئید و طبقهبندی خطر را افزایش دهند.
مدل هوش مصنوعی از چهار LLM آفلاین متنباز - Mistral (Mistral AI)، Llama (Meta)، Gemma (Google) و Qwen (Alibaba) - برای تجزیه و تحلیل اسناد بالینی متن آزاد استفاده میکند. این رویکرد تضمین میکند که مدل میتواند طیف گستردهای از اطلاعات بالینی، از جمله گزارشهای آسیبشناسی، یادداشتهای جراحی و سایر سوابق پزشکی مرتبط را پردازش کند.
آموزش و اعتبارسنجی مدل هوش مصنوعی
مدل هوش مصنوعی با استفاده از یک مجموعه داده متنباز مستقر در ایالات متحده که حاوی گزارشهای آسیبشناسی از ۵۰ بیمار مبتلا به سرطان تیروئید است که از برنامه اطلس ژنوم سرطان (TCGA) تهیه شده است، به دقت آموزش داده شد. پس از مرحله آموزش، عملکرد مدل به طور دقیق در برابر گزارشهای آسیبشناسی از ۲۸۹ بیمار TCGA و ۳۵ مورد شبه ایجاد شده توسط جراحان غدد درونریز با تجربه اعتبارسنجی شد. این فرآیند اعتبارسنجی جامع تضمین کرد که مدل در طیف متنوعی از سناریوهای بالینی قوی و قابل اعتماد است.
عملکرد و دقت
تیم تحقیقاتی با ترکیب خروجی هر چهار LLM، عملکرد کلی مدل هوش مصنوعی را به طور قابل توجهی بهبود بخشید. این مدل به دقت کلی چشمگیر ۸۸.۵٪ تا ۱۰۰٪ در طبقهبندی خطر ATA و ۹۲.۹٪ تا ۹۸.۱٪ در مرحلهبندی سرطان AJCC دست یافت. این سطح از دقت از بررسیهای دستی سنتی اسناد فراتر میرود، که اغلب در معرض خطای انسانی و ناهماهنگی هستند.
یکی از مهمترین مزایای این مدل هوش مصنوعی، توانایی آن در کاهش زمان صرف شده توسط پزشکان برای آمادهسازی پیش از مشاوره به میزان تقریباً ۵۰٪ است. این صرفهجویی در زمان به پزشکان اجازه میدهد تا زمان بیشتری را به مراقبت مستقیم از بیمار اختصاص دهند، تجربه کلی بیمار را بهبود بخشند و کیفیت مراقبت را افزایش دهند.
بینشهای کلیدی از تیم تحقیق
پروفسور جوزف تی وو، پروفسور سر کوتووال در بهداشت عمومی و مدیر عامل InnoHK D24H در HKUMed، با تأکید بر عملکرد برجسته مدل، اظهار داشت: ‘مدل ما در طبقهبندی مراحل سرطان AJCC و دسته خطر ATA به دقت بیش از ۹۰٪ دست مییابد. یک مزیت قابل توجه این مدل، قابلیت آفلاین آن است که امکان استقرار محلی را بدون نیاز به اشتراکگذاری یا بارگذاری اطلاعات حساس بیمار فراهم میکند و در نتیجه حداکثر حریم خصوصی بیمار را فراهم میکند.’
پروفسور وو همچنین توانایی مدل را برای عملکرد همتراز با LLMهای آنلاین قدرتمند مانند DeepSeek و GPT-4o برجسته کرد و خاطرنشان کرد: ‘با توجه به معرفی اخیر DeepSeek، ما آزمایشهای مقایسهای بیشتری را با یک رویکرد ‘رویکرد صفر’ در برابر آخرین نسخههای DeepSeek - R1 و V3 - و همچنین GPT-4o انجام دادیم. ما خوشحال شدیم که مدل ما همتراز با این LLMهای آنلاین قدرتمند عمل کرد.’
دکتر ماتریکس فونگ من هیم، استادیار بالینی و رئیس جراحی غدد درونریز، بخش جراحی، دانشکده پزشکی بالینی، HKUMed، مزایای عملی مدل را برجسته کرد و اظهار داشت: ‘علاوه بر ارائه دقت بالا در استخراج و تجزیه و تحلیل اطلاعات از گزارشهای پیچیده آسیبشناسی، سوابق عمل و یادداشتهای بالینی، مدل هوش مصنوعی ما نیز زمان آمادهسازی پزشکان را در مقایسه با تفسیر انسانی تقریباً به نصف کاهش میدهد. این میتواند به طور همزمان مرحلهبندی سرطان و طبقهبندی خطر بالینی را بر اساس دو سیستم بالینی شناخته شده بینالمللی ارائه دهد.’
دکتر فونگ همچنین بر تطبیقپذیری مدل و پتانسیل آن برای پذیرش گسترده تأکید کرد و اظهار داشت: ‘مدل هوش مصنوعی همهکاره است و میتواند به راحتی در محیطهای مختلف در بخشهای دولتی و خصوصی و موسسات تحقیقاتی و مراقبتهای بهداشتی محلی و بینالمللی ادغام شود. ما خوشبین هستیم که اجرای واقعی این مدل هوش مصنوعی میتواند کارایی پزشکان خط مقدم را افزایش دهد و کیفیت مراقبت را بهبود بخشد. علاوه بر این، پزشکان زمان بیشتری برای مشاوره با بیماران خود خواهند داشت.’
دکتر کارلوس وونگ، استادیار افتخاری گروه پزشکی خانواده و مراقبتهای اولیه، دانشکده پزشکی بالینی، HKUMed، اهمیت اعتبارسنجی مدل با دادههای واقعی بیمار را برجسته کرد و اظهار داشت: ‘در راستای حمایت قاطع دولت از پذیرش هوش مصنوعی در مراقبتهای بهداشتی، همانطور که با راهاندازی اخیر سیستم نوشتن گزارش پزشکی مبتنی بر LLM در سازمان بیمارستانها نشان داده شده است، گام بعدی ما ارزیابی عملکرد این دستیار هوش مصنوعی با مقدار زیادی از دادههای واقعی بیمار است.’
دکتر وونگ همچنین بر پتانسیل استقرار مدل در محیطهای بالینی و بیمارستانها تأکید کرد و اظهار داشت: ‘پس از اعتبارسنجی، مدل هوش مصنوعی میتواند به راحتی در محیطهای بالینی واقعی و بیمارستانها مستقر شود تا به پزشکان در بهبود کارایی عملیاتی و درمانی کمک کند.’
مفاهیم برای عمل بالینی
توسعه این مدل هوش مصنوعی پیامدهای عمیقی برای عمل بالینی در زمینه تشخیص و مدیریت سرطان تیروئید دارد. این مدل با خودکارسازی فرآیند مرحلهبندی سرطان و طبقهبندی خطر، میتواند پزشکان را آزاد کند تا بر سایر جنبههای مهم مراقبت از بیمار، مانند برنامهریزی درمان و مشاوره با بیمار، تمرکز کنند.
علاوه بر این، دقت و قابلیت اطمینان بالای مدل میتواند به کاهش خطر خطاها و ناهماهنگیها در فرآیند تشخیصی کمک کند. این میتواند منجر به تصمیمات درمانی آگاهانهتر و بهبود نتایج بیمار شود.
مدل هوش مصنوعی همچنین این پتانسیل را دارد که دسترسی به مراقبتهای با کیفیت را برای بیماران در مناطق محروم بهبود بخشد. این مدل با قادر ساختن پزشکان برای تشخیص و مدیریت سرطان تیروئید به طور کارآمدتر، میتواند به کاهش نابرابریها در دسترسی و نتایج مراقبتهای بهداشتی کمک کند.
مسیرهای آینده
تیم تحقیقاتی قصد دارد به پالایش و بهبود مدل هوش مصنوعی ادامه دهد، با تمرکز بر گسترش قابلیتهای آن و افزایش دقت آن. تحقیقات آینده همچنین پتانسیل استفاده از مدل در سایر زمینههای تشخیص و مدیریت سرطان را بررسی خواهد کرد.
علاوه بر این، این تیم قصد دارد مطالعات بیشتری را برای ارزیابی تأثیر مدل هوش مصنوعی بر عمل بالینی و نتایج بیمار انجام دهد. این مطالعات به تعیین بهترین راهها برای ادغام مدل در گردشهای کاری بالینی و اطمینان از استفاده موثر از آن برای بهبود مراقبت از بیمار کمک خواهد کرد.
توسعه این مدل هوش مصنوعی نشان دهنده یک گام مهم رو به جلو در مبارزه با سرطان تیروئید است. محققان و پزشکان با بهرهگیری از قدرت هوش مصنوعی، در تلاش هستند تا دقت، کارایی و دسترسی به تشخیص و مدیریت سرطان را بهبود بخشند و در نهایت منجر به نتایج بهتری برای بیماران شوند.
بررسی دقیق اجزا و عملکرد مدل هوش مصنوعی
معماری مدل هوش مصنوعی ترکیبی پیچیده از چندین فناوری پیشرفته است که برای تقلید و افزایش فرآیندهای شناختی درگیر در تشخیص پزشکی طراحی شده است. در هسته خود، مدل به مدلهای زبان بزرگ (LLM) متکی است، نوعی هوش مصنوعی که مهارت قابل توجهی در درک، تفسیر و تولید زبان انسانی نشان داده است. این LLMها، مانند Mistral، Llama، Gemma و Qwen، به عنوان بلوکهای ساختمانی بنیادی برای قابلیتهای تحلیلی هوش مصنوعی عمل میکنند.
نقش مدلهای زبان بزرگ (LLM)
LLMها بر روی مجموعههای داده عظیم متن و کد آموزش داده میشوند و آنها را قادر میسازند تا الگوها، روابط و تفاوتهای ظریف را در دادهها تشخیص دهند. در زمینه این مدل هوش مصنوعی، LLMها وظیفه دارند اسناد بالینی، از جمله گزارشهای آسیبشناسی، یادداشتهای جراحی و سایر سوابق پزشکی را تجزیه و تحلیل کنند. این اسناد اغلب حاوی زبان پیچیده و فنی هستند و برای استخراج اطلاعات مرتبط نیاز به سطح بالایی ازدرک دارند.
LLMها متن را با شکستن آن به واحدهای کوچکتر، مانند کلمات و عبارات، پردازش میکنند و سپس روابط بین این واحدها را تجزیه و تحلیل میکنند. این فرآیند شامل شناسایی موجودیتهای کلیدی، مانند اندازه تومور، درگیری غدد لنفاوی و متاستاز دوردست است که برای تعیین مرحله و گروه خطر سرطان بسیار مهم هستند.
LLMهای آفلاین متنباز: Mistral، Llama، Gemma و Qwen
مدل هوش مصنوعی از چهار LLM آفلاین متنباز استفاده میکند: Mistral (Mistral AI)، Llama (Meta)، Gemma (Google) و Qwen (Alibaba). استفاده از چندین LLM یک تصمیم استراتژیک است که با هدف افزایش استحکام و دقت مدل انجام میشود. هر LLM دارای نقاط قوت و ضعف منحصر به فرد خود است و با ترکیب خروجی آنها، مدل میتواند از هوش جمعی این سیستمها بهرهمند شود.
- Mistral: به دلیل کارایی و توانایی عملکرد خوب در انواع وظایف شناخته شده است.
- Llama: برای اهداف تحقیقاتی طراحی شده است و پایه محکمی برای درک زبان فراهم میکند.
- Gemma: ارائه Google، به دلیل ادغام با سایر خدمات Google و عملکرد قوی در پاسخگویی به سوالات شناخته شده است.
- Qwen: توسط Alibaba توسعه یافته است و در مدیریت وظایف پیچیده زبان چینی عالی است.
ادغام این LLMهای متنوع به مدل هوش مصنوعی اجازه میدهد تا از طیف گستردهای از دیدگاهها و رویکردها بهرهمند شود و در نهایت منجر به نتایج دقیقتر و قابل اطمینانتر شود.
مجموعه داده آموزشی: برنامه اطلس ژنوم سرطان (TCGA)
مجموعه داده آموزشی مدل هوش مصنوعی از برنامه اطلس ژنوم سرطان (TCGA) گرفته شده است، یک منبع عمومی جامع که حاوی دادههای ژنومی، بالینی و پاتولوژیک برای هزاران بیمار مبتلا به سرطان است. مجموعه داده TCGA ثروت اطلاعاتی را فراهم میکند که برای آموزش مدل هوش مصنوعی برای تشخیص الگوها و روابط در دادهها ضروری است.
مجموعه داده آموزشی شامل گزارشهای آسیبشناسی از ۵۰ بیمار مبتلا به سرطان تیروئید است. این گزارشها حاوی اطلاعات دقیق در مورد ویژگیهای تومور، از جمله اندازه، شکل و محل آن، و همچنین اطلاعاتی در مورد وجود هرگونه بیماری متاستاتیک است. مدل هوش مصنوعی یاد میگیرد این ویژگیها را شناسایی کند و از آنها برای طبقهبندی مرحله و گروه خطر سرطان استفاده کند.
فرآیند اعتبارسنجی: تضمین دقت و قابلیت اطمینان
عملکرد مدل هوش مصنوعی با استفاده از گزارشهای آسیبشناسی از ۲۸۹ بیمار TCGA و ۳۵ مورد شبه ایجاد شده توسط جراحان غدد درونریز با تجربه به طور دقیق اعتبارسنجی میشود. فرآیند اعتبارسنجی برای اطمینان از اینکه مدل در طیف متنوعی از سناریوهای بالینی دقیق و قابل اعتماد است، طراحی شده است.
فرآیند اعتبارسنجی شامل مقایسه طبقهبندیهای مدل هوش مصنوعی با طبقهبندیهای انجام شده توسط متخصصان انسانی است. دقت مدل هوش مصنوعی با محاسبه درصد مواردی که در آن طبقهبندیهای مدل هوش مصنوعی با طبقهبندیهای انجام شده توسط متخصصان انسانی مطابقت دارد، اندازهگیری میشود.
دستیابی به دقت بالا در طبقهبندی خطر ATA و مرحلهبندی سرطان AJCC
مدل هوش مصنوعی به دقت کلی چشمگیر ۸۸.۵٪ تا ۱۰۰٪ در طبقهبندی خطر ATA و ۹۲.۹٪ تا ۹۸.۱٪ در مرحلهبندی سرطان AJCC دست مییابد. این نرخهای دقت بالا پتانسیل هوش مصنوعی را برای متحول کردن عمل بالینی و بهبود نتایج بیمار نشان میدهد. توانایی مدل برای طبقهبندی دقیق مراحل سرطان و گروههای خطر میتواند به پزشکان در تصمیمگیریهای درمانی آگاهانهتر کمک کند و منجر به نتایج بهتری برای بیماران شود.
قابلیت آفلاین: تضمین حریم خصوصی بیمار
یکی از مهمترین مزایای این مدل هوش مصنوعی، قابلیت آفلاین آن است. این بدان معناست که مدل میتواند به صورت محلی و بدون نیاز به اشتراکگذاری یا بارگذاری اطلاعات حساس بیمار مستقر شود. این برای محافظت از حریم خصوصی بیمار و اطمینان از رعایت مقررات امنیتی دادهها بسیار مهم است.
قابلیت آفلاین همچنین مدل هوش مصنوعی را برای بیمارستانها و کلینیکها در محیطهای دارای محدودیت منابع در دسترستر میکند. این تسهیلات ممکن است پهنای باند یا زیرساخت لازم برای پشتیبانی از مدلهای هوش مصنوعی آنلاین را نداشته باشند، اما همچنان میتوانند با استقرار محلی آن از قابلیتهای مدل هوش مصنوعی بهرهمند شوند.
مقایسه با LLMهای آنلاین: DeepSeek و GPT-4o
تیم تحقیقاتی آزمایشهای مقایسهای را با آخرین نسخههای DeepSeek و GPT-4o، دو LLM آنلاین قدرتمند انجام داد. نتایج این آزمایشها نشان داد که مدل هوش مصنوعی همتراز با این LLMهای آنلاین عمل میکند و توانایی خود را برای رقابت با بهترین سیستمهای هوش مصنوعی در جهان نشان میدهد.
این واقعیت که مدل هوش مصنوعی میتواند بدون نیاز به اتصال به اینترنت همتراز با LLMهای آنلاین عمل کند، یک مزیت قابل توجه است. این امر مدل هوش مصنوعی را قابل اعتمادتر و ایمنتر میکند، زیرا به سرورها یا شبکههای خارجی وابسته نیست.
تأثیر تحولآفرین بر کارایی مراقبتهای بهداشتی و مراقبت از بیمار
ادغام این مدل هوش مصنوعی در گردشهای کاری بالینی نوید یک تحول چشمگیر در کارایی مراقبتهای بهداشتی و مراقبت از بیمار را میدهد. توانایی مدل برای خودکارسازی فرآیند مرحلهبندی سرطان و طبقهبندی خطر میتواند پزشکان را آزاد کند تا بر سایر جنبههای مهم مراقبت از بیمار، مانند برنامهریزی درمان و مشاوره با بیمار، تمرکز کنند.
مدل هوش مصنوعی همچنین میتواند به کاهش خطر خطاها و ناهماهنگیها در فرآیند تشخیصی کمک کند و منجر به تصمیمات درمانی آگاهانهتر و بهبود نتایج بیمار شود. علاوه بر این، مدل میتواند با قادر ساختن پزشکان برای تشخیص و مدیریت سرطان تیروئید به طور کارآمدتر، دسترسی به مراقبتهای با کیفیت را برای بیماران در مناطق محروم بهبود بخشد.
پرداختن به ملاحظات اخلاقی و تضمین اجرای مسئولانه هوش مصنوعی
مانند هر فناوری هوش مصنوعی، پرداختن به ملاحظات اخلاقی و تضمین اجرای مسئولانه هوش مصنوعی ضروری است. تیم تحقیقاتی متعهد است که مدل هوش مصنوعی را به روشی اخلاقی، شفاف و پاسخگو توسعه و مستقر کند.
یکی از ملاحظات اخلاقی کلیدی، اطمینان از عدم تعصب مدل هوش مصنوعی علیه هیچ گروه خاصی از بیماران است. تیم تحقیقاتی در تلاش است تا با استفاده از دادههای آموزشی متنوع و با نظارت دقیق بر عملکرد مدل در بین جمعیتهای مختلف بیمار، به این موضوع رسیدگی کند.
یکی دیگر از ملاحظات اخلاقی، اطمینان از آگاهی بیماران از استفاده از هوش مصنوعی در مراقبت از آنها است. تیم تحقیقاتی متعهد است که اطلاعات واضح و مختصری در مورد نحوه استفاده از مدل هوش مصنوعی و نحوه تأثیر آن بر مراقبت از آنها در اختیار بیماران قرار دهد.
تیم تحقیقاتی همچنین در تلاش است تا اطمینان حاصل کند که مدل هوش مصنوعی به روشی سازگار با اصول اخلاق پزشکی، مانند نیکوکاری، عدم ضرر، خودمختاری و عدالت استفاده میشود. تیم تحقیقاتی با پایبندی به این اصول، میتواند به اطمینان از استفاده از مدل هوش مصنوعی برای بهبود مراقبت از بیمار و ارتقای برابری سلامت کمک کند.