انقلاب هوش مصنوعی در تشخیص سرطان تیروئید

در دنیای پزشکی، پیشرفتی بی‌سابقه رخ داده است: نخستین مدل هوش مصنوعی (AI) در جهان با دقت بیش از ۹۰٪ قادر به طبقه‌بندی مرحله و گروه خطر سرطان تیروئید است. این ابزار نوآورانه وعده می‌دهد که زمان آماده‌سازی پیش از مشاوره برای پزشکان خط مقدم را تقریباً ۵۰٪ کاهش دهد، که نشان‌دهنده جهشی بزرگ در کارایی و دقت تشخیص و مدیریت سرطان است.

پیدایش مدل هوش مصنوعی

توسعه این مدل هوش مصنوعی پیشگام، نتیجه تلاش‌های مشترک یک تیم تحقیقاتی بین‌رشته‌ای متشکل از متخصصان دانشکده پزشکی LKS دانشگاه هنگ کنگ (HKUMed)، آزمایشگاه InnoHK برای کشف داده‌های سلامت (InnoHK D24H) و دانشکده بهداشت و پزشکی گرمسیری لندن (LSHTM) است. یافته‌های آنها، که در مجله معتبر npj Digital Medicine منتشر شده است، پتانسیل هوش مصنوعی را برای متحول کردن عمل بالینی و بهبود نتایج بیماران برجسته می‌کند.

سرطان تیروئید، یک بدخیمی شایع در هنگ کنگ و سراسر جهان، نیازمند استراتژی‌های مدیریتی دقیق است. موفقیت این استراتژی‌ها به دو سیستم حیاتی بستگی دارد:

  • کمیته مشترک سرطان آمریکا (AJCC) یا سیستم مرحله‌بندی سرطان تومور-گره-متاستاز (TNM): این سیستم که اکنون در نسخه هشتم خود قرار دارد، برای تعیین میزان و گسترش سرطان استفاده می‌شود.
  • سیستم طبقه‌بندی خطر انجمن تیروئید آمریکا (ATA): این سیستم خطر عود یا پیشرفت سرطان را طبقه‌بندی می‌کند.

این سیستم‌ها برای پیش‌بینی میزان بقای بیمار و اطلاع‌رسانی به تصمیمات درمانی ضروری هستند. با این حال، روش معمول ادغام دستی اطلاعات بالینی پیچیده در این سیستم‌ها اغلب زمان‌بر و مستعد ناکارآمدی است.

نحوه کار دستیار هوش مصنوعی

برای رفع این چالش‌ها، تیم تحقیقاتی یک دستیار هوش مصنوعی طراحی کرده است که از مدل‌های زبان بزرگ (LLM) مشابه آنچه در ChatGPT و DeepSeek استفاده می‌شود، استفاده می‌کند. این LLMها برای درک و پردازش زبان انسانی طراحی شده‌اند و آنها را قادر می‌سازند تا اسناد بالینی را تجزیه و تحلیل کنند و دقت و کارایی مرحله‌بندی سرطان تیروئید و طبقه‌بندی خطر را افزایش دهند.

مدل هوش مصنوعی از چهار LLM آفلاین متن‌باز - Mistral (Mistral AI)، Llama (Meta)، Gemma (Google) و Qwen (Alibaba) - برای تجزیه و تحلیل اسناد بالینی متن آزاد استفاده می‌کند. این رویکرد تضمین می‌کند که مدل می‌تواند طیف گسترده‌ای از اطلاعات بالینی، از جمله گزارش‌های آسیب‌شناسی، یادداشت‌های جراحی و سایر سوابق پزشکی مرتبط را پردازش کند.

آموزش و اعتبارسنجی مدل هوش مصنوعی

مدل هوش مصنوعی با استفاده از یک مجموعه داده متن‌باز مستقر در ایالات متحده که حاوی گزارش‌های آسیب‌شناسی از ۵۰ بیمار مبتلا به سرطان تیروئید است که از برنامه اطلس ژنوم سرطان (TCGA) تهیه شده است، به دقت آموزش داده شد. پس از مرحله آموزش، عملکرد مدل به طور دقیق در برابر گزارش‌های آسیب‌شناسی از ۲۸۹ بیمار TCGA و ۳۵ مورد شبه ایجاد شده توسط جراحان غدد درون‌ریز با تجربه اعتبارسنجی شد. این فرآیند اعتبارسنجی جامع تضمین کرد که مدل در طیف متنوعی از سناریوهای بالینی قوی و قابل اعتماد است.

عملکرد و دقت

تیم تحقیقاتی با ترکیب خروجی هر چهار LLM، عملکرد کلی مدل هوش مصنوعی را به طور قابل توجهی بهبود بخشید. این مدل به دقت کلی چشمگیر ۸۸.۵٪ تا ۱۰۰٪ در طبقه‌بندی خطر ATA و ۹۲.۹٪ تا ۹۸.۱٪ در مرحله‌بندی سرطان AJCC دست یافت. این سطح از دقت از بررسی‌های دستی سنتی اسناد فراتر می‌رود، که اغلب در معرض خطای انسانی و ناهماهنگی هستند.

یکی از مهم‌ترین مزایای این مدل هوش مصنوعی، توانایی آن در کاهش زمان صرف شده توسط پزشکان برای آماده‌سازی پیش از مشاوره به میزان تقریباً ۵۰٪ است. این صرفه‌جویی در زمان به پزشکان اجازه می‌دهد تا زمان بیشتری را به مراقبت مستقیم از بیمار اختصاص دهند، تجربه کلی بیمار را بهبود بخشند و کیفیت مراقبت را افزایش دهند.

بینش‌های کلیدی از تیم تحقیق

پروفسور جوزف تی وو، پروفسور سر کوتووال در بهداشت عمومی و مدیر عامل InnoHK D24H در HKUMed، با تأکید بر عملکرد برجسته مدل، اظهار داشت: ‘مدل ما در طبقه‌بندی مراحل سرطان AJCC و دسته خطر ATA به دقت بیش از ۹۰٪ دست می‌یابد. یک مزیت قابل توجه این مدل، قابلیت آفلاین آن است که امکان استقرار محلی را بدون نیاز به اشتراک‌گذاری یا بارگذاری اطلاعات حساس بیمار فراهم می‌کند و در نتیجه حداکثر حریم خصوصی بیمار را فراهم می‌کند.’

پروفسور وو همچنین توانایی مدل را برای عملکرد همتراز با LLMهای آنلاین قدرتمند مانند DeepSeek و GPT-4o برجسته کرد و خاطرنشان کرد: ‘با توجه به معرفی اخیر DeepSeek، ما آزمایش‌های مقایسه‌ای بیشتری را با یک رویکرد ‘رویکرد صفر’ در برابر آخرین نسخه‌های DeepSeek - R1 و V3 - و همچنین GPT-4o انجام دادیم. ما خوشحال شدیم که مدل ما همتراز با این LLMهای آنلاین قدرتمند عمل کرد.’

دکتر ماتریکس فونگ من هیم، استادیار بالینی و رئیس جراحی غدد درون‌ریز، بخش جراحی، دانشکده پزشکی بالینی، HKUMed، مزایای عملی مدل را برجسته کرد و اظهار داشت: ‘علاوه بر ارائه دقت بالا در استخراج و تجزیه و تحلیل اطلاعات از گزارش‌های پیچیده آسیب‌شناسی، سوابق عمل و یادداشت‌های بالینی، مدل هوش مصنوعی ما نیز زمان آماده‌سازی پزشکان را در مقایسه با تفسیر انسانی تقریباً به نصف کاهش می‌دهد. این می‌تواند به طور همزمان مرحله‌بندی سرطان و طبقه‌بندی خطر بالینی را بر اساس دو سیستم بالینی شناخته شده بین‌المللی ارائه دهد.’

دکتر فونگ همچنین بر تطبیق‌پذیری مدل و پتانسیل آن برای پذیرش گسترده تأکید کرد و اظهار داشت: ‘مدل هوش مصنوعی همه‌کاره است و می‌تواند به راحتی در محیط‌های مختلف در بخش‌های دولتی و خصوصی و موسسات تحقیقاتی و مراقبت‌های بهداشتی محلی و بین‌المللی ادغام شود. ما خوشبین هستیم که اجرای واقعی این مدل هوش مصنوعی می‌تواند کارایی پزشکان خط مقدم را افزایش دهد و کیفیت مراقبت را بهبود بخشد. علاوه بر این، پزشکان زمان بیشتری برای مشاوره با بیماران خود خواهند داشت.’

دکتر کارلوس وونگ، استادیار افتخاری گروه پزشکی خانواده و مراقبت‌های اولیه، دانشکده پزشکی بالینی، HKUMed، اهمیت اعتبارسنجی مدل با داده‌های واقعی بیمار را برجسته کرد و اظهار داشت: ‘در راستای حمایت قاطع دولت از پذیرش هوش مصنوعی در مراقبت‌های بهداشتی، همانطور که با راه‌اندازی اخیر سیستم نوشتن گزارش پزشکی مبتنی بر LLM در سازمان بیمارستان‌ها نشان داده شده است، گام بعدی ما ارزیابی عملکرد این دستیار هوش مصنوعی با مقدار زیادی از داده‌های واقعی بیمار است.’

دکتر وونگ همچنین بر پتانسیل استقرار مدل در محیط‌های بالینی و بیمارستان‌ها تأکید کرد و اظهار داشت: ‘پس از اعتبارسنجی، مدل هوش مصنوعی می‌تواند به راحتی در محیط‌های بالینی واقعی و بیمارستان‌ها مستقر شود تا به پزشکان در بهبود کارایی عملیاتی و درمانی کمک کند.’

مفاهیم برای عمل بالینی

توسعه این مدل هوش مصنوعی پیامدهای عمیقی برای عمل بالینی در زمینه تشخیص و مدیریت سرطان تیروئید دارد. این مدل با خودکارسازی فرآیند مرحله‌بندی سرطان و طبقه‌بندی خطر، می‌تواند پزشکان را آزاد کند تا بر سایر جنبه‌های مهم مراقبت از بیمار، مانند برنامه‌ریزی درمان و مشاوره با بیمار، تمرکز کنند.

علاوه بر این، دقت و قابلیت اطمینان بالای مدل می‌تواند به کاهش خطر خطاها و ناهماهنگی‌ها در فرآیند تشخیصی کمک کند. این می‌تواند منجر به تصمیمات درمانی آگاهانه‌تر و بهبود نتایج بیمار شود.

مدل هوش مصنوعی همچنین این پتانسیل را دارد که دسترسی به مراقبت‌های با کیفیت را برای بیماران در مناطق محروم بهبود بخشد. این مدل با قادر ساختن پزشکان برای تشخیص و مدیریت سرطان تیروئید به طور کارآمدتر، می‌تواند به کاهش نابرابری‌ها در دسترسی و نتایج مراقبت‌های بهداشتی کمک کند.

مسیرهای آینده

تیم تحقیقاتی قصد دارد به پالایش و بهبود مدل هوش مصنوعی ادامه دهد، با تمرکز بر گسترش قابلیت‌های آن و افزایش دقت آن. تحقیقات آینده همچنین پتانسیل استفاده از مدل در سایر زمینه‌های تشخیص و مدیریت سرطان را بررسی خواهد کرد.

علاوه بر این، این تیم قصد دارد مطالعات بیشتری را برای ارزیابی تأثیر مدل هوش مصنوعی بر عمل بالینی و نتایج بیمار انجام دهد. این مطالعات به تعیین بهترین راه‌ها برای ادغام مدل در گردش‌های کاری بالینی و اطمینان از استفاده موثر از آن برای بهبود مراقبت از بیمار کمک خواهد کرد.

توسعه این مدل هوش مصنوعی نشان دهنده یک گام مهم رو به جلو در مبارزه با سرطان تیروئید است. محققان و پزشکان با بهره‌گیری از قدرت هوش مصنوعی، در تلاش هستند تا دقت، کارایی و دسترسی به تشخیص و مدیریت سرطان را بهبود بخشند و در نهایت منجر به نتایج بهتری برای بیماران شوند.

بررسی دقیق اجزا و عملکرد مدل هوش مصنوعی

معماری مدل هوش مصنوعی ترکیبی پیچیده از چندین فناوری پیشرفته است که برای تقلید و افزایش فرآیندهای شناختی درگیر در تشخیص پزشکی طراحی شده است. در هسته خود، مدل به مدل‌های زبان بزرگ (LLM) متکی است، نوعی هوش مصنوعی که مهارت قابل توجهی در درک، تفسیر و تولید زبان انسانی نشان داده است. این LLMها، مانند Mistral، Llama، Gemma و Qwen، به عنوان بلوک‌های ساختمانی بنیادی برای قابلیت‌های تحلیلی هوش مصنوعی عمل می‌کنند.

نقش مدل‌های زبان بزرگ (LLM)

LLMها بر روی مجموعه‌های داده عظیم متن و کد آموزش داده می‌شوند و آنها را قادر می‌سازند تا الگوها، روابط و تفاوت‌های ظریف را در داده‌ها تشخیص دهند. در زمینه این مدل هوش مصنوعی، LLMها وظیفه دارند اسناد بالینی، از جمله گزارش‌های آسیب‌شناسی، یادداشت‌های جراحی و سایر سوابق پزشکی را تجزیه و تحلیل کنند. این اسناد اغلب حاوی زبان پیچیده و فنی هستند و برای استخراج اطلاعات مرتبط نیاز به سطح بالایی ازدرک دارند.

LLMها متن را با شکستن آن به واحدهای کوچکتر، مانند کلمات و عبارات، پردازش می‌کنند و سپس روابط بین این واحدها را تجزیه و تحلیل می‌کنند. این فرآیند شامل شناسایی موجودیت‌های کلیدی، مانند اندازه تومور، درگیری غدد لنفاوی و متاستاز دوردست است که برای تعیین مرحله و گروه خطر سرطان بسیار مهم هستند.

LLMهای آفلاین متن‌باز: Mistral، Llama، Gemma و Qwen

مدل هوش مصنوعی از چهار LLM آفلاین متن‌باز استفاده می‌کند: Mistral (Mistral AI)، Llama (Meta)، Gemma (Google) و Qwen (Alibaba). استفاده از چندین LLM یک تصمیم استراتژیک است که با هدف افزایش استحکام و دقت مدل انجام می‌شود. هر LLM دارای نقاط قوت و ضعف منحصر به فرد خود است و با ترکیب خروجی آنها، مدل می‌تواند از هوش جمعی این سیستم‌ها بهره‌مند شود.

  • Mistral: به دلیل کارایی و توانایی عملکرد خوب در انواع وظایف شناخته شده است.
  • Llama: برای اهداف تحقیقاتی طراحی شده است و پایه محکمی برای درک زبان فراهم می‌کند.
  • Gemma: ارائه Google، به دلیل ادغام با سایر خدمات Google و عملکرد قوی در پاسخگویی به سوالات شناخته شده است.
  • Qwen: توسط Alibaba توسعه یافته است و در مدیریت وظایف پیچیده زبان چینی عالی است.

ادغام این LLMهای متنوع به مدل هوش مصنوعی اجازه می‌دهد تا از طیف گسترده‌ای از دیدگاه‌ها و رویکردها بهره‌مند شود و در نهایت منجر به نتایج دقیق‌تر و قابل اطمینان‌تر شود.

مجموعه داده آموزشی: برنامه اطلس ژنوم سرطان (TCGA)

مجموعه داده آموزشی مدل هوش مصنوعی از برنامه اطلس ژنوم سرطان (TCGA) گرفته شده است، یک منبع عمومی جامع که حاوی داده‌های ژنومی، بالینی و پاتولوژیک برای هزاران بیمار مبتلا به سرطان است. مجموعه داده TCGA ثروت اطلاعاتی را فراهم می‌کند که برای آموزش مدل هوش مصنوعی برای تشخیص الگوها و روابط در داده‌ها ضروری است.

مجموعه داده آموزشی شامل گزارش‌های آسیب‌شناسی از ۵۰ بیمار مبتلا به سرطان تیروئید است. این گزارش‌ها حاوی اطلاعات دقیق در مورد ویژگی‌های تومور، از جمله اندازه، شکل و محل آن، و همچنین اطلاعاتی در مورد وجود هرگونه بیماری متاستاتیک است. مدل هوش مصنوعی یاد می‌گیرد این ویژگی‌ها را شناسایی کند و از آنها برای طبقه‌بندی مرحله و گروه خطر سرطان استفاده کند.

فرآیند اعتبارسنجی: تضمین دقت و قابلیت اطمینان

عملکرد مدل هوش مصنوعی با استفاده از گزارش‌های آسیب‌شناسی از ۲۸۹ بیمار TCGA و ۳۵ مورد شبه ایجاد شده توسط جراحان غدد درون‌ریز با تجربه به طور دقیق اعتبارسنجی می‌شود. فرآیند اعتبارسنجی برای اطمینان از اینکه مدل در طیف متنوعی از سناریوهای بالینی دقیق و قابل اعتماد است، طراحی شده است.

فرآیند اعتبارسنجی شامل مقایسه طبقه‌بندی‌های مدل هوش مصنوعی با طبقه‌بندی‌های انجام شده توسط متخصصان انسانی است. دقت مدل هوش مصنوعی با محاسبه درصد مواردی که در آن طبقه‌بندی‌های مدل هوش مصنوعی با طبقه‌بندی‌های انجام شده توسط متخصصان انسانی مطابقت دارد، اندازه‌گیری می‌شود.

دستیابی به دقت بالا در طبقه‌بندی خطر ATA و مرحله‌بندی سرطان AJCC

مدل هوش مصنوعی به دقت کلی چشمگیر ۸۸.۵٪ تا ۱۰۰٪ در طبقه‌بندی خطر ATA و ۹۲.۹٪ تا ۹۸.۱٪ در مرحله‌بندی سرطان AJCC دست می‌یابد. این نرخ‌های دقت بالا پتانسیل هوش مصنوعی را برای متحول کردن عمل بالینی و بهبود نتایج بیمار نشان می‌دهد. توانایی مدل برای طبقه‌بندی دقیق مراحل سرطان و گروه‌های خطر می‌تواند به پزشکان در تصمیم‌گیری‌های درمانی آگاهانه‌تر کمک کند و منجر به نتایج بهتری برای بیماران شود.

قابلیت آفلاین: تضمین حریم خصوصی بیمار

یکی از مهم‌ترین مزایای این مدل هوش مصنوعی، قابلیت آفلاین آن است. این بدان معناست که مدل می‌تواند به صورت محلی و بدون نیاز به اشتراک‌گذاری یا بارگذاری اطلاعات حساس بیمار مستقر شود. این برای محافظت از حریم خصوصی بیمار و اطمینان از رعایت مقررات امنیتی داده‌ها بسیار مهم است.

قابلیت آفلاین همچنین مدل هوش مصنوعی را برای بیمارستان‌ها و کلینیک‌ها در محیط‌های دارای محدودیت منابع در دسترس‌تر می‌کند. این تسهیلات ممکن است پهنای باند یا زیرساخت لازم برای پشتیبانی از مدل‌های هوش مصنوعی آنلاین را نداشته باشند، اما همچنان می‌توانند با استقرار محلی آن از قابلیت‌های مدل هوش مصنوعی بهره‌مند شوند.

مقایسه با LLMهای آنلاین: DeepSeek و GPT-4o

تیم تحقیقاتی آزمایش‌های مقایسه‌ای را با آخرین نسخه‌های DeepSeek و GPT-4o، دو LLM آنلاین قدرتمند انجام داد. نتایج این آزمایش‌ها نشان داد که مدل هوش مصنوعی همتراز با این LLMهای آنلاین عمل می‌کند و توانایی خود را برای رقابت با بهترین سیستم‌های هوش مصنوعی در جهان نشان می‌دهد.

این واقعیت که مدل هوش مصنوعی می‌تواند بدون نیاز به اتصال به اینترنت همتراز با LLMهای آنلاین عمل کند، یک مزیت قابل توجه است. این امر مدل هوش مصنوعی را قابل اعتمادتر و ایمن‌تر می‌کند، زیرا به سرورها یا شبکه‌های خارجی وابسته نیست.

تأثیر تحول‌آفرین بر کارایی مراقبت‌های بهداشتی و مراقبت از بیمار

ادغام این مدل هوش مصنوعی در گردش‌های کاری بالینی نوید یک تحول چشمگیر در کارایی مراقبت‌های بهداشتی و مراقبت از بیمار را می‌دهد. توانایی مدل برای خودکارسازی فرآیند مرحله‌بندی سرطان و طبقه‌بندی خطر می‌تواند پزشکان را آزاد کند تا بر سایر جنبه‌های مهم مراقبت از بیمار، مانند برنامه‌ریزی درمان و مشاوره با بیمار، تمرکز کنند.

مدل هوش مصنوعی همچنین می‌تواند به کاهش خطر خطاها و ناهماهنگی‌ها در فرآیند تشخیصی کمک کند و منجر به تصمیمات درمانی آگاهانه‌تر و بهبود نتایج بیمار شود. علاوه بر این، مدل می‌تواند با قادر ساختن پزشکان برای تشخیص و مدیریت سرطان تیروئید به طور کارآمدتر، دسترسی به مراقبت‌های با کیفیت را برای بیماران در مناطق محروم بهبود بخشد.

پرداختن به ملاحظات اخلاقی و تضمین اجرای مسئولانه هوش مصنوعی

مانند هر فناوری هوش مصنوعی، پرداختن به ملاحظات اخلاقی و تضمین اجرای مسئولانه هوش مصنوعی ضروری است. تیم تحقیقاتی متعهد است که مدل هوش مصنوعی را به روشی اخلاقی، شفاف و پاسخگو توسعه و مستقر کند.

یکی از ملاحظات اخلاقی کلیدی، اطمینان از عدم تعصب مدل هوش مصنوعی علیه هیچ گروه خاصی از بیماران است. تیم تحقیقاتی در تلاش است تا با استفاده از داده‌های آموزشی متنوع و با نظارت دقیق بر عملکرد مدل در بین جمعیت‌های مختلف بیمار، به این موضوع رسیدگی کند.

یکی دیگر از ملاحظات اخلاقی، اطمینان از آگاهی بیماران از استفاده از هوش مصنوعی در مراقبت از آنها است. تیم تحقیقاتی متعهد است که اطلاعات واضح و مختصری در مورد نحوه استفاده از مدل هوش مصنوعی و نحوه تأثیر آن بر مراقبت از آنها در اختیار بیماران قرار دهد.

تیم تحقیقاتی همچنین در تلاش است تا اطمینان حاصل کند که مدل هوش مصنوعی به روشی سازگار با اصول اخلاق پزشکی، مانند نیکوکاری، عدم ضرر، خودمختاری و عدالت استفاده می‌شود. تیم تحقیقاتی با پایبندی به این اصول، می‌تواند به اطمینان از استفاده از مدل هوش مصنوعی برای بهبود مراقبت از بیمار و ارتقای برابری سلامت کمک کند.