ثورة الذكاء الاصطناعي في تشخيص سرطان الغدة الدرقية

ثورة الذكاء الاصطناعي في تشخيص سرطان الغدة الدرقية بدقة تتجاوز 90٪

يمثل ظهور نموذج الذكاء الاصطناعي الأول من نوعه في العالم، القادر على تصنيف كل من مرحلة ومستوى خطر الإصابة بسرطان الغدة الدرقية بدقة ملحوظة تتجاوز 90٪، تطوراً رائداً في التكنولوجيا الطبية. تعد هذه الأداة المبتكرة بتقليل وقت التحضير قبل الاستشارة للأطباء السريريين في الخطوط الأمامية بنسبة 50٪ تقريباً، مما يمثل قفزة كبيرة إلى الأمام في كفاءة ودقة تشخيص السرطان وإدارته.

نشأة نموذج الذكاء الاصطناعي

إن تطوير نموذج الذكاء الاصطناعي الرائد هذا هو نتيجة جهود تعاونية من فريق بحث متعدد التخصصات يضم خبراء من كلية LKS للطب بجامعة هونغ كونغ (HKUMed)، ومختبر InnoHK لاكتشاف البيانات من أجل الصحة (InnoHK D24H)، وكلية لندن للصحة والطب الاستوائي (LSHTM). تسلط نتائجهم، التي نُشرت في المجلة المرموقة npj Digital Medicine، الضوء على إمكانات الذكاء الاصطناعي في إحداث تحول في الممارسة السريرية وتحسين نتائج المرضى.

سرطان الغدة الدرقية، وهو ورم خبيث منتشر في كل من هونغ كونغ والعالم، يستلزم استراتيجيات إدارة دقيقة. يعتمد نجاح هذه الاستراتيجيات على نظامين حاسمين:

  • اللجنة الأمريكية المشتركة لمكافحة السرطان (AJCC) أو نظام تحديد مراحل السرطان Tumor-Node-Metastasis (TNM): يُستخدم هذا النظام، الموجود الآن في نسخته الثامنة، لتحديد مدى انتشار السرطان.
  • النظام الأمريكي لتصنيف مخاطر جمعية الغدة الدرقية (ATA): يصنف هذا النظام خطر تكرار أو تقدم السرطان.

هذه الأنظمة لا غنى عنها للتنبؤ بمعدلات بقاء المرضى على قيد الحياة وإرشاد قرارات العلاج. ومع ذلك، فإن الطريقة التقليدية لدمج المعلومات السريرية المعقدة يدويًا في هذه الأنظمة غالبًا ما تستغرق وقتًا طويلاً وعرضة لأوجه القصور.

كيف يعمل مساعد الذكاء الاصطناعي

لمعالجة هذه التحديات، قام فريق البحث بتصميم مساعد للذكاء الاصطناعي يستفيد من نماذج لغوية كبيرة (LLMs)، على غرار تلك المستخدمة في ChatGPT و DeepSeek. تم تصميم نماذج LLM هذه لفهم ومعالجة اللغة البشرية، مما يمكنها من تحليل الوثائق السريرية وتعزيز دقة وكفاءة تحديد مراحل سرطان الغدة الدرقية وتصنيف المخاطر.

يوظف نموذج الذكاء الاصطناعي أربعة نماذج LLM مفتوحة المصدر غير متصلة بالإنترنت - Mistral (Mistral AI) و Llama (Meta) و Gemma (Google) و Qwen (Alibaba) - لتحليل المستندات السريرية النصية المجانية. يضمن هذا النهج أن النموذج يمكنه معالجة مجموعة واسعة من المعلومات السريرية، بما في ذلك تقارير علم الأمراض والملاحظات الجراحية والسجلات الطبية الأخرى ذات الصلة.

تدريب وتقييم نموذج الذكاء الاصطناعي

تم تدريب نموذج الذكاء الاصطناعي بدقة باستخدام مجموعة بيانات مفتوحة الوصول مقرها الولايات المتحدة تحتوي على تقارير علم الأمراض من 50 مريضًا بسرطان الغدة الدرقية مصدرها برنامج Cancer Genome Atlas (TCGA). بعد مرحلة التدريب، تم التحقق من أداء النموذج بدقة مقابل تقارير علم الأمراض من 289 مريضًا من TCGA و 35 حالة زائفة أنشأها جراحو الغدد الصماء ذوو الخبرة. ضمنت عملية التحقق الشاملة هذه أن النموذج كان قويًا وموثوقًا به عبر مجموعة متنوعة من السيناريوهات السريرية.

الأداء والدقة

من خلال الجمع بين مخرجات جميع نماذج LLM الأربعة، قام فريق البحث بتحسين الأداء العام لنموذج الذكاء الاصطناعي بشكل كبير. حقق النموذج دقة إجمالية مثيرة للإعجاب تتراوح من 88.5٪ إلى 100٪ في تصنيف مخاطر ATA ومن 92.9٪ إلى 98.1٪ في تحديد مراحل سرطان AJCC. يتجاوز هذا المستوى من الدقة مستوى المراجعات اليدوية التقليدية للوثائق، والتي غالبًا ما تخضع للخطأ البشري والتناقضات.

تتمثل إحدى أهم الفوائد التي يوفرها نموذج الذكاء الاصطناعي هذا في قدرته على تقليل الوقت الذي يقضيه الأطباء السريريون في التحضير قبل الاستشارة بنسبة 50٪ تقريبًا. يتيح هذا التوفير في الوقت للأطباء السريريين تخصيص المزيد من الوقت للرعاية المباشرة للمرضى، وتحسين تجربة المريض بشكل عام وتعزيز جودة الرعاية.

رؤى رئيسية من فريق البحث

أكد البروفيسور جوزيف ت. وو، أستاذ سير كوتوال في الصحة العامة والمدير الإداري لـ InnoHK D24H في HKUMed، على الأداء المتميز للنموذج، قائلاً: ‘يحقق نموذجنا دقة تزيد عن 90٪ في تصنيف مراحل سرطان AJCC وفئة مخاطر ATA. إحدى المزايا الهامة لهذا النموذج هي قدرته على العمل دون اتصال بالإنترنت، مما يسمح بالنشر المحلي دون الحاجة إلى مشاركة أو تحميل معلومات حساسة للمرضى، وبالتالي توفير أقصى قدر من الخصوصية للمرضى.’

كما سلط البروفيسور وو الضوء على قدرة النموذج على الأداء على قدم المساواة مع نماذج LLM القوية عبر الإنترنت مثل DeepSeek و GPT-4o، مشيرًا إلى: ‘في ضوء الظهور الأخير لـ DeepSeek، أجرينا المزيد من الاختبارات المقارنة باستخدام ‘نهج اللقطة الصفرية’ مقابل أحدث إصدارات DeepSeek - R1 و V3 - بالإضافة إلى GPT-4o. يسعدنا أن نجد أن نموذجنا يعمل على قدم المساواة مع نماذج LLM القوية هذه عبر الإنترنت.’

أكد الدكتور Matrix Fung Man-him، الأستاذ المساعد السريري ورئيس جراحة الغدد الصماء، قسم الجراحة، كلية الطب السريري، HKUMed، على الفوائد العملية للنموذج، قائلاً: ‘بالإضافة إلى توفير دقة عالية في استخراج وتحليل المعلومات من تقارير علم الأمراض المعقدة وسجلات العمليات والملاحظات السريرية، فإن نموذج الذكاء الاصطناعي الخاص بنا يقلل بشكل كبير من وقت إعداد الأطباء بما يقرب من النصف مقارنة بالتفسير البشري. يمكنه في الوقت نفسه توفير تحديد مراحل السرطان وتصنيف المخاطر السريرية بناءً على نظامين سريريين معترف بهما دوليًا.’

كما أكد الدكتور فونغ على تنوع النموذج وإمكانية اعتماده على نطاق واسع، قائلاً: ‘نموذج الذكاء الاصطناعي متعدد الاستخدامات ويمكن دمجه بسهولة في مختلف الإعدادات في القطاعين العام والخاص، وفي معاهد الرعاية الصحية والبحث المحلية والدولية. نحن متفائلون بأن التنفيذ الواقعي لنموذج الذكاء الاصطناعي هذا يمكن أن يعزز كفاءة الأطباء السريريين في الخطوط الأمامية ويحسن جودة الرعاية. بالإضافة إلى ذلك، سيكون لدى الأطباء المزيد من الوقت لتقديم المشورة لمرضاهم.’

سلط الدكتور كارلوس وونغ، الأستاذ المشارك الفخري في قسم طب الأسرة والرعاية الأولية، كلية الطب السريري، HKUMed، الضوء على أهمية التحقق من صحة النموذج ببيانات المرضى الواقعية، قائلاً: ‘تماشيًا مع دعوة الحكومة القوية لتبني الذكاء الاصطناعي في الرعاية الصحية، كما يتضح من الإطلاق الأخير لنظام كتابة التقارير الطبية المستندة إلى LLM في هيئة المستشفى، فإن خطوتنا التالية هي تقييم أداء مساعد الذكاء الاصطناعي هذا بكمية كبيرة من بيانات المرضى الواقعية.’

كما أكد الدكتور وونغ على إمكانية نشر النموذج في البيئات والمستشفيات السريرية، قائلاً: ‘بمجرد التحقق من صحته، يمكن نشر نموذج الذكاء الاصطناعي بسهولة في البيئات والمستشفيات السريرية الحقيقية لمساعدة الأطباء السريريين على تحسين الكفاءة التشغيلية والعلاجية.’

الآثار المترتبة على الممارسة السريرية

إن لتطوير نموذج الذكاء الاصطناعي هذا آثارًا عميقة على الممارسة السريرية في مجال تشخيص سرطان الغدة الدرقية وإدارته. من خلال أتمتة عملية تحديد مراحل السرطان وتصنيف المخاطر، يمكن للنموذج أن يحرر الأطباء السريريين للتركيز على الجوانب الهامة الأخرى لرعاية المرضى، مثل تخطيط العلاج وتقديم المشورة للمرضى.

علاوة على ذلك، يمكن أن تساعد دقة النموذج العالية وموثوقيته في تقليل خطر الأخطاء والتناقضات في عملية التشخيص. يمكن أن يؤدي ذلك إلى اتخاذ قرارات علاج أكثر استنارة وتحسين نتائج المرضى.

لدى نموذج الذكاء الاصطناعي أيضًا القدرة على تحسين الوصول إلى الرعاية الجيدة للمرضى في المناطق المحرومة. من خلال تمكين الأطباء السريريين من تشخيص سرطان الغدة الدرقية وإدارته بكفاءة أكبر، يمكن للنموذج أن يساعد في تقليل التفاوتات في الوصول إلى الرعاية الصحية والنتائج.

التوجهات المستقبلية

يخطط فريق البحث لمواصلة تحسين نموذج الذكاء الاصطناعي وتحسينه، مع التركيز على توسيع قدراته وتعزيز دقته. ستستكشف الأبحاث المستقبلية أيضًا إمكانات استخدام النموذج في مجالات أخرى من تشخيص السرطان وإدارته.

بالإضافة إلى ذلك، يخطط الفريق لإجراء المزيد من الدراسات لتقييم تأثير نموذج الذكاء الاصطناعي على الممارسة السريرية ونتائج المرضى. ستساعد هذه الدراسات في تحديد أفضل الطرق لدمج النموذج في سير العمل السريري وضمان استخدامه بفعالية لتحسين رعاية المرضى.

يمثل تطوير نموذج الذكاء الاصطناعي هذا خطوة كبيرة إلى الأمام في مكافحة سرطان الغدة الدرقية. من خلال تسخير قوة الذكاء الاصطناعي، يعمل الباحثون والأطباء السريريون على تحسين دقة وكفاءة وسهولة الوصول إلى تشخيص السرطان وإدارته، مما يؤدي في النهاية إلى نتائج أفضل للمرضى.

فحص مفصل لمكونات نموذج الذكاء الاصطناعي ووظائفه

تعد بنية نموذج الذكاء الاصطناعي مزيجًا متطورًا من العديد من التقنيات المتطورة، المصممة لمحاكاة وتعزيز العمليات المعرفية التي تنطوي عليها التشخيصات الطبية. في جوهره، يعتمد النموذج على نماذج لغوية كبيرة (LLMs)، وهو نوع من الذكاء الاصطناعي أظهر كفاءة ملحوظة في فهم وتفسير وإنشاء اللغة البشرية. تعمل نماذج LLM هذه، مثل Mistral و Llama و Gemma و Qwen، بمثابة اللبنات الأساسية لقدرات الذكاء الاصطناعي التحليلية.

دور نماذج اللغة الكبيرة (LLMs)

يتم تدريب نماذج LLM على مجموعات بيانات ضخمة من النصوص والأكواد، مما يمكنها من تمييز الأنماط والعلاقات والفروق الدقيقة داخل البيانات. في سياق نموذج الذكاء الاصطناعي هذا، يتم تكليف نماذج LLM بتحليل المستندات السريرية، بما في ذلك تقارير علم الأمراض والملاحظات الجراحية والسجلات الطبية الأخرى. غالبًا ما تحتوي هذه المستندات على لغة معقدة وتقنية، مما يتطلب مستوى عالٍ من الفهم لاستخراج المعلومات ذات الصلة.

تقوم نماذج LLM بمعالجة النص عن طريق تقسيمه إلى وحدات أصغر، مثل الكلمات والعبارات، ثم تحليل العلاقات بين هذه الوحدات. تتضمن هذه العملية تحديد الكيانات الرئيسية، مثل حجم الورم ومشاركة العقدة الليمفاوية والنقائل البعيدة، والتي تعتبر ضرورية لتحديد مرحلة السرطان وفئة المخاطر.

نماذج LLM مفتوحة المصدر غير متصلة بالإنترنت: Mistral و Llama و Gemma و Qwen

يوظف نموذج الذكاء الاصطناعي أربعة نماذج LLM مفتوحة المصدر غير متصلة بالإنترنت: Mistral (Mistral AI) و Llama (Meta) و Gemma (Google) و Qwen (Alibaba). يعد استخدام نماذج LLM متعددة قرارًا استراتيجيًا يهدف إلى تعزيز قوة النموذج ودقته. يتمتع كل نموذج LLM بنقاط قوة ونقاط ضعف فريدة، ومن خلال الجمع بين مخرجاتها، يمكن للنموذج الاستفادة من الذكاء الجماعي لهذه الأنظمة.

  • Mistral: تشتهر بكفاءتها وقدرتها على الأداء الجيد في مجموعة متنوعة من المهام.
  • Llama: مصمم لأغراض البحث، ويوفر أساسًا قويًا لفهم اللغة.
  • Gemma: عرض Google، المعروف بتكامله مع خدمات Google الأخرى وأدائه القوي في الإجابة على الأسئلة.
  • Qwen: تم تطويره بواسطة Alibaba، وهو متفوق في التعامل مع مهام اللغة الصينية المعقدة.

يتيح تكامل نماذج LLM المتنوعة هذه لنموذج الذكاء الاصطناعي الاستفادة من مجموعة واسعة من وجهات النظر والمناهج، مما يؤدي في النهاية إلى نتائج أكثر دقة وموثوقية.

مجموعة بيانات التدريب: برنامج Cancer Genome Atlas (TCGA)

مجموعة بيانات التدريب الخاصة بنموذج الذكاء الاصطناعي مشتقة من برنامج Cancer Genome Atlas (TCGA)، وهو مورد عام شامل يحتوي على بيانات جينومية وسريرية ومرضية لآلاف مرضى السرطان. توفر مجموعة بيانات TCGA ثروة من المعلومات الضرورية لتدريب نموذج الذكاء الاصطناعي للتعرف على الأنماط والعلاقات داخل البيانات.

تتضمن مجموعة بيانات التدريب تقارير علم الأمراض من 50 مريضًا بسرطان الغدة الدرقية. تحتوي هذه التقارير على معلومات مفصلة حول خصائص الورم، بما في ذلك حجمه وشكله وموقعه، بالإضافة إلى معلومات حول وجود أي مرض نقيلي. يتعلم نموذج الذكاء الاصطناعي تحديد هذه الخصائص واستخدامها لتصنيف مرحلة السرطان وفئة المخاطر.

عملية التحقق: ضمان الدقة والموثوقية

يتم التحقق من أداء نموذج الذكاء الاصطناعي بدقة باستخدام تقارير علم الأمراض من 289 مريضًا من TCGA و 35 حالة زائفة أنشأها جراحو الغدد الصماء ذوو الخبرة. تم تصميم عملية التحقق لضمان أن النموذج دقيق وموثوق به عبر مجموعة متنوعة من السيناريوهات السريرية.

تتضمن عملية التحقق مقارنة تصنيفات نموذج الذكاء الاصطناعي بالتصنيفات التي وضعها الخبراء البشريون. يتم قياس دقة نموذج الذكاء الاصطناعي عن طريق حساب النسبة المئوية للحالات التي تتطابق فيها تصنيفات نموذج الذكاء الاصطناعي مع التصنيفات التي وضعها الخبراء البشريون.

تحقيق دقة عالية في تصنيف مخاطر ATA وتحديد مراحل سرطان AJCC

يحقق نموذج الذكاء الاصطناعي دقة إجمالية مثيرة للإعجاب تتراوح من 88.5٪ إلى 100٪ في تصنيف مخاطر ATA ومن 92.9٪ إلى 98.1٪ في تحديد مراحل سرطان AJCC. توضح معدلات الدقة العالية هذه إمكانات الذكاء الاصطناعي في إحداث تحول في الممارسة السريرية وتحسين نتائج المرضى. يمكن أن تساعد قدرة النموذج على تصنيف مراحل السرطان وفئات المخاطر بدقة الأطباء السريريين على اتخاذ قرارات علاج أكثر استنارة، مما يؤدي إلى نتائج أفضل للمرضى.

القدرة على العمل دون اتصال بالإنترنت: ضمان خصوصية المريض

إحدى أهم المزايا التي يتمتع بها نموذج الذكاء الاصطناعي هذا هي قدرته على العمل دون اتصال بالإنترنت. هذا يعني أنه يمكن نشر النموذج محليًا دون الحاجة إلى مشاركة أو تحميل معلومات حساسة للمرضى. يعد هذا أمرًا بالغ الأهمية لحماية خصوصية المرضى وضمان الامتثال للوائح أمان البيانات.

كما أن القدرة على العمل دون اتصال بالإنترنت تجعل نموذج الذكاء الاصطناعي أكثر سهولة في الوصول إليه للمستشفيات والعيادات في البيئات ذات الموارد المحدودة. قد لا تمتلك هذه المرافق النطاق الترددي أو البنية التحتية لدعم نماذج الذكاء الاصطناعي عبر الإنترنت، ولكن لا يزال بإمكانها الاستفادة من قدرات نموذج الذكاء الاصطناعي عن طريق نشره محليًا.

مقارنة مع نماذج LLM عبر الإنترنت: DeepSeek و GPT-4o

أجرى فريق البحث اختبارات مقارنة مع أحدث إصدارات DeepSeek و GPT-4o، وهما نموذجان قويان للغة الكبيرة عبر الإنترنت. أظهرت نتائج هذه الاختبارات أن نموذج الذكاء الاصطناعي يعمل على قدم المساواة مع نماذج LLM هذه عبر الإنترنت، مما يدل على قدرته على التنافس مع أفضل أنظمة الذكاء الاصطناعي في العالم.

إن حقيقة أن نموذج الذكاء الاصطناعي يمكن أن يعمل على قدم المساواة مع نماذج LLM عبر الإنترنت دون الحاجة إلى اتصال بالإنترنت هي ميزة كبيرة. هذا يجعل نموذج الذكاء الاصطناعي أكثر موثوقية وأمانًا، لأنه لا يعتمد على الخوادم أو الشبكات الخارجية.

التأثير التحويلي على كفاءة الرعاية الصحية ورعاية المرضى

يعد دمج نموذج الذكاء الاصطناعي هذا في سير العمل السريري بتحول كبير في كفاءة الرعاية الصحية ورعاية المرضى. يمكن أن تؤدي قدرة النموذج على أتمتة عملية تحديد مراحل السرطان وتصنيف المخاطر إلى تحرير الأطباء السريريين للتركيز على الجوانب الهامة الأخرى لرعاية المرضى، مثل تخطيط العلاج وتقديم المشورة للمرضى.

يمكن أن يساعد نموذج الذكاء الاصطناعي أيضًا في تقليل خطر الأخطاء والتناقضات في عملية التشخيص، مما يؤدي إلى اتخاذ قرارات علاج أكثر استنارة وتحسين نتائج المرضى. علاوة على ذلك، يمكن للنموذج تحسين الوصول إلى الرعاية الجيدة للمرضى في المناطق المحرومة من خلال تمكين الأطباء السريريين من تشخيص سرطان الغدة الدرقية وإدارته بكفاءة أكبر.

معالجة الاعتبارات الأخلاقية وضمان تنفيذ الذكاء الاصطناعي بشكل مسؤول

كما هو الحال مع أي تقنية ذكاء اصطناعي، من الضروري معالجة الاعتبارات الأخلاقية وضمان تنفيذ الذكاء الاصطناعي بشكل مسؤول. يلتزم فريق البحث بتطوير ونشر نموذج الذكاء الاصطناعي بطريقة أخلاقية وشفافة وخاضعة للمساءلة.

أحد الاعتبارات الأخلاقية الرئيسية هو ضمان عدم تحيز نموذج الذكاء الاصطناعي ضد أي مجموعة معينة من المرضى. يعمل فريق البحث على معالجة هذه المشكلة باستخدام بيانات تدريب متنوعة ومن خلال مراقبة أداء النموذج بعناية عبر مجموعات المرضى المختلفة.

هناك اعتبار أخلاقي آخر يتمثل في ضمان إبلاغ المرضى باستخدام الذكاء الاصطناعي في رعايتهم. يلتزم فريق البحث بتزويد المرضى بمعلومات واضحة وموجزة حول كيفية استخدام نموذج الذكاء الاصطناعي وكيف يمكن أن يؤثر على رعايتهم.

يعمل فريق البحث أيضًا على ضمان استخدام نموذج الذكاء الاصطناعي بطريقة تتفق مع مبادئ الأخلاق الطبية، مثل الإحسان وعدم الإيذاء والاستقلالية والعدالة. من خلال الالتزام بهذه المبادئ، يمكن لفريق البحث المساعدة في ضمان استخدام نموذج الذكاء الاصطناعي لتحسين رعاية المرضى وتعزيز المساواة الصحية.