AI מהפכת באבחון סרטן בלוטת התריס

מהפכת הבינה המלאכותית באבחון סרטן בלוטת התריס: דיוק של מעל 90%

פריצת דרך פורצת גבולות בתחום הטכנולוגיה הרפואית הושגה עם יצירת מודל בינה מלאכותית (AI) ראשון מסוגו בעולם, המסוגל לסווג הן את שלב הסרטן והן את קטגוריית הסיכון של סרטן בלוטת התריס בדיוק מרשים העולה על 90%. כלי חדשני זה מבטיח לקצר משמעותית את זמן ההכנה של אנשי צוות רפואי מן השורה הראשונה לפני התייעצות, בכ-50%, ובכך מסמן קפיצת מדרגה משמעותית ביעילות ובדיוק של אבחון וניהול סרטן.

יצירת מודל הבינה המלאכותית

פיתוח מודל בינה מלאכותית חלוצי זה הוא תוצאה של מאמצים משותפים מצד צוות מחקר בינתחומי המורכב ממומחים מהפקולטה לרפואה LKS של אוניברסיטת הונג קונג (HKUMed), מעבדת InnoHK לגילוי נתונים לבריאות (InnoHK D24H) ובית הספר להיגיינה ורפואה טרופית של לונדון (LSHTM). הממצאים שלהם, שפורסמו בכתב העת היוקרתי npj Digital Medicine, מדגישים את הפוטנציאל של AI לשנות את הפרקטיקה הקלינית ולשפר את תוצאות הטיפול בחולים.

סרטן בלוטת התריס, ממאירות נפוצה הן בהונג קונג והן ברחבי העולם, מחייב אסטרטגיות ניהול מדויקות. הצלחת אסטרטגיות אלה תלויה בשתי מערכות קריטיות:

  • הוועדה האמריקאית המשותפת לסרטן (AJCC) או מערכת דירוג הסרטן Tumor-Node-Metastasis (TNM): מערכת זו, כעת במהדורה השמינית שלה, משמשת לקביעת היקף והתפשטות הסרטן.
  • מערכת סיווג הסיכון של איגוד בלוטת התריס האמריקאי (ATA): מערכת זו מסווגת את הסיכון להישנות או התקדמות הסרטן.

מערכות אלה חיוניות לחיזוי שיעורי ההישרדות של המטופלים וליצירת החלטות טיפוליות מושכלות. עם זאת, השיטה המקובלת של שילוב ידני של מידע קליני מורכב במערכות אלה היא לרוב גוזלת זמן ומועדת לחוסר יעילות.

כיצד פועל עוזר הבינה המלאכותית

כדי להתמודד עם אתגרים אלה, צוות המחקר תכנן עוזר AI הממנף מודלים גדולים של שפה (LLM), בדומה לאלה המשמשים ב-ChatGPT וב-DeepSeek. מודלים אלה של LLM נועדו להבין ולעבד שפה אנושית, ולאפשר להם לנתח מסמכים קליניים ולשפר את הדיוק והיעילות של דירוג סרטן בלוטת התריס וסיווג סיכונים.

מודל הבינה המלאכותית משתמש בארבעה מודלים LLM לא מקוונים בקוד פתוח - Mistral (Mistral AI), Llama (Meta), Gemma (Google) ו-Qwen (Alibaba) - כדי לנתח מסמכים קליניים בטקסט חופשי. גישה זו מבטיחה שהמודל יכול לעבד מגוון רחב של מידע קליני, כולל דוחות פתולוגיים, הערות ניתוח ורשומות רפואיות רלוונטיות אחרות.

הכשרה ואימות של מודל הבינה המלאכותית

מודל הבינה המלאכותית אומן בקפידה באמצעות מערך נתונים מבוסס בארה’ב עם גישה פתוחה, המכיל דוחות פתולוגיים מ-50 חולי סרטן בלוטת התריס שמקורם בתוכנית אטלס הגנום הסרטני (TCGA). לאחר שלב ההכשרה, ביצועי המודל אומתו בקפדנות מול דוחות פתולוגיים מ-289 חולי TCGA ו-35 מקרים פסאודו שנוצרו על ידי מנתחי בלוטת התריס אנדוקריניים מנוסים. תהליך אימות מקיף זה הבטיח שהמודל היה חזק ואמין על פני מגוון מגוון של תרחישים קליניים.

ביצועים ודיוק

על ידי שילוב הפלט של כל ארבעת ה-LLM, צוות המחקר שיפר משמעותית את הביצועים הכוללים של מודל הבינה המלאכותית. המודל השיג דיוק כולל מרשים של 88.5% עד 100% בסיווג סיכון ATA ו-92.9% עד 98.1% בדירוג סרטן AJCC. רמת דיוק זו עולה על זו של סקירות מסמכים ידניות מסורתיות, שלעיתים קרובות כפופות לטעויות אנוש ואי עקביות.

אחד היתרונות המשמעותיים ביותר של מודל בינה מלאכותית זה הוא היכולת שלו להפחית את הזמן שמקדישים רופאים להכנה לפני התייעצות בכ-50%. חיסכון בזמן זה מאפשר לרופאים להקדיש יותר זמן לטיפול ישיר בחולים, לשפר את חוויית המטופל הכוללת ולשפר את איכות הטיפול.

תובנות מרכזיות מצוות המחקר

פרופסור ג’וזף טי וו, פרופסור סר קוטוואל לבריאות הציבור ומנכ’ל InnoHK D24H ב-HKUMed, הדגיש את הביצועים המצוינים של המודל ואמר, “המודל שלנו משיג דיוק של יותר מ-90% בסיווג שלבי סרטן AJCC וקטגוריית סיכון ATA. יתרון משמעותי של מודל זה הוא היכולת הלא מקוונת שלו, שתאפשר פריסה מקומית ללא צורך לשתף או להעלות מידע רגיש על מטופלים, ובכך תספק פרטיות מרבית למטופלים.”

פרופסור וו גם הדגיש את יכולתו של המודל לתפקד ברמה שווה למודלי LLM מקוונים חזקים כמו DeepSeek ו-GPT-4o, וציין, “לאור הופעת הבכורה האחרונה של DeepSeek, ערכנו בדיקות השוואתיות נוספות עם ‘גישת אפס ירייה’ מול הגרסאות העדכניות ביותר של DeepSeek - R1 ו-V3 - כמו גם GPT-4o. שמחנו לגלות שהמודל שלנו פועל ברמה שווה למודלי LLM מקוונים חזקים אלה.”

ד’ר מטריקס פונג מן-הים, פרופסור עוזר קליני ומנהל ניתוחי בלוטת התריס, המחלקה לכירורגיה, בית הספר לרפואה קלינית, HKUMed, הדגיש את היתרונות המעשיים של המודל ואמר, “בנוסף למתן דיוק גבוה בחילוץ וניתוח מידע מדוחות פתולוגיים מורכבים, רישומי פעולות והערות קליניות, מודל ה-AI שלנו גם מקצר באופן דרמטי את זמן ההכנה של הרופאים בכמעט מחצית בהשוואה לפרשנות אנושית. הוא יכול לספק בו זמנית דירוג סרטן וריבוד סיכון קליני המבוסס על שתי מערכות קליניות מוכרות בינלאומית.”

ד’ר פונג גם הדגיש את הרבגוניות של המודל ואת הפוטנציאל שלו לאימוץ נרחב, ואמר, “מודל ה-AI הוא רב-תכליתי וניתן לשלב אותו בקלות במסגרות שונות במגזר הציבורי והפרטי, וגם במכוני מחקר ובריאות מקומיים ובינלאומיים. אנו אופטימיים שהיישום האמיתי של מודל AI זה יכול לשפר את היעילות של אנשי צוות רפואי בחזית ולשפר את איכות הטיפול. בנוסף, לרופאים יהיה יותר זמן להתייעץ עם מטופליהם.”

ד’ר קרלוס וונג, פרופסור חבר של כבוד במחלקה לרפואת משפחה וטיפול ראשוני, בית הספר לרפואה קלינית, HKUMed, הדגיש את החשיבות של אימות המודל עם נתוני מטופלים בעולם האמיתי, ואמר, “בהתאם לתמיכה הנחרצת של הממשלה באימוץ AI בתחום הבריאות, כפי שמודגם על ידי ההשקה האחרונה של מערכת כתיבת דוחות רפואיים מבוססת LLM ברשות בתי החולים, הצעד הבא שלנו הוא להעריך את הביצועים של עוזר AI זה עם כמות גדולה של נתוני מטופלים בעולם האמיתי.”

ד’ר וונג גם הדגיש את הפוטנציאל של המודל להיפרס במסגרות קליניות ובבתי חולים, ואמר, “לאחר האימות, ניתן לפרוס את מודל ה-AI בקלות במסגרות קליניות ובבתי חולים אמיתיים כדי לעזור לרופאים לשפר את היעילות התפעולית והטיפולית.”

השלכות על פרקטיקה קלינית

לפיתוח מודל AI זה יש השלכות עמוקות על פרקטיקה קלינית בתחום אבחון וניהול סרטן בלוטת התריס. על ידי אוטומציה של תהליך דירוג הסרטן וסיווג הסיכונים, המודל יכול לפנות לרופאים זמן להתמקד בהיבטים קריטיים אחרים של טיפול בחולים, כגון תכנון טיפול וייעוץ לחולים.

יתר על כן, הדיוק והאמינות הגבוהים של המודל יכולים לעזור להפחית את הסיכון לטעויות ואי עקביות בתהליך האבחון. זה יכול להוביל להחלטות טיפוליות מושכלות יותר ולתוצאות טיפוליות משופרות.

למודל AI יש גם פוטנציאל לשפר את הגישה לטיפול איכותי עבור חולים באזורים מוחלשים. על ידי מתן אפשרות לרופאים לאבחן ולנהל סרטן בלוטת התריס בצורה יעילה יותר, המודל יכול לעזור להפחית פערים בגישה לשירותי בריאות ובתוצאות.

כיוונים עתידיים

צוות המחקר מתכנן להמשיך ולחדד ולשפר את מודל הבינה המלאכותית, תוך התמקדות בהרחבת היכולות שלו ושיפור הדיוק שלו. מחקר עתידי יבדוק גם את הפוטנציאל של המודל לשימוש בתחומים אחרים של אבחון וניהול סרטן.

בנוסף, הצוות מתכנן לערוך מחקרים נוספים כדי להעריך את ההשפעה של מודל הבינה המלאכותית על פרקטיקה קלינית ותוצאות טיפוליות. מחקרים אלה יעזרו לקבוע את הדרכים הטובות ביותר לשלב את המודל בתהליכי עבודה קליניים ולהבטיח שהוא ישמש ביעילות לשיפור הטיפול בחולים.

פיתוח מודל AI זה מייצג צעד משמעותי קדימה במאבק נגד סרטן בלוטת התריס. על ידי רתימת העוצמה של בינה מלאכותית, חוקרים ורופאים פועלים לשיפור הדיוק, היעילות והנגישות של אבחון וניהול סרטן, ובסופו של דבר מובילים לתוצאות טובות יותר עבור המטופלים.

בחינה מפורטת של רכיבי מודל הבינה המלאכותית ופונקציונליות

ארכיטקטורת מודל ה-AI היא שילוב מתוחכם של מספר טכנולוגיות חדישות, שנועדו לחקות ולשפר את התהליכים הקוגניטיביים הכרוכים באבחון רפואי. בבסיסו, המודל נשען על מודלים שפתיים גדולים (LLM), סוג של בינה מלאכותית שהפגינה מיומנות יוצאת דופן בהבנה, פרשנות ויצירת שפה אנושית. מודלים אלה של LLM, כגון Mistral, Llama, Gemma ו-Qwen, משמשים כאבני הבניין הבסיסיות ליכולות הניתוח של ה-AI.

תפקידם של מודלים שפתיים גדולים (LLM)

מודלים של LLM מאומנים על מערכות נתונים מסיביות של טקסט וקוד, מה שמאפשר להם להבחין בדפוסים, קשרים וניואנסים בתוך הנתונים. בהקשר של מודל AI זה, ה-LLM מוטלים עם ניתוח מסמכים קליניים, כולל דוחות פתולוגיים, הערות ניתוח ורשומות רפואיות אחרות. מסמכים אלה מכילים לעתים קרובות שפה מורכבת וטכנית, הדורשת רמה גבוהה של הבנה כדי לחלץ מידע רלוונטי.

ה-LLM מעבדים את הטקסט על ידי פירוקו ליחידות קטנות יותר, כגון מילים וביטויים, ולאחר מכן ניתוח הקשרים בין יחידות אלה. תהליך זה כולל זיהוי ישויות מפתח, כגון גודל הגידול, מעורבות בלוטות לימפה וגרורות מרוחקות, החיוניות לקביעת שלב הסרטן וקטגוריית הסיכון.

LLM בקוד פתוח לא מקוונים: Mistral, Llama, Gemma ו-Qwen

מודל הבינה המלאכותית משתמש בארבעה מודלים LLM לא מקוונים בקוד פתוח: Mistral (Mistral AI), Llama (Meta), Gemma (Google) ו-Qwen (Alibaba). השימוש במספר LLM הוא החלטה אסטרטגית שמטרתה לשפר את החוסן והדיוק של המודל. לכל LLM יש את החוזקות והחולשות הייחודיות שלו, ועל ידי שילוב הפלטים שלהם, המודל יכול למנף את האינטליגנציה הקולקטיבית של מערכות אלה.

  • Mistral: ידוע ביעילותו וביכולתו לתפקד היטב במגוון משימות.
  • Llama: מיועד למטרות מחקר, ומספק בסיס חזק להבנת שפה.
  • Gemma: ההצעה של גוגל, הידועה בשילובה עם שירותי גוגל אחרים ובביצועים החזקים שלה במענה על שאלות.
  • Qwen: פותח על ידי עליבאבא, מצטיין בטיפול במשימות מורכבות בשפה הסינית.

השילוב של LLM מגוונים אלה מאפשר למודל ה-AI ליהנות ממגוון רחב של נקודות מבט וגישות, ובסופו של דבר מוביל לתוצאות מדויקות ואמינות יותר.

מערך נתונים להכשרה: תוכנית אטלס הגנום הסרטני (TCGA)

מערך הנתונים להכשרה של מודל ה-AI נגזר מתוכנית אטלס הגנום הסרטני (TCGA), משאב ציבורי מקיף המכיל נתונים גנומיים, קליניים ופתולוגיים עבור אלפי חולי סרטן. מערך הנתונים TCGA מספק שפע של מידע החיוני להכשרת מודל ה-AI לזהות דפוסים וקשרים בתוך הנתונים.

מערך הנתונים להכשרה כולל דוחות פתולוגיים מ-50 חולי סרטן בלוטת התריס. דוחות אלה מכילים מידע מפורט על מאפייני הגידול, כולל גודלו, צורתו ומיקומו, כמו גם מידע על נוכחות של מחלה גרורתית כלשהי. מודל הבינה המלאכותית לומד לזהות מאפיינים אלה ולהשתמש בהם לסיווג שלב הסרטן וקטגוריית הסיכון.

תהליך אימות: הבטחת דיוק ואמינות

ביצועי מודל הבינה המלאכותית מאומתים בקפדנות באמצעות דוחות פתולוגיים מ-289 חולי TCGA ו-35 מקרים פסאודו שנוצרו על ידי מנתחי בלוטת התריס אנדוקריניים מנוסים. תהליך האימות נועד להבטיח שהמודל מדויק ואמין על פני מגוון מגוון של תרחישים קליניים.

תהליך האימות כולל השוואת הסיווגים של מודל הבינה המלאכותית עם הסיווגים שבוצעו על ידי מומחים אנושיים. הדיוק של מודל הבינה המלאכותית נמדד על ידי חישוב אחוז המקרים שבהם הסיווגים של מודל הבינה המלאכותית תואמים את הסיווגים שבוצעו על ידי המומחים האנושיים.

השגת דיוק גבוה בסיווג סיכון ATA ובדירוג סרטן AJCC

מודל הבינה המלאכותית משיג דיוק כולל מרשים של 88.5% עד 100% בסיווג סיכון ATA ו-92.9% עד 98.1% בדירוג סרטן AJCC. שיעורי דיוק גבוהים אלה מדגימים את הפוטנציאל של AI לשנות את הפרקטיקה הקלינית ולשפר את תוצאות הטיפול בחולים. היכולת של המודל לסווג במדויק שלבי סרטן וקטגוריות סיכון יכולה לעזור לרופאים לקבל החלטות טיפוליות מושכלות יותר, ולהוביל לתוצאות טובות יותר עבור המטופלים.

יכולת לא מקוונת: הבטחת פרטיות המטופל

אחד היתרונות המשמעותיים ביותר של מודל AI זה הוא היכולת הלא מקוונת שלו. זה אומר שניתן לפרוס את המודל באופן מקומי מבלי צורך לשתף או להעלות מידע רגיש על מטופלים. זה חיוני להגנה על פרטיות המטופל והבטחת ציות לתקנות אבטחת מידע.

היכולת הלא מקוונת גם הופכת את מודל ה-AI לנגיש יותר לבתי חולים ומרפאות במסגרות מוגבלות משאבים. ייתכן שלא למתקנים אלה יש את רוחב הפס או התשתית לתמיכה במודלי AI מקוונים, אך הם עדיין יכולים ליהנות מיכולות מודל ה-AI על ידי פריסתו באופן מקומי.

השוואה עם LLM מקוונים: DeepSeek ו-GPT-4o

צוות המחקר ערך בדיקות השוואתיות עם הגרסאות העדכניות ביותר של DeepSeek ו-GPT-4o, שני LLM מקוונים חזקים. תוצאות בדיקות אלה הראו שמודל הבינה המלאכותית פועל ברמה שווה ל-LLM מקוונים אלה, מה שמדגים את יכולתו להתחרות במערכות ה-AI הטובות ביותר בעולם.

העובדה שמודל הבינה המלאכותית יכול לפעול ברמה שווה ל-LLM מקוונים מבלי לדרוש חיבור לאינטרנט היא יתרון משמעותי. זה הופך את מודל ה-AI לאמין ומאובטח יותר, מכיוון שהוא אינו תלוי בשרתים או ברשתות חיצוניות.

ההשפעה הטרנספורמטיבית על יעילות שירותי הבריאות וטיפול בחולים

שילוב מודל AI זה בתהליכי עבודה קליניים מבטיח שינוי משמעותי ביעילות שירותי הבריאות ובטיפול בחולים. היכולת של המודל לבצע אוטומציה של תהליך דירוג הסרטן וסיווג הסיכונים יכולה לפנות לרופאים זמן להתמקד בהיבטים קריטיים אחרים של טיפול בחולים, כגון תכנון טיפול וייעוץ לחולים.

מודל הבינה המלאכותית יכול גם לעזור להפחית את הסיכון לטעויות ואי עקביות בתהליך האבחון, מה שמוביל להחלטות טיפוליות מושכלות יותר ולתוצאות טיפוליות משופרות. יתר על כן, המודל יכול לשפר את הגישה לטיפול איכותי עבור חולים באזורים מוחלשים על ידי מתן אפשרות לרופאים לאבחן ולנהל סרטן בלוטת התריס בצורה יעילה יותר.

טיפול בשיקולים אתיים והבטחת יישום AI אחראי

כמו בכל טכנולוגיית AI, חיוני לטפל בשיקולים אתיים ולהבטיח יישום AI אחראי. צוות המחקר מחויב לפתח ולפרוס את מודל ה-AI באופן אתי, שקוף ואחראי.

שיקול אתי מרכזי אחד הוא הבטחה שמודל ה-AI אינו מוטה כנגד קבוצה מסוימת של מטופלים. צוות המחקר פועל לטיפול בנושא זה על ידי שימוש בנתונים מגוונים להכשרה ועל ידי ניטור קפדני של ביצועי המודל על פני אוכלוסיות מטופלים שונות.

שיקול אתי נוסף הוא הבטחה שהמטופלים מיודעים לגבי השימוש ב-AI בטיפול שלהם. צוות המחקר מחויב לספק למטופלים מידע ברור ותמציתי על האופן שבו מודל ה-AI משמש וכיצד הוא עשוי להשפיע על הטיפול שלהם.

צוות המחקר פועל גם כדי להבטיח שמודל ה-AI ישמש באופן התואם את עקרונות האתיקה הרפואית, כגון תועלת, אי גרימת נזק, אוטונומיה וצדק. על ידי הקפדה על עקרונות אלה, צוות המחקר יכול לעזור להבטיח שמודל ה-AI ישמש לשיפור הטיפול בחולים וקידום שוויון בריאותי.