زمان تخمینی مطالعه: 7 دقیقه
محققان MIT CSAIL مدلهای پیشرفته یادگیری ماشینی را توسعه میدهند که از روشهای فعلی در تشخیص آدنوکارسینوم مجرای پانکراس بهتر عمل میکند. اولین مورد ثبت شده سرطان لوزالمعده به قرن 18 برمیگردد. از آن زمان، محققان یک اودیسه طولانی و چالش برانگیز را برای درک این بیماری گریزان و کشنده انجام دادهاند. تا به امروز، هیچ درمان سرطانی بهتر از مداخله زودهنگام وجود ندارد. متأسفانه، لوزالمعده که در اعماق شکم قرار دارد، به ویژه برای تشخیص زودهنگام گریزان است. با روشهای جدید پیشبینی سرطان با هوش مصنوعی امیدهای جدید برای تشخیص به هنگام این بیماری زنده شده است.
دانشمندان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) به همراه Limor Appelbaum، دانشمند کارکنان بخش انکولوژی تشعشع در مرکز پزشکی Beth Israel Deaconess (BIDMC)، مشتاق بودند تا بیماران بالقوه در معرض خطر را بهتر شناسایی کنند. آنها تصمیم گرفتند دو مدل یادگیری ماشینی را برای تشخیص زودهنگام آدنوکارسینوم مجرای پانکراس (PDAC)، شایع ترین شکل سرطان، توسعه دهند. برای دسترسی به یک پایگاه داده گسترده و متنوع، تیم با استفاده از دادههای پرونده الکترونیک سلامت از موسسات مختلف در سراسر ایالات متحده، با یک شرکت شبکه فدرال همگام شدند. این مجموعه وسیع از دادهها به اطمینان از قابلیت اطمینان و تعمیمپذیری مدلها کمک کرد و آنها را در طیف وسیعی از جمعیتها، مکانهای جغرافیایی و گروههای جمعیتی قابل اجرا کرد.
دو مدل – شبکه عصبی “PRISM” و مدل رگرسیون لجستیک (یک تکنیک آماری برای احتمال) از روشهای فعلی بهتر عمل کردند. مقایسه تیم نشان داد که در حالی که معیارهای غربالگری استاندارد حدود 10 درصد از موارد PDAC را با استفاده از آستانه خطر نسبی 5 برابر بالاتر شناسایی میکنند، Prism میتواند 35 درصد موارد PDAC را در همین آستانه تشخیص دهد.
پیشبینی سرطان با هوش مصنوعی پدیده جدیدی نیست – الگوریتمها ماموگرافی، سی تی اسکن سرطان ریه را تجزیه و تحلیل میکنند و به تجزیه و تحلیل تستهای پاپ اسمیر و تست HPV کمک میکنند. کای جیا، دانشجوی دکترای MIT در رشته مهندسی برق و علوم کامپیوتر (EECS) میگوید: «مدلهای PRISM به دلیل توسعه و اعتبارسنجی آنها در پایگاه داده گسترده بیش از 5 میلیون بیمار، که از مقیاس تحقیقات قبلی در این زمینه فراتر میرود، متمایز هستند. این مدل از دادههای معمول بالینی و آزمایشگاهی برای پیشبینیهای خود استفاده میکند و تنوع جمعیت ایالات متحده یک پیشرفت قابل توجه نسبت به سایر مدلهای PDAC است که معمولاً به مناطق جغرافیایی خاص محدود میشوند. همچنین استفاده از یک تکنیک منظم سازی منحصر به فرد در فرآیند آموزش، تعمیم پذیری و تفسیرپذیری مدل ها را افزایش داد.
دیوید آویگان، استاد دانشکده پزشکی هاروارد و مدیر مرکز سرطان و رئیس هماتولوژی و بدخیمیهای هماتولوژیک در BIDMC میگوید: «این گزارش یک رویکرد قدرتمند برای استفاده از دادههای بزرگ و الگوریتمهای هوش مصنوعی برای اصلاح رویکرد ما در شناسایی پروفایلهای خطر سرطان را تشریح میکند، که در مطالعه شرکت نداشت. این رویکرد ممکن است منجر به راهبردهای جدیدی برای شناسایی بیماران با خطر بالای بدخیمی شود که ممکن است از غربالگری متمرکز با پتانسیل مداخله زودهنگام بهرهمند شوند.
دیدگاههای منشوری
حرکت به سمت توسعه PRISM بیش از شش سال پیش آغاز شد، که توسط تجربیات دست اول با محدودیتهای شیوههای تشخیصی فعلی تقویت شد. Appelbaum، نویسنده ارشد، که همچنین یک مربی دانشکده پزشکی هاروارد و همچنین انکولوژیست پرتودرمانی است، میگوید: «تقریباً 80 تا 85 درصد از بیماران سرطان پانکراس در مراحل پیشرفته تشخیص داده میشوند، جایی که درمان دیگر مطرح نیست». “این ناامیدی بالینی باعث شد تا در انبوهی از دادههای موجود در پرونده الکترونیک سلامت (EHR) تحقیق کنیم.
همکاری نزدیک گروه CSAIL با Appelbaum درک بهتر جنبههای پزشکی و یادگیری ماشینی این مشکل را امکان پذیر کرد و در نهایت منجر به مدلی بسیار دقیقتر و شفاف تر شد. او میافزاید: “فرضیه این بود که این سوابق حاوی سرنخهای پنهانی هستند – علائم و نشانههای ظریفی که میتوانند به عنوان سیگنالهای هشدار دهنده اولیه سرطان پانکراس عمل کنند.” این امر استفاده ما از شبکههای EHR فدرال را در توسعه این مدلها برای یک رویکرد مقیاسپذیر برای به کارگیری ابزارهای پیش بینی خطر در مراقبتهای بهداشتی هدایت کرد.
هر دو مدل PrismNN و PrismLR دادههای EHR، از جمله دموگرافیک بیمار، تشخیصها، داروها، و نتایج آزمایشگاهی را برای ارزیابی خطر PDAC تجزیه و تحلیل میکنند. PrismNN از شبکههای عصبی مصنوعی برای تشخیص الگوهای پیچیده در ویژگیهای داده مانند سن، سابقه پزشکی و نتایج آزمایشگاهی استفاده میکند که امتیاز خطر را برای احتمال PDAC به دست میدهد. PrismLR از رگرسیون لجستیک برای تحلیل سادهتر استفاده میکند و بر اساس این ویژگیها امتیاز احتمالی PDAC را ایجاد میکند. اینها با هم، مدلها ارزیابی کاملی از رویکردهای مختلف در پیشبینی خطر PDAC از دادههای EHR یکسان ارائه میدهند.
این تیم خاطرنشان میکند که یکی از نکات مهم برای جلب اعتماد پزشکان، درک بهتر نحوه عملکرد مدلها است که در این زمینه به عنوان تفسیرپذیر شناخته میشود. دانشمندان اشاره کردند که در حالی مدلهای رگرسیون لجستیک ذاتاً آسانتر تفسیر میشوند، پیشرفتهای اخیر شبکههای عصبی عمیق را تا حدودی شفافتر کرده است. این به تیم کمک کرد تا هزاران ویژگی بالقوه پیشبینیکننده به دست آمده از EHR یک بیمار را به حدود 85 شاخص حیاتی اصلاح کند. این شاخصها که شامل سن بیمار، تشخیص دیابت و افزایش دفعات مراجعه به پزشک میشوند، بهطور خودکار توسط مدل کشف میشوند، اما با درک پزشکان از عوامل خطر مرتبط با سرطان پانکراس مطابقت دارند.
مسیر پیشرو
با وجود وعدههای مدلهای PRISM، مانند تمام تحقیقات، برخی از قطعات هنوز در حال پیشرفت هستند. دادههای ایالات متحده به تنهایی منبع فعلی مدلها هستند که نیاز به آزمایش و سازگاری برای استفاده جهانی دارند. تیم اشاره میکند که مسیر رو به جلو شامل گسترش قابلیت کاربرد مدل در مجموعه دادههای بین المللی و ادغام نشانگرهای زیستی اضافی برای ارزیابی دقیق تر ریسک است. در واقع پیشبینی سرطان با هوش مصنوعی یکی از راههای جدید و کمکی بزرگ در تشخیص به هنگام بیماری ایجاد خواهد کرد.
“هدف بعدی این تحقیق تسهیل پیادهسازی مدلها در محیطهای معمول مراقبتهای بهداشتی است. چشمانداز این است که این مدلها بهطور یکپارچه در پسزمینه سیستمهای مراقبتهای بهداشتی کار کنند، بهطور خودکار دادههای بیمار را تجزیه و تحلیل میکنند و به پزشکان در مورد موارد پرخطر هشدار میدهند بدون اینکه به حجم کاری آنها اضافه شود. یک مدل یادگیری ماشینی ادغام شده با سیستم EHR میتواند پزشکان را با هشدارهای اولیه برای بیماران پرخطر توانمند کند و به طور بالقوه مداخلات را قبل از آشکار شدن علائم ممکن میسازد. ما مشتاق هستیم تا تکنیکهای جدید را در دنیای واقعی به کار ببریم تا به همه افراد کمک کند از زندگی طولانیتر و سالمتری برخوردار شوند.