Araştırmacılar, pankreas kanserini tespit etmek için mevcut yöntemlerden daha iyi performans gösteren gelişmiş makine öğrenimi modelleri geliştirdi.
Belgelenmiş ilk pankreas kanseri vakası 18. yüzyıla kadar uzanmaktadır. O zamandan beri araştırmacılar bu zor ve ölümcül hastalığı anlamak için uzun ve zorlu bir maceraya atılmışlardır. Bugüne kadar erken müdahaleden daha iyi bir kanser tedavisi bulunamamıştır. Ne yazık ki, karnın derinliklerinde yer alan pankreas, erken teşhis için özellikle zor bir bölgedir.
MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı (CSAIL) bilim insanları, Beth Israel Deaconess Tıp Merkezi (BIDMC) Radyasyon Onkolojisi Bölümü’nde çalışan Limor Appelbaum ile birlikte potansiyel yüksek riskli hastaları daha iyi tespit etmek istiyorlardı. Kanserin en yaygın türü olan pankreatik duktal adenokarsinomun (PDAC) erken teşhisi için iki makine öğrenimi modeli geliştirmek üzere yola çıktılar. Ekip, geniş ve çeşitli bir veri tabanına erişmek için, Amerika Birleşik Devletleri’ndeki çeşitli kurumlardan elektronik sağlık kaydı verilerini kullanan bir federe ağ şirketiyle senkronize oldu. Bu geniş veri havuzu, modellerin güvenilirliğini ve genellenebilirliğini sağlamaya yardımcı oldu ve onları çok çeşitli popülasyonlar, coğrafi konumlar ve demografik gruplar arasında uygulanabilir hale getirdi.
İki model – “PRISM” sinir ağı ve lojistik regresyon modeli (olasılık için istatistiksel bir teknik), mevcut yöntemlerden daha iyi performans gösterdi. Ekibin karşılaştırması, standart tarama kriterlerinin beş kat daha yüksek bir bağıl risk eşiği kullanarak PDAC vakalarının yaklaşık yüzde 10’unu tespit ederken, Prism’in aynı eşikte PDAC vakalarının yüzde 35’ini tespit edebildiğini gösterdi.
Kanser riskini tespit etmek için yapay zeka kullanmak yeni bir olgu değil – algoritmalar mamogramları analiz ediyor, akciğer kanseri için BT taramaları yapıyor ve Pap smear testlerinin ve HPV testlerinin analizine yardımcı oluyor. Elektrik mühendisliği ve bilgisayar bilimleri (EECS) alanında MIT doktora öğrencisi, MIT CSAIL üyesi ve eBioMedicine’de yeni çalışmayı özetleyen açık erişimli bir makalenin ilk yazarı olan Kai Jia, “PRISM modelleri, 5 milyondan fazla hastadan oluşan kapsamlı bir veri tabanı üzerinde geliştirilmeleri ve doğrulanmalarıyla öne çıkıyor ve bu alandaki önceki araştırmaların çoğunun ölçeğini aşıyor” diyor. “Model, tahminlerini yapmak için rutin klinik ve laboratuvar verilerini kullanıyor ve ABD nüfusunun çeşitliliği, genellikle ABD’deki birkaç sağlık merkezi gibi belirli coğrafi bölgelerle sınırlı olan diğer PDAC modellerine göre önemli bir ilerleme. Ayrıca, eğitim sürecinde benzersiz bir düzenleme tekniğinin kullanılması, modellerin genelleştirilebilirliğini ve yorumlanabilirliğini artırdı.”
Çalışmada yer almayan Harvard Tıp Fakültesi profesörü ve BIDMC’de kanser merkezi direktörü ve hematoloji ve hematolojik maligniteler şefi David Avigan, “Bu rapor, kanser için risk profillerini belirleme yaklaşımımızı iyileştirmek için büyük veri ve yapay zeka algoritmalarını kullanmak için güçlü bir yaklaşımın ana hatlarını çiziyor” diyor. “Bu yaklaşım, erken müdahale potansiyeli ile odaklanmış taramadan faydalanabilecek yüksek malignite riski taşıyan hastaları belirlemek için yeni stratejilere yol açabilir.”
Prizmatik perspektifler
PRISM’in geliştirilmesine yönelik yolculuk altı yıldan uzun bir süre önce, mevcut tanı uygulamalarının sınırlılıklarına ilişkin ilk elden deneyimlerle başladı. Aynı zamanda Harvard Tıp Fakültesi eğitmeni ve radyasyon onkoloğu olan kıdemli yazar Appelbaum, “Pankreas kanseri hastalarının yaklaşık yüzde 80-85’i, tedavinin artık bir seçenek olmadığı ileri evrelerde teşhis ediliyor” diyor. “Bu klinik hayal kırıklığı, elektronik sağlık kayıtlarında (EHR’ler) bulunan veri zenginliğini araştırma fikrini ateşledi.”
CSAIL grubunun Appelbaum ile yakın işbirliği, sorunun tıbbi ve makine öğrenimi yönlerini daha iyi anlamayı mümkün kıldı ve sonunda çok daha doğru ve şeffaf bir modele yol açtı. “Hipotez, bu kayıtların gizli ipuçları içerdiğiydi – pankreas kanserinin erken uyarı sinyalleri olarak işlev görebilecek ince işaretler ve semptomlar” diye ekliyor. “Bu durum, sağlık hizmetlerinde risk tahmin araçlarının kullanılmasına yönelik ölçeklenebilir bir yaklaşım için bu modelleri geliştirirken birleştirilmiş EHR ağlarını kullanmamıza rehberlik etti.”
Hem PrismNN hem de PrismLR modelleri, PDAC riskini değerlendirmek için hasta demografisi, teşhisler, ilaçlar ve laboratuvar sonuçları dahil olmak üzere EHR verilerini analiz ediyor. PrismNN, yaş, tıbbi geçmiş ve laboratuvar sonuçları gibi veri özelliklerindeki karmaşık örüntüleri tespit etmek için yapay sinir ağlarını kullanarak PDAC olasılığı için bir risk puanı verir. PrismLR daha basit bir analiz için lojistik regresyon kullanır ve bu özelliklere dayanarak PDAC için bir olasılık skoru oluşturur. Modeller birlikte, aynı EHR verilerinden PDAC riskini tahmin etmede farklı yaklaşımların kapsamlı bir değerlendirmesini sunmaktadır.
Ekip, doktorların güvenini kazanmak için en önemli noktalardan birinin, bu alanda yorumlanabilirlik olarak bilinen, modellerin nasıl çalıştığının daha iyi anlaşılması olduğunu belirtiyor. Bilim insanları, lojistik regresyon modellerinin yorumlanması doğal olarak daha kolay olsa da, son gelişmelerin derin sinir ağlarını biraz daha şeffaf hale getirdiğine dikkat çekti. Bu, ekibin tek bir hastanın EHR’sinden elde edilen binlerce potansiyel öngörücü özelliği yaklaşık 85 kritik göstergeye indirgemesine yardımcı oldu. Hastanın yaşı, diyabet teşhisi ve hekime gitme sıklığının artmasını içeren bu göstergeler model tarafından otomatik olarak keşfedilmekle birlikte hekimlerin pankreas kanseriyle ilişkili risk faktörleri anlayışıyla da örtüşmektedir.
İleriye giden yol
PRISM modellerinin vaatlerine rağmen, tüm araştırmalarda olduğu gibi, bazı kısımlar hala devam eden bir çalışmadır. Yalnızca ABD verileri modellerin mevcut kaynağıdır ve küresel kullanım için test ve adaptasyon gerektirmektedir. Ekip, modelin uluslararası veri setlerine uygulanabilirliğinin genişletilmesi ve daha rafine risk değerlendirmesi için ek biyobelirteçlerin entegre edilmesi gerektiğini belirtiyor.
“Bizim için bir sonraki amaç, modellerin rutin sağlık hizmetleri ortamlarında uygulanmasını kolaylaştırmaktır. Vizyonumuz, bu modellerin sağlık sistemlerinin arka planında sorunsuz bir şekilde çalışması, hasta verilerini otomatik olarak analiz etmesi ve doktorları iş yüklerini artırmadan yüksek riskli vakalara karşı uyarmasıdır” diyor Jia. “EHR sistemiyle entegre bir makine öğrenimi modeli, doktorları yüksek riskli hastalar için erken uyarılarla güçlendirebilir ve potansiyel olarak semptomlar ortaya çıkmadan çok önce müdahalelere olanak sağlayabilir. Tüm bireylerin daha uzun ve sağlıklı bir yaşam sürmelerine yardımcı olmak için tekniklerimizi gerçek dünyada uygulamaya hevesliyiz.”
Jia makaleyi Applebaum ve MIT EECS Profesörü ve CSAIL Baş Araştırmacısı Martin Rinard ile birlikte yazdı. Makalede yer alan araştırmacılar MIT CSAIL’de geçirdikleri süre boyunca kısmen Savunma İleri Araştırma Projeleri Ajansı, Boeing, Ulusal Bilim Vakfı ve Aarno Labs tarafından desteklendi. TriNetX proje için kaynak sağlamış ve Prevent Cancer Foundation da ekibi desteklemiştir.
*Bu yazı New hope for early pancreatic cancer intervention via AI-based risk prediction başlıklı yazıdan çevrilmiştir.