#20220098 Prediction of New Treatments for Pancreatic Cancer





PROJE KODU20220098
PROJE SAHİBİEce Kobanç
PROJE SAHİBİ LINKEDIN https://www.linkedin.com/in/ecekobanc/
PROJE MALİYETİProjemizde kullandığımız teknolojiler ücretsizdir. Ayrıca projemizde ek olarak donanım ekipmanları kullanmadığımız için projemizin maddi anlamda maliyeti yoktur.
PROJE ÜNİVERSİTESİDokuz Eylül Üniversitesi
PROJE KATEGORİSİToplum ve Sağlık
PROJE DANIŞMANIAssoc. Prof. Dr. Zerrin Işık



Proje belirlendikten sonra proje kapsamında ilk olarak literatür taranmış ve benzer çalışmalar incelenmiştir. Çalışmamızda kullanabileceğimiz araçlar , ortamlar ve programlama dilleri belirlenmiştir. Kullanıcıların verilerini deneyebilmeleri için bir platform seçilmiştir. Daha sonra halka açık NCBI GEO veri setlerinden mikrodizi verileri alınmıştır. Alınan bu veri setleri önce ayrı ayrı analiz edilmiştir. Veri ön işlenme teknikleri ile işlenen edilen veriler kullanılmaya hazır hale getirilmiştir. Veriler içerinden en anlamlı genleri seçebilmek amacıyla verilere p ve t testleri uygulanmıştır. Genlerin fold change değerleri belirlenmiştir. Ayrıca bu aşamada projenin ileri aşamalarında kullanılacağı belirtilen API’lar test edilmiştir. Protein protein etkileşimleri kullanılarak bir ağ oluşturuldu. Bu aşamadan sonra kullanılan algoritma ve tekniklerle DrugBank ve Stitch veri tabanlarından uygun bileşikler tespit edilmiştir. Bu bileşiklerin doğrulanması için Clinical Trials isimli veri tabanının verileri kullanılmıştır. Projede son olarak diğer kullanıcıların da ellerindeki mikro dizi verilerini test edebilmeleri için bir ara yüz oluşturuldu.

Pankreas kanseri, yaklaşık olarak teşhis edilen hastaların %5'inden daha az olan beş yıllık sağkalım oranı ile oldukça kötü bir prognoza sahiptir. Bu prognozun en önemli nedenleri, pankreas kanserinin neredeyse hiçbir klinik semptom olmadan ilerlediği için hastaların yaklaşık %90'ının evre III veya IV'te teşhis edilmesi ve mevcut terapötik seçeneklerin sınırlı olmasıdır. Projenin amacı uygun ön işleme yöntemleri ve biyoinformatik bilimini kullanarak gen ekspresyon profillerinden pankreas için aday ilaçların bulunmasıdır. Proje aynı zamanda elinde pankreas kanseri verisi bulunduran herkesin aday ilaçları arayabilecekleri bir platform da sunmaktadır.

Projenin en özgün yeri ortaya çıkarılan algoritmadan farklı kullanıcıların da yararlanabilmesidir. Proje sonunda kullanıcıların kendi ellerinde bulunan .CEL uzantılı pankreas kanseri mikro dizi verilerinin dosyalarını yükleyerek aday ilaçları aramalarını sağlayan kolay kullanımlı br arayüz içermektedir.

Projenin gerçekleşmesi için mikro array dizilerine ihtiyaç vardı. Bu veri setlerine halka açık olan NCBI GEO veri setlerinden ulaştık. Veri setlerinin işlenmesinde R Studio, R programlama dili, ve R programlama dilinin sağladığı kütüphaneler kullanıldı. Projenin kullanıcılara sunulan ara yüzünde Node.js, HTML, Javascript ve CSS teknolojileri kullanılmıştır. Projede kullanılan teknolojiler günceldir. Sadece proje sonuçları laboratuvar ortamında maddi sebeplerden dolayı test edilemese de Clinical Trials veri setinin, verileri kullanılarak test edilmiştir.

Masataka Kikuyama, Terumi Kamisawa, Sawako Kuruma, Kazuro Chiba, Shinya Kawaguchi, Shuzo Terada &Tatsunori Satoh. (2018). Early Diagnosis to Improve the Poor Prognosis of Pancreatic Cancer. NCBI Hyuna Sung PhD,Jacques Ferlay MSc, ME,Rebecca L. Siegel MPH,Mathieu Laversanne MSc et al. (2021). Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. Volume71, Issue3 Pages 209-249 American Cancer Society. “Key Statistics for Pancreatic Cancer”. Access: 18 November 2021. https://www.cancer.org/cancer/pancreatic-cancer/about/key-statistics.html Prashanth Rawla, Tagore Sunkara & Vinaya Gaduputic. (2019). Epidemiology of Pancreatic Cancer: Global Trends, Etiology and Risk Factors Yanfen Ma, Jian Hu, Ning Zhang, Xinran Dong, Ying Li, Bo Yang, Weidong Tian, Xiaoqin Wang. (2016). Prediction of Candidate Drugs for Treating Pancreatic Cancer by Using a Combined Approach. Retrieved: https://doi.org/10.1371/journal.pone.0149896 Jingqi Chen, Ming Ma, Ning Shen, Jianzhong Jeff Xi, and Weidong Tian. (2013). Integration of Cancer Gene Co-expression Network and Metabolic Network To Uncover Potential Cancer Drug Targets. Yanfen Ma, Jian Hu, Ning Zhang, Xinran Dong, Ying Li, Bo Yang, Weidong Tian, Xiaoqin Wang. (2016). Prediction of Candidate Drugs for Treating Pancreatic Cancer by Using a Combined Approach. Retrieved: https://doi.org/10.1371/journal.pone.0149896 Gregory Glennon. (2000). High-throughput gene expression analysis for drug discovery. Volume 5, Issue 2, 1 February 2000, Pages 59-66. Retrieved: https://doi.org/10.1016/S1359-6446(99)01448-8 Justin Lamb, Emily D. Crawford, Davıd Peck, Joshua W. Modell, Irene C. Blat, Matthew J. Wrobel, Jim Lerner, Jean-Philippe Brunet, Aravind Subramanian, Kenneth N. Ross, Michael Reich, Haley Hıeronymus, Guo Wei, Scott A. Armstrong, Stephen J. Haggarty, Paul A. Clemons, Ru Wei, Steven A. Carr, Erıc S. Lander, Todd R. Golub. (2006). The Connectivity Map: Using Gene-Expression Signatures to Connect Small Molecules, Genes, and Disease. Vol 313, Issue 5795 pp. 1929-1935. DOI: 10.1126/science.1132939 Retrieved: https://www.science.org/doi/10.1126/science.1132939 Hollander M, Wolfe DA, Chicken E (2013) Nonparametric statistical methods: John Wiley & Sons. Kim JJ, Kurita T, Bulun SE. (2013). Progesterone action in endometrial cancer, endometriosis, uterine fibroids, and breast cancer. Endocrine Reviews, Volume 34, Issue 1, 1 February 2013, Pages 130–162. https://doi.org/10.1210/er.2012-1043 pmid:23303565 Aravind Subramanian , Rajiv Narayan , Steven M Corsello , David D Peck , Ted E Natoli , Xiaodong Lu , Joshua Gould , John F Davis , Andrew A Tubelli , Jacob K Asiedu , David L Lahr , Jodi E Hirschman , Zihan Liu , Melanie Donahue , Bina Julian , Mariya Khan , David Wadden , Ian C Smith , Daniel Lam , Arthur Liberzon , Courtney Toder , Mukta Bagul , Marek Orzechowski , Oana M Enache , Federica Piccioni , Sarah A Johnson , Nicholas J Lyons , Alice H Berger , Alykhan F Shamji , Angela N Brooks , Anita Vrcic , Corey Flynn , Jacqueline Rosains , David Y Takeda , Roger Hu , Desiree Davison , Justin Lamb , Kristin Ardlie , Larson Hogstrom , Peyton Greenside , Nathanael S Gray , Paul A Clemons , Serena Silver , Xiaoyun Wu , Wen-Ning Zhao , Willis Read-Button , Xiaohua Wu , Stephen J Haggarty , Lucienne V Ronco , Jesse S Boehm , Stuart L Schreiber , John G Doench , Joshua A Bittker , David E Root , Bang Wong , Todd R Golub. (2017). A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles. Volume 171, Issue 6, 30 November 2017, Pages 1437-1452.e17. Retrieved: 10.1016/j.cell.2017.10.049. Newman, M. E. J., Girvan, M. (2004). Finding and evaluating community structure in networks. Vol. 69, Iss. 2 — February 2004 . Phys. Rev. E 69 (2), 026113. doi: 10.1103/PhysRevE.69.026113 Wang, J. Z., Du, Z., Payattakool, R., Yu, P. S., Chen, C. F. (2007). A new method to measure the semantic similarity of GO terms. Bioinformatics, Volume 23, Issue 10, 15 May 2007, Pages 1274–1281, doi: 10.1093/bioinformatics/btm087 Khodade, P., Prabhu, R., Chandra, N., Raha, S., Govindarajan, R. (2007). Parallel implementation of AutoDock. J. Appl. Crystallogr. 40, 598–599. doi: 10.1107/S0021889807011053 Wenying Yan, Xingyi Liu, Yibo Wang, Shuqing Han, Fan Wang, Xin Liu, Fei Xiao and Guang Hu. (2020). Identifying Drug Targets in Pancreatic Ductal Adenocarcinoma Through Machine Learning, Analyzing Biomolecular Networks, and Structural Modeling. Retrieved: https://doi.org/10.3389/fphar.2020.00534 J. Lamb, E.D. Crawford, D. Peck, J.W. Modell, I.C. Blat, M.J. Wrobel, J. Lerner, J.-P. Brunet, A. Subramanian, K.N. Ross, et al. The Connectivity Map: using gene-expression signatures to connect small molecules, genes, and disease Science, 313 (2006), pp. 1929-1935, 10.1126/science.1132939 A. Subramanian, R. Narayan, S.M. Corsello, D.D. Peck, T.E. Natoli, X. Lu, J. Gould, J.F. Davis, A.A. Tubelli, J.K. Asiedu, et al. A next generation connectivity map: L1000 platform and the first 1,000,000 profiles Cell, 171 (2017), pp. 1437-1452.e17, 10.1016/j.cell.2017.10.049 Yasaman KalantarMotamedi, Ran Joo Choi, Siang-Boon Koh, Jo L. Bramhall, Tai-Ping Fan, Andreas Bender. (2021). Prediction and identification of synergistic compound combinations against pancreatic cancer cells. Volume 24, Issue 9, 103080, September 24, 2021. Retrieved: https://doi.org/10.1016/j.isci.2021.103080 Christine A. Iacobuzio-Donahue, Anirban Maitra, Mari Olsen, Anson W.Lowe, N. Tjarda Van Heek, Christophe Rosty, KimWalter et al. Exploration of Global Gene Expression Patterns in Pancreatic Adenocarcinoma Using cDNA Microarrays. (2003) Volume 162, Issue 4, April 2003, Pages 1151-1162 Brianne Petritis, Phd .SAM (Significance Analysis Of Microarray). (2018). Retrieved: https://www.raybiotech.com/learning-center/sam/ [Accessed December 2021] Layla Abdel-Ilah , Elma Veljovic, Lejla Gurbeta , Almir Badnjevic. Applications of QSAR Study in Drug Design.(2017). Paper ID : IJERTV6IS060241. Volume 06, Issue 06 (June 2017) LiPeizhen Li, Yueli Tian, Hong Lin Zhai, Lanzhou University, Fangfang Deng. Study on the activity of non-purine xanthine oxidase inhibitor by 3D-QSAR modeling and molecular docking. (2013) 1051:56-65 DOI:10.1016/j.molstruc.2013.07.043 K W Le, J M Briggs. (2001). Comparative molecular field analysis (coMFA) study of epothilones-tubulin depolymerization inhibitors: pharmacophore development using 3D QSAR methods. J Comput Aided Mol Des. 2001 Jan;15(1):41-55. doi: 10.1023/a:1011140723828. Jingqi Chen, Ming Ma, Ning Shen, Jianzhong Jeff Xi, Weidong Tian. (2013). Integration of Cancer Gene Co-expression Network and Metabolic Network To Uncover Potential Cancer Drug Targets. J. Proteome Res. 2013, 12, 6, 2354–2364 Publication Date:April 16, 2013. DOI: 10.1021/pr400162t Lin, X.; Yang, F.; Zhou, L.; Yin, P.; Kong, H.; Xing, W.; Lu, X.; Jia, L.; Wang, Q.; Xu, G. A support vectormachine-recursive feature elimination feature selection method based on artificial contrast variables andmutual information. J. Chromatogr. B Anal. Technol. Biomed. Life Sci. 2012,910, 149–155. [CrossRef] Guyon, I., Weston, J., Barnhill, S., Vapnik, V. (2002). Gene selection for cancer classification using support vector machines. Mach. Learn. 46 (1-3), 389–422. doi: 10.1023/A:1012487302797 Sunil Ray. “Understanding Support Vector Machine (SVM) algorithm from examples (along with code)”. (2017). Access: 09.12.2021. https://www.analyticsvidhya.com/blog/2017/09/understaing-support-vector-machine-example-code/ Elma Veljovic, Selma Spirtovic-Halilovic, Samija Muratović, Amar Osmanović, Almir Badnjević, Lejla Gurbeta, Berina Tatlić, Zerina Zorlak, Selma Imamović, Đenana Husić, Davorka Završnik. (2017). Artificial Neural Network and Docking Study in Design and Synthesis of Xanthenes as Antimicrobial Agents. DOI:10.1007/978-981-10-4166-2_93. In book: CMBEBIH 2017 (pp.617-626) Yu G, Wang L, Han Y and He Q*. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 2012, 16(5):284-287. Holtzman, Coulter, Vivek, J. D. K. (2021b December 15). Web application requirements - Power Platform. Microsoft Docs. https://docs.microsoft.com/en-us/power-platform/admin/web-application- requirements Node.js vs Express.js. (2020, December 9).GeeksforGeeks. Retrieved March 30, 2022, from https://www.geeksforgeeks.org/node-js-vs-express-js/ Clinical trials. (n.d.). World Health Organization. Retrieved March 30, 2022, from https://www.who.int/health-topics/clinical-trials#tab=tab_1 Stitch. (n.d.). Stitch Connect API Reference | Stitch Documentation. Stitch Docs. Retrieved March 30, 2022, from https://www.stitchdata.com/docs/developers/stitch-connect/api#access-token--individual-user Kuhn, M., von Mering, C., Campillos, M., Jensen, L. J., & Bork, P. (2008). STITCH: interaction networks of chemicals and proteins. Nucleic acids research, 36(Database issue), D684–D688. https://doi.org/10.1093/nar/gkm795

Proje için yatırım almadık.

Uluslararası Kanser Araştırmaları Ajansı tarafından üretilen GLOBOCAN 2020 kanser insidansı ve mortalite tahminlerine göre, 2020 yılında teşhis edilen 496.000 pankreas kanseri vakasından 466.000 kişi yaşamını yitirmiştir. Pankreas kanseri, her iki cinsiyette de yedinci gelen kanser ölüm nedenidir. Pankreas kanseri erkeklerde kadınlara göre daha sık görülmektedir. Dünyada pankreas kanseri insidansı erkeklerde 100.000'de 5,5, kadınlarda ise 100.000'de 4,0'dır. (Rawla ve ark, 2019) Bahsedilen verilerde görüldüğü gibi pankreas kanseri oldukça kötü bir prognoza sahiptir ve bilinen tek tedavi yöntemi Gemsitabin'dir. Projemiz Gemsitabin dışında tedavi için kullanılabilecek ilaçları arayarak bu kötü prognozu değiştirmek için bir çözüm üretmektedir.

Farklı yöntemler kullanarak pankreas kanseri için aday ilaç tahmini yapmayı deneyen farklı çalışmalar bulunmaktadır. Ancak bu çalışmalar farklı kullanıcılara kendi verilerini test edebilme imkanı sunmamaktadırlar. 1) Prediction of Candidate Drugs for Treating Pancreatic Cancer by Using a Combined Approach Bu çalışma NCBI GEO'dan veri setlerinin toplanmasıyla başlamıştır. Daha sonra Pankreatik gen ekspresyonu veri setinde, aynı kişinin tümör olmayan dokuları yerine tümör ve normal dokularından alınan örnekler kullanılmıştır. Periferik kan mononükleer hücreleri ve tükürük gibi çeşitli bölgelerden alınan bu normal örnekler R ve Bioconductor'ın limma paketi, normal ve kanser dokuları arasında diferansiyel olarak eksprese edilen (DE) genleri tanımlamak için kullanılmıştır. DE genleri ile Connectivity Map (CMap)'deki (Lamb ve diğerleri, 2006) ilaca bağlı sıralı gen listeleri arasındaki korelasyon Kolmogorov-Smirnov testine göre belirlenmiştir (Hollender ve diğerleri, 2013). Anahtar enzim kodlayan genlerin tahmini için örneklere bir ML algoritması olan Met-express prosedürü uygulanmıştır. Sonuçlar, fonksiyonel zenginleştirme analizleri ve literatür incelemeleri ile doğrulanmıştır. Aday ilaçları seçmek için KPC enzimleri kullanılmıştır. Hedefi KPC enzimiyse veya bir KPC enzimi tarafından katalize edilen enzimatik reaksiyonun substratı veya ürünüyse, PUD'lerin pankreas kanseri için aday bir ilaç olarak kullanıldığı kabul edilmiştir. PUD'lerin hedefleri, ilaç adaylarını bulmak için DrugBank veri tabanından elde edilmiştir. Bu tahmin edilen ilaçlar deneysel doğrulama için kullanılmıştır. (Ma ve diğerleri, 2016). Kaynakça: Ma, Y., Hu, J., Zhang, N., Dong, X., Li, Y., Yang, B., Tian, W., & Wang, X. (2016). Prediction of Candidate Drugs for Treating Pancreatic Cancer by Using a Combined Approach. PloS one, 11(2), e0149896. https://doi.org/10.1371/journal.pone.0149896 2) High-throughput gene expression analysis for drug discovery Çalışmalardan biri, Gregory GLennon tarafından yüksek verimli gen ekspresyon veri setlerini analiz etmek için yapılmıştır (GLennon, 2000). Dokular veya hücreler için büyük ölçekli tarama yapmak ve ekspresyon profil kalıpları geliştirmek için yüksek verimli tarama (HTS) yöntemleri geliştirilmiştir. Bu yöntemler, yeni genlerin ekspresyon seviyelerinin belirlenmesini ve karakterize edilmesini, birçok doku tipindeki mRNA ekspresyon modellerinin hastalık durumları ile ilişkilendirilmesini, mevcut ve deneysel tedavilerin yan etkilerinin belirlenmesini ve bileşiklerin hedef olmayan dokular üzerindeki etkilerinin belirlenmesini sağlar. Burada en önemli yöntem DNA mikrodizisidir. DNA mikrodizileri, bir hedef numuneye aynı anda maruz kalan çok sayıda prob içeren şablonlar kullanılarak ekspresyon ölçümü olarak tanımlanır, böylece ilaç keşfi ve değerlendirilmesi için DNA ve RNA varyasyonlarının araştırılmasını mümkün kılar. Daha sonra ilaç hedeflerine ve öncü bileşiklere öncelik vermek için elde edilen bu örnekler kullanılmaya devam edilir. Buradaki yaklaşım, örnekleri büyük bir gen ekspresyonu veritabanıyla karşılaştırmaktır. Bu doğrultuda, hedef seçimi ve önceliklendirme için GeneExpress veri tabanı (BioExpress™) kullanılmaktadır. Bir numune veya bir dizi numune ile aşağı regüle edilen genleri bulmak için arama yapılır. Bu aramalar, hastalıklı dokularda diferansiyel düzenlemeye karşı gelen ilaç hedefleri için veri sağlar. Kaynakça: Lennon G. G. (2000). High-throughput gene expression analysis for drug discovery. Drug discovery today, 5(2), 59–66. https://doi.org/10.1016/s1359-6446(99)01448-8 3) Identifying Drug Targets in Pancreatic Ductal Adenocarcinoma Through Machine Learning, Analyzing Biomolecular Networks, and Structural Modeling Bu çalışma, pankreas kanseri ilgili yeni genler bulma ve pankreas duktal adenokarsinomunun (PDAC) tanı ve tedavisi için hedeflerini belirlemeyi amaçlamıştır (Yan ve ark., 2020). Çalışma, PDAC tedavisini geliştirmek için hem sistemler hem de moleküler düzeyde bilgi sahibi olmanın önemini vurgulamaktadır. Bu çalışmada kısaca, protein-protein etkileşimi (PPI) verileri ve ilişkisiz ekspresyon mikro dizi veri setleri kullanılarak kanser genlerini ve kanseri önlemeye yönelik potansiyel ilaçların hedeflerini tahmin etmeye dayalı bir yöntem geliştirilmiştir. Bu yöntem için kullanılan veri kümeleri, kanser dokusundan alınan örnekleri ve normal pankreas dokusu örneklerini içermektedir. Normalleştirilmiş veriler, Benjamini-Hochberg yöntemiyle diferansiyel olarak eksprese edilen genleri belirlemek için analiz edilmiştir. PPI ağlarından alınan bilgiler hastalık genlerini ve ilaç hedeflerini belirlemek için yeterli olmadığı için üç aşamalı bir boru hattı geliştirilmiştir. İlk aşamada DEG'ler sıralanmış ve en uygun öznitelikler Özyinelemeli Özellik Eliminasyon (SVM-RFE) algoritması ile seçilmiştir (Guyon vd., 2002). İkinci adımda, STRING veri tabanı ile DEG'lerden oluşan bir PPI ağı oluşturulmuştur. Son adımda, her gen için yeni bir skor (RN) tanımlanmıştır. PPI ağı oluşturulduktan sonra aradalık ve yakınlık parametrelerinin hesaplanmasını içeren iki analiz yapılmıştır. Daha sonra moleküller ve potansiyel ilaçlar arasındaki etkileşimler farklı analiz yöntemleri ile incelenmiştir. Ortaya çıkan ölçümler, RN'lerin yeni hastalık genlerini ve ilaç hedeflerini belirlemek için kullanılabileceğini göstermiştir. Kaynakça: Yan, W., Liu, X., Wang, Y., Han, S., Wang, F., Liu, X., Xiao, F., & Hu, G. (2020). Identifying Drug Targets in Pancreatic Ductal Adenocarcinoma Through Machine Learning, Analyzing Biomolecular Networks, and Structural Modeling. Frontiers in pharmacology, 11, 534. https://doi.org/10.3389/fphar.2020.00534 4) Prediction and identification of synergistic compound combinations against pancreatic cancer cells Gemsitabin, tek başına veya diğer ilaçlarla kombinasyon halinde, çoğunlukla pankreasın vücuttan atılamadığı adenokarsinomlu hastalarda ilk tedavi seçeneği olarak kullanılır, ancak gemsitabinin etkisi çok düşüktür. Bu çalışma, hem hastalık hem de bileşik tarafından transkriptomik profillere dayalı bileşiklerin sinerjistik kombinasyonlarını seçmek için geliştirilmiş bir hesaplama yöntemi ile pankreas kanseri hücrelerine karşı bileşiklerin sinerjistik kombinasyonlarını tanımlamıştır. İlk olarak, daha sağlam oldukları için bileşiklerin gen imzaları yerine yol imzaları kullanılmıştır. Ardından, yol düzensizliklerinin potansiyel olarak bileşik sinerjiye yol açtığına dair yeni bir hipotez öne sürülmüştür. Daha sonra, hastalığın düzensiz yolları hedef alındığında, PANC-1 hücrelerinde modifiye edici bileşiklerin tanımlanabileceği varsayılmıştır. Bu varsayımlardan sonra Skor1 ve Skor2 olmak üzere iki puan türü ve PANC-1'de önemli olan yollar daha sonra tanımlanmış ve Rescore Puanı oluşturulmuştur. Bu üç puana dayanarak, 30 aday bileşiğin gemsitabin ile kombinasyon halinde kullanılabileceği deneysel olarak doğrulanmıştır (KalantarMotamedi ve ark., 2021). Kaynakça: KalantarMotamedi, Y., Choi, R. J., Koh, S. B., Bramhall, J. L., Fan, T. P., & Bender, A. (2021). Prediction and identification of synergistic compound combinations against pancreatic cancer cells. iScience, 24(9), 103080. https://doi.org/10.1016/j.isci.2021.103080