#20220116 DNA Motif Searching





PROJE KODU20220116
PROJE SAHİBİCAN KAAN KARAHAN
PROJE MALİYETİ
PROJE ÜNİVERSİTESİAnkara Üniversitesi
PROJE KATEGORİSİToplumsal, Sosyal Medya ve Diğer
PROJE DANIŞMANIGazi Erkan Bostancı



En basitinden en karmaşığına kadar canlılar benzer kimyasal yapılara sahiptir. Bu nedenle bilim, bu kimyasal yapılar üzerinde araştırmalara ağırlık vermiştir. DNA veya RNA dizilerindeki gizli gen paternlerine motif denir. Gen, nükleotidlerin protein sentezinin kopyalanması ve yazılması işleminde kullanılmak üzere DNA üzerindeki bölgeye verilen isimdir. Gen bölgeleri, protein sentezini başlatacak ve bitirecek kodonlar hakkında bilgi içerir. Bu bilgi, yazım faktörü olarak adlandırılır. DNA motifleri, diziler içindeki konumları ve içerdikleri baz dizileri ile ayırt edilebilir. Bu durumda çeşitli algoritmalar kullanılır veya dizinin bir kısmı (temel benzerlik uyumsuzluğu olması durumunda) hatalı kısım olarak kabul edilir ve işlem gerçekleştirilir. Bu projede daha önce bu alanda kullanılan yöntemler incelenerek yöntemlere farklı bir yaklaşım getirilmiştir. Bu yaklaşım, genetik algoritmanın altyapısını kullanır. Birden fazla çalıştırılarak daha iyi bir sonuç alınabilir. Genetiğin zorlu araştırma konularından biri olan motif arama, birçok hastalığın kaynağında ve tedavisinde sınıflandırma ve evrim çalışmalarını içermektedir.

En basitinden en karmaşığına kadar canlılar benzer kimyasal yapılara sahiptir. Canlı ve cansız varlıkların ortak atomlardan oluştuğu düşünüldüğünde, birbirlerinden bu kadar farklı olmaları araştırma konusu olmuştur. Canlılar arasındaki farklılıkları çeşitli moleküller sağlar. Bunların en önemlileri proteinler ve nükleik asitlerdir. DNA üzerindeki proteinleri oluşturan gen bölgelerindeki motif denilen yapıları inceleyerek genetik bilimi hakkında yeni bilgiler edinmeye devam ediyor. DNA dizileri, ortak bazlar, ortak noktalar ve genlerdeki farklılıklar ve çeşitli sınıflandırmalar da yaşam bilimleri araştırmacılarının işini oldukça kolaylaştırmaktadır. Bu proje DNA dizilerinde bulnan motiflerin araması ile ilgilenecek

Genel arama yöntemlerinin yanı sıra genetik algoritmayı kullanamsı

Projenin gerçekleşmesi için normalden daha iyi performans gösteren bilgisayarlar (özellikle uzun DNA dizileri ve yapılacaksa sınıflandırma için) ve kullanmak istenen canlının/canlıların DNA baz dizilerinin nulunduğu data baseler

-

-

Yapılacak herhangi bir biyoenformatik, DNA dizilimi araştırmasında kullanabilieceği için genetik bilimine ihtiyaç olunan her yerde (hastalık teşhis ve tedavisi, sınıflandırma, evrimsel süreçler vb.) kullanılabilir.

1. Setubal, J., Meidanis, J., Introduction to Computational Molecular Biology, PWS Publishing Company, 1997. 2. Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, Peter Walter, Molecular Biology of the Cell, W.W. Norton & Company, 2007. 3. Harvey Lodish, Arnold Berk , Paul Matsudaira , Chris A. Kaiser , Monty Krieger , Matthew P. Scott, Lawrence Zipursky, James Darnell, Molecular Cell Biology, 4. https://bilimgenc.tubitak.gov.tr/dnanin-kimyasal-yapisi 5. Internet: Nacional Center for Biotechnology Information, NCBI Home Page, http://www.ncbi.nlm.nih.gov 6. Internet: EMBL Heidelberg, The European Molecular Biology Laboratory, http://www.embl-heidelberg.de 7. Internet: The GDB Human Genome Database, http://www.gdb.org 8. Çok Amaçlı Genetik Algoritmalar Kullanarak Biyodizilerden Çoklu Motiflerin Keşfi, Master Thesis, Melikali GÜÇ, 2008. 9. PREDICTION OF DNA REGULATORY MOTIFS, Master Thesis, Kerem YILDIZ, 2009. 10. Tompa M. et al., “Assessing Computational Tools for the Discovery of Transcription Factor Binding Sites”, Nature Biotechnology, vol. 23, no. 1, 137 – 144, January 2005. 11. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6490410/ 12. Bailey, T. L., “Discovering motifs in DNA and protein sequences:The approximate common substring problem”, PhD thesis, University of California, San Diego, 1995. 13. Thompson, W., Rouchka E.C. and Lawrence C.E. “Gibbs Recursive Sampler: Finding transcription factor binding sites”, J. Nucleic Acids Research, Vol.31, pp. 3580-3585, 2003. 14. Lawrence, C., Altschul, S., Boguski, M., Liu, J., Neuwald, A. & Wootton, J. “Detecting subtle sequence signals: a Gibbs sampling strategy for multiple alignment”, Science, 262 (5131), 208–14, 1993. 15. Haussler M., “Motif Discovery on Promoter Sequences,” Universitat Potsdam Institut für Informatik and IRISA/INRIA Rennes, 2005. 16. Sokal & Sneath: Principles of Numerical Taxonomy, San Francisco: W.H. Freeman, 1963. 17. Bioinformatics Algorithms, Design and Implementation in Python, Miguel Rocha, Pedro G. Ferreira, Academic Press,2018 18. https://biopython.org/ 19. https://rebelscience.club/