Başlıca Biyoinformatik Algoritmaları için Web Ara yüzü ve Yeni Otomat Tabanlı Yaklaşık Desen Eşleştirme Yaklaşımı

Bu çalışmada temel biyoinformatik algoritmaları için yeni bir web ara yüzü ve özgün bir yaklaşık desen eşleştirme algoritması sunmaktayız. Web ara yüzümüz biyologlar, öğrenciler ve ilgili araştırmacılar için bu alandaki temel algoritmaları çalıştırmaktadır. Web ara yüzünde algoritmalar üç bölüm altında toplanmaktadır: Dizilim hizalama, desen eşleştirme ve motif bulma. Her bir bölümde, özgül veri seti ve problemlere en iyi uyan algoritmanın bulunabilmesi için sonuçlarını karşılaştırabilecekleri algoritmalar sunulmaktadır. Web ara yüzü çalışma süreleri, hafıza kullanımı ve hizalama skoru gibi konuya özel sonuçları sunmaktadır. Ara yüz yeni geliştirilen açık kaynak kodlu dilleri ve araçları kullanmaktadır. Hafif ve kullanıcı dostu bir ara yüz olması amacıyla ara yüzün tüm kısımları Python dili ile kodlanmıştır. Diğer yandan web ara yüzü için Django kullanılmıştır. Çalışmanın ikinci katkısı, yaklaşık desen eşleştirme için tasarlanmış yeni A-BOM algoritmasıdır. Bu algoritma Backwards Oracle Matching algoritmasının yaklaşık varyasyonudur. Algoritmamızı popüler yaklaşık desen eşleştirme algoritmaları ile kıyasladık. Sonuçlar, A-BOM algoritmasını güncel yaklaşık desen eşleştirme algoritmaları ile uzun desenler üzerinde karşılaştırdığımızda, çalışma süresinde %30 ile %80 arasında kısalma gelişimi olduğunu göstermektedir.

A NEW AUTOMATA BASED APPROXIMATE STRING MATCHING APPROACH AND WEB INTERFACE FOR BIOINFORMATICS ALGORITHMS

In this study, we present a new web interface for major bioinformatics algorithms andintroduce a novel approximate string matching algorithm. Our web interface executes major algorithmson the field for the use of computational biologists, students or any other interested researchers. In theweb interface, algorithms come under three sections: Sequence alignment, pattern matching and motiffinding. In each section, we introduce algorithms in order to find best fitting one for specific dataset andproblem. The interface introduces execution time, memory usage and context specific results ofalgorithms such as alignment score. The interface utilizes emerging open source languages and tools. Inorder to develop light and user-friendly interface, all parts of the interface coded with Python language.On the other hand, Django is used for web interface. Second contribution of the study is novel A-BOMalgorithm, which is designed for approximate pattern matching problem. The algorithm is approximatematching variation of Backward Oracle Matching. We compare our algorithm with popular approximatestring matching algorithms. Results denote that A-BOM introduces %30 to %80 short runtimeimprovement when compared to current approximate pattern matching algorithms on long patterns.

___

  • Pevsner, J. (2015) Bioinformatics and functional genomics, John Wiley & Sons, UK
  • Smith, T.F. and Waterman, M.S. (1981) Identification of common molecular subsequences, Journal of Molecular Biology, Academic Press Incorporated, London, 40-48. doi: 10.1016/0022-2836(81)90087-5
  • Needleman, S.B. and Wunsch, C.D. (1970) A general method applicable to the search for similarities in the amino acid sequence of two proteins, Journal of Molecular Biology, Academic Press Incorporated, London, 443-453. doi: 10.1016/0022-2836(70)90057-4
  • Bishop, C. M. (2006) Machine learning and pattern recognition. Information Science and Statistics. Springer, Heidelberg.
  • D'haeseleer, P. (2006) How does DNA sequence motif discovery work?. Nature biotechnology, 24(8), 959-961
  • Özcan, G., and Ünsal, O. S. (2015). Fast bitwise pattern-matching algorithm for DNA sequences on modern hardware. Turkish Journal of Electrical Engineering & Computer Sciences, 23(5), 1405-1417.
  • Langmead, B., and Salzberg, S. L. (2012) Fast gapped-read alignment with Bowtie 2. Nature methods, 9(4), 357.
  • Knuth, D.E., Morris, J.H and Pratt, W.R. (1977) Fast Pattern Matching in Strings, Journal of Molecular Biology, SIAM Journal on Computing, Philadelphia, 323-350. doi: 10.1137/0206024
  • Boyer, R.S., Moore, J.S and Pratt, W.R. (1977) A Fast String Searching Algorithm, Journal of Molecular Biology, Communications of the ACM, New York, 762-772. doi: 10.1145/359842.359859
  • Alluzen, C., Crochemore, M. and Raffinot, M. (1999) Factor Oracle: A New Structure for Pattern Matching, SOFSEM’99: Theory and Practice of Informatics, Lecture Notes in Computer Science, Berlin, 291-306. doi: 10.1007/3-540-47849-3_18
  • Ji, H. and Shendure, J. (2008) Next-generation DNA sequencing, Nature biotechnology volume 26, Nature Publishing Group, London, 1135-1145. doi: 10.1038/nbt1486
  • Burrows, W. and Wheeler, D. J. (1994) A block-sorting lossless data compression algorithm, Technical Report 124, Digital Equipment Corporation, Digital Equipment Corporation, California.
  • Durbin, R., Eddy, S. R., Krogh, A. and Mitchison, G. (1998) Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, Cambridge.
  • Navarro, R. and Raffinot, M. (2002) Flexible Pattern Matching in String, The press Syndicate of The University of Cambridge, Cambridge.
  • Özcan, G. (2016) Detection of P53 Consensus Sequence: A Novel String Matching With Classes Algorithm, Uludag University Journal of The Faculty of Engineering 21 (2), Bursa, 269-282.
Uludağ Üniversitesi Mühendislik Fakültesi Dergisi-Cover
  • ISSN: 2148-4147
  • Yayın Aralığı: 3
  • Başlangıç: 2002
  • Yayıncı: BURSA ULUDAĞ ÜNİVERSİTESİ > MÜHENDİSLİK FAKÜLTESİ
Sayıdaki Diğer Makaleler

FARKLI AĞIRLIKLARDA ÜRETİLEN POLİESTER ÇÖZGÜLÜ ÖRME KUMAŞLARIN UZAMA VE HAVA GEÇİRGENLİK ÖZELLİKLERİNE YIKAMANIN ETKİSİ

Gizem KARAKAN GÜNAYDIN, Erhan Kenan ÇEVEN

GÜNCEL METASEZGİSEL ALGORİTMALAR İÇİN KAOS TABANLI YAKLAŞIMLAR

Yiğit Çağatay KUYU, Fahri VATANSEVER

DÜŞÜK SICAKLIK CO2 ADSORPSİYONU İÇİN PANI/SBA-15 SORBENTLERİN SENTEZİ VE YAPISAL ÖZELLİKLERE SENTEZ PARAMETRELERİNİN ETKİSİ

FİLİZ AKTI

Farklı Ağırlıklarda Üretilen Poliester Çözgülü Örme Kumaşların Uzama Ve Hava Geçirgenlik Özelliklerine Yıkamanın Etkisi

Gizem KARAKAN GÜNAYDIN, Erhan Kenan ÇEVEN

MAKING AN X-RAY UNDULATOR READY FOR COMMISSIONING: PROCEDURES SUBSEQUENT TO FABRICATION UNTIL TUNNEL INSTALLATION

BORA KETENOĞLU

We present in this work, the experimental demonstration of a phase-sensitive Optical Time- Domain Reflectometer (phase-OTDR) having coherent detection scheme. An analysis algorithm has also been developed to calculate amplitude and phase evolution of the experimental phase-OTDR traces. The efficienc

Johan JASON, Marc WUILPART, Kıvılcım YÜKSEL

Personel Seçimi İçin Sezgisel Bulanık Sayı Temelli Grup Karar Verme Yaklaşımı

Burak EFE, Ömer Faruk EFE

YÜKSEK KROMLU BEYAZ DÖKME DEMİRLERDE FAZ DENGESİNİN BENZETİMİ

ÖNCÜ AKYILDIZ, DUYGU CANDEMİR, Hakan YILDIRIM

OPTIMAL DESIGN OF AUTOMOTIVE SUSPENSION SPRINGS USING DIFFERENTIAL EVOLUTION ALGORITHM

BETÜL SULTAN YILDIZ

GİYSİLİK KUMAŞLARIN YAPISININ HAVA GEÇİRGENLİĞİ VE TERMAL KONFOR ÖZELLİKLERİ ÜZERİNE ETKİSİNİN İNCELENMESİ

Ayca GURARDA, Tuğba ZENGİN, Gökçe TOSUN