Kedi sürüsü optimizasyon algoritmasıyla doğru ve anlaşılabilir nümerik sınıflandırma kurallarının otomatik keşfi

Metasezgisel algoritmalar, büyük boyutlu optimizasyon problemleri için, kabul edilebilir sürede optimuma yakın çözümler verebilen algoritmalardır. Genel amaçlı metasezgisel optimizasyon algoritmaları; biyoloji tabanlı, fizik tabanlı, sürü tabanlı, sosyal tabanlı, müzik tabanlı, spor tabanlı ve kimya tabanlı olmak üzere yedi farklı grupta değerlendirilmektedir. Sürü zekâsı tabanlı optimizasyon algoritmaları kuş, balık, kedi ve arı gibi canlı sürülerinin hareketlerinin incelenmesiyle geliştirilmiştir. Veri madenciliği, büyük ölçekli verilerden anlamlı ve faydalı bilginin keşfedilmesi işlemidir. Sınıflandırma kurallarının madenciliği üzerinde en çok çalışılan veri madenciliği problemlerinden biridir ve bu problemde veri kümelerinden kullanıcıların rahatça anlayabileceği kurallar çıkarılmaktadır. Bu çalışmada, en güncel sürü zekâsı optimizasyon algoritmalarından Kedi Sürüsü Optimizasyonu (KSO) bildiğimiz kadarıyla ilk kez nümerik ya da karışık tipte verilerden oluşan veritabanlarında sınıflandırma kurallarının otomatik keşfinde kullanılmıştır. Kuralda yer alabilecek ilgili niteliklerin doğru aralıkları için bir ön işlem kullanılmamış, kurallarla birlikte otomatik olarak bulunması da KSO tarafından sağlanmıştır. Ayrıca, kullanılan amaç fonksiyonu çok esnektir ve farklı amaçlar kolaylıkla fonksiyona entegre edilebilir. Bu amaçla, UCI veri ambarından alınan 4 adet veritabanı kullanılmış; doğru ve anlaşılabilir sınıflandırma kuralları keşfedilmiştir. Bulunan sonuçlarla Weka programından elde edilen sonuçlar karşılaştırılmıştır. KSO algoritması üzerinde herhangi bir iyileştirme yapılmadığı ve bu alanda ilk kez kullanıldığı halde, elde edilen sonuçların umut verici olduğu gözlenmiştir.

Automatic mining of accurate and comprehensible numerical classification rules with cat swarm optimization algorithm

Optimization is the process of finding the best solution of a problem. There are many optimization algorithms proposed for optimization problems. The metaheuristic algorithm can give solutions close to optimum in an acceptable period of time for large-scaled optimization problems. The metaheuristic optimization algorithms are evaluated in seven different groups which are biology-based, physics-based, swarm-based, social-based, music-based, sport-based, and chemistry-based. The swarm-based optimization algorithms have been developed by observing the behaviors of creatures e.g. birds, fishes, cats, bees etc. Data mining is the process of discovery of meaningful and useful data within huge databases. Classification rules mining is one of the most commonly studied data mining problems and with methods for this problem, users can easily understand the rules extracted from databases. In this work, one of the most recent swarm based optimization algorithm, Cat Swarm Optimization (CSO), has been firstly used for classification rules mining within databases composed of numerical or mixed data types automatically. There is not any preprocess for finding true ranges for appropriate attributes of the rules, this has been automatically done by CSO. Furthermore, the used objective function is very flexible and many different objectives can easily be added to. For this purpose, four numerical databases obtained from UCI data warehouse have been used and accurate and comprehensible classification rules have been mined. The results have been compared with the results obtained from Weka program. Although CSO has not been embedded with any improvement and has firstly implemented in this research area, the obtained results seem promising.

___

  • Alataş B., Akın E., Sınıflandırma Kurallarının Karınca Koloni Algoritmasıyla Keşfi, ELECO'2004, Bursa, 357-361, Aralık, 2004.
  • Özkan Y., Veri Madenciliği Yöntemleri, Papatya Yayıncılık Eğitim, 2008.
  • Ga D., Boullé M., A Bayesian Approach for Classification Rule Mining in Quantitative Databases, Machine Learning and Knowledge Discovery in Databases, Springer Berlin Heidelberg, 243-259, 2012.
  • Olmo J. L., Romero J. R., Ventura S., Classification Rule Mining Using Ant Programming Guided by Grammar with Multiple Pareto Fronts, Soft Computing, 16 (12), 2143-2163, 2012.
  • Changpetch P., Lin D. K., Interestingness Measures for Classification Rule Mining: Model Selection Ability, International Journal of Computer Science Issues (IJCSI), 12 (4), 76, 2015.
  • Al-diabat M., Arabic Text Categorization Using Classification Rule Mining, Applied Mathematical Sciences, 6 (81), 4033-4046, 2012.
  • Jacques J., Taillard J., Delerue D., Dhaenens C., Jourdan L., Conception of a Dominance-based Multi- Objective Local Search in the Context of Classification Rule Mining in Large and Imbalanced Data Sets, Applied Soft Computing, 34, 705-720, 2015.
  • Cano A., Zafra A., Ventura S., An Interpretable Classification Rule Mining Algorithm, Information Sciences, 240, 1-20, 2013.
  • Mishra B. S. P., Addy A. K., Roy R., Dehuri S., Parallel Multi-Objective Genetic Algorithms for Associative Classification Rule Mining, Proceedings of the 2011 International Conference on Communication, Computing & Security, ACM, 409-414, 2011.
  • Salama K. M., Abdelbar A. M., Otero F. E., Freitas A. A., Utilizing Multiple Pheromones in an Ant-based Algorithm for Continuous-Attribute Classification Rule Discovery, Applied Soft Computing, 13 (1), 667-675, 2013.
  • Haltaş A., Alkan A., Karabulut M., Performance Analysis of Heuristic Search Algorithms in Text Classification, Journal of the Faculty of Engineering and Architecture of Gazi University, 30 (3), 417-427, 2015.
  • Köklü M., Kahramanlı H., Allahverdi N., A New Accurate and Efficient Approach to Extract Classification Rules, Journal of the Faculty of Engineering and Architecture of Gazi University, 29 (3), 477-486, 2014
  • Chu S. C., Tsai P. W., Pan J. S., Cat Swarm Optimization, 9th Pacific Rim International Conference on Artificial Intelligence, LNAI, 4099, 854-858, 2006.
  • Santosa B., Ningrum M.K., Cat Swarm Optimization for Clustering, International Conference of Soft Computing and Pattern Recognition, 54-59, 2009.
  • Wang Z. H., Chang C. C., Li M. C., Optimizing LeastSignificant-Bit Substitution Using Cat Swarm Optimization Strategy, Information Sciences, 10.1016/j.ins.2010.07.011, 2010.
  • Hwang J. C., Chen J. C., Pan J. S., Huang Y.C., CSO and PSO to Solve Optimal Contract Capacity for High Tension Customers, International Conference on Power Electronics and Drive Systems, 246-251, 2009.
  • Lin K. C., Chien H. Y., CSO-Based Feature Selection and Parameter Optimization for Support Vector Machine, Joint Conferences on Pervasive Computing, 783-788, 2009.
  • Kalaiselvan G., Lavanya A., Natrajan V., Enhancing the Performance of Watermarking Based on Cat Swarm Optimization Method, International Conference on Recent Trends in Information Technology, 1081- 1086, 2011.
  • Wang W., Wu J., Emotion Recognition Based on CSO&SVM in E-Learning, Seventh International Conference on Natural Computation, 1, 566-570, 2011.
  • Tsai P. W., Pan J. S., Chen S.M., Liao B.Y., Hao S.P., Parallel Cat Swarm Optimization, International Conference on Machine Learning and Cybernetics, 6, 3328-3333, 2008.
  • Pradhan P. M., Panda G., Solving Multiobjective Problems Using Cat Swarm Optimization, Expert Systems with Applications, 39 (3), 2956-2964, 2012.
  • Wang Z. H., Chang C. C., Li M. C., Optimizing LeastSignificant-Bit Substitution Using Cat Swarm Optimization Strategy, Information Sciences, 192, 98- 108, 2012.
  • Naresh G., Ramalinga Raju M., Narasimham S. V. L., Enhancement of Power System Stability Employing Cat Swarm Optimization based PSS, 2015 International Conference on Electrical, Electronics, Signals, Communication and Optimization (EESCO), IEEE, 1- 6, 2015.
  • Kong L., Pan J. S., Tsai P. W., Vaclav S., Ho J. H., A Balanced Power Consumption Algorithm Based on Enhanced Parallel Cat Swarm Optimization for Wireless Sensor Network, International Journal of Distributed Sensor Networks, 2015.
  • Saha S. K., Ghoshal S. P., Kar R., Mandal D., Cat Swarm Optimization Algorithm for Optimal Linear Phase FIR Filter Design, ISA Transactions, 52 (6), 781-794, 2013.
  • Kumar D., Samantaray S. R., Kamwa I., Sahoo N. C., Reliability-Constrained based Optimal Placement and Sizing of Multiple Distributed Generators in Power Distribution Network Using Cat Swarm Optimization, Electric Power Components and Systems, 42 (2), 149- 164, 2014.
  • Majumder P., Eldho T. I., A New Groundwater Management Model by Coupling Analytic Element Method and Reverse Particle Tracking with Cat Swarm Optimization, Water Resources Management, 30 (6), 1953-1972,2016.
  • Meziane R., Amara M., Hamzi A., Boufala S., Hybrid Solar Gas Reliability Optimization Using Cat Swarm Optimization Under Performance and Cost Constraints, 2015 International Conference on Renewable Energy Research and Applications (ICRERA), Palermo, IEEE, 252-257, November, 2015.
  • Dong L., Yuxiang H., Qiang F., Imran K. M., Song C., Yinmao Z., Optimizing Channel Cross Section in Irrigation Area using Improved Cat Swarm Optimization Algorithm, International Journal of Agricultural and Biological Engineering, 9 (5), 76-82,2016.
  • Lin K. C., Zhang K. Y., Huang Y. H., Hung J. C., Yen N., Feature Selection based on an Improved Cat Swarm Optimization Algorithm for Big Data Classification, The Journal of Supercomputing, 72 (8), 1-12, 2016.
  • Yang F., Ding M., Zhang X., Hou W., Zhong C., NonRigid Multi-Modal Medical Image Registration by Combining L-BFGS-B with Cat Swarm Optimization, Information Sciences, 316, 440-456, 2015.
  • Guo L., Meng Z., Sun Y., Wang L., Parameter Identification and Sensitivity Analysis of Solar Cell Models with Cat Swarm Optimization Algorithm, Energy Conversion and Management, 108, 520-528, 2016.
  • Mohapatra P., Chakravarty S., Dash P. K., Microarray Medical Data Classification using Kernel Ridge Regression and Modified Cat Swarm Optimization based Gene Selection System, Swarm and Evolutionary Computation, 28, 144-160, 2016.
  • Chu S. C., Tsai P. W., Computational Intelligence Based on The Behavior of Cats, International Journal of Innovative Computing, Information and Control, 3, 163-173, 2007.
  • UCI Machine Learning Repository. Ecoli veritabanı. http://archive.ics.uci.edu/ml/datasets/Ecoli. Erişim tarihi 20 Haziran 2014. 36. UCI Machine Learning Repository. Diabet veritabanı. http://archive.ics.uci.edu/ml/datasets/Diabetes. Erişim tarihi 1 Eylül 2014.
  • UCI Machine Learning Repository. BUPA Liver Disorders veritabanı. http://archive.ics.uci.edu/ml/datasets/Liver+Disorders. Erişim tarihi 1 Kasım 2014.
  • KEEL. New Thyroid veritabanı. http://sci2s.ugr.es/keel/dataset.php?cod=66. Erişim tarihi 20 Kasım 2014.
  • Weka veri madenciliği programı. http://www.cs.waikato.ac.nz/~ml/weka/. Erişim tarihi 20 Haziran 2014.
  • Holt R. C., Very Simple classification rules perform well on most commonly used datasets, Machine Learning, 11, 69-90, 1993.
  • Novakovic J., Minic M., Veljovic A., Genetic Search for Feature Selection in Rule Induction Algorithms, 18th Telecommunications forum TELFOR, Serbia, Belgrade, November 23-25, 2010.
  • Witten I.H., Frank E., Weka machine learning algorithms in java, in Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann , 265-320, 2000.
  • Cohen W.W., Fast Effective Rule Induction, Twelfth International Conference on Machine Learning, Morgan Kaufmann, 115-123, 1995.
Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi-Cover
  • ISSN: 1300-1884
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 1986
  • Yayıncı: Oğuzhan YILMAZ
Sayıdaki Diğer Makaleler

Adana ve çevre illerde gözlenen yıllık maksimum yağışların bölgesel frekans analizi

Neslihan SEÇKİN, Emre TOPÇU

İKİLİ İMGELER İÇİN MAYIN TARLASI OYUNU TABANLI YENİ BİR VERİ GİZLEME ALGORİTMASI

Türker TUNCER, Engin AVCI, Derya AVCI

SES YALITIMINDA SES AZALTIM İNDİSİ (R) MODELLERİNİN KARŞILAŞTIRMALI OLARAK İNCELENMESİ

Ceyhun AKSOYLU, Engin MENDİ, Arda SÖYLEV

DİNAMİK GERİLİM İYİLEŞTİRİCİLERDE GERİLİM PROBLEMLERİNİN TESPİTİ İÇİN YENİ YÖNTEM GELİŞTİRİLMESİ

Mustafa İnci, Mehmet Tümay, Kamil Çağatay BAYINDIR

Beta tipi rhombic hareket mekanizmalı bir stirling motorunun tasarımı ve performans testleri

Hamit SOLMAZ, Muhammed ARSLAN, Halit KARABULUT, Yaşar Önder ÖZGÖREN, Fatih AKSOY, Can ÇINAR

Üç ayrık ölçüme dayalı parabol algoritması ile termoelektrik modülün Imax, Vmax ve Emax parametrelerinin belirlenmesi

Serkan DİŞLİTAŞ, Raşit AHISKA

TABAKALI KOMPOZİT BİR KİRİŞ VE LEVHADA HASAR TESPİTİNİN MODEL TABANLI YAPI SAĞLIĞI İZLEME TEKNİKLERİYLE BELİRLENMESİ

Mahmut PEKEDİS, Hasan YILDIZ

BETA TİPİ RHOMBİC HAREKET MEKANİZMALI BİR STİRLİNG MOTORUNUN TASARIMI VE PERFORMANS TESTLERİ

Fatih AKSOY, Halit KARABULUT, Can ÇINAR, Hamit SOLMAZ, Yaşar Önder ÖZGÖREN, Muhammed ARSLAN

Hava Sahası Sektör Tasarımı İçin Model Önerisi

Şaban TEMİZKAN, Aydın SİPAHİOĞLU

Yüksek gerilimli doğru akım iletim sistemleri için aktif doğru akım filtresi tasarımı ve simülasyonu

Naci GENÇ, Selçuk YILDIRIM, Murat AKDEMİR