#20220208 Multiclass Classification of Dry Beans Using Machine Learning Techniques





PROJE KODU20220208
PROJE SAHİBİBeliz Pehlivan
PROJE SAHİBİ LINKEDIN linkedin.com/in/belizpehlivan
PROJE MALİYETİ
PROJE ÜNİVERSİTESİAnkara Üniversitesi
PROJE KATEGORİSİToplumsal, Sosyal Medya ve Diğer
PROJE DANIŞMANIYılmaz Ar



Çalışmanın temel amacı, makine öğrenmesi algoritmaları ve teknikleri ile sınıflandırma modelleri geliştirerek kuru fasulye sınıflandırması yapmak ve performansı geliştirmektir. Dünyada en çok üretilen baklagiller arasında yer alan kuru fasulyenin genetik çeşitliliği oldukça fazladır dolayısıyla fasulye çeşitlerini belirlemek, çiftçilerin ekim ve pazarlama için doğru tohumları seçmelerine yardımcı olur. Bu projede kullanılan veri seti, fasulye görüntülerinden şekil özelliklerini çıkaran bir bilgisayar görüş sistemi kullanılarak yedi farklı kuru fasulye türünü ayırt etmek için oluşturulmuştur. Toplamda 13.611 kuru fasulye örneği ve 16 öznitelik ve 7 farklı fasulye çeşidi bulunmaktadır. Proje Python kullanılarak geliştirilmiştir. Veri setindeki eksik ve tekrarlanmış değerler, birbiriyle ilişkili öznitelikler analiz edildikten sonra Multilayer Perceptron (MLP), Support Vector Machine (SVM), k Nearest Neighbor (kNN), Decision Tree (DT), Logistic Regression (LR) and Random Forest (RF) sınıflandırma modelleri oluşturulmuştur. Performansı artırabilmek için farklı teknikler kullanılmıştır; Farklı modelleri birleştiren Ensemble metodu, Modellerin performansına negatif etkisi olan çoklu bağlantıyı (multicollinearity) azaltmak için PCA tekniği. Modellerin performansları karşılaştırılmış ve analiz edilmiştir. En iyi sonucu %93.4 doğruluk oranıyla MLP modeli vermiştir. Diğer sınıflandırma modelleri de %90'ın üzerinde doğruluk oranına ulaşmış ve diğer performans metriklerinde de başarılı bir sonuç elde edilmiştir.

Projede makine öğrenimi teknikleri ile fasulye tohum çeşitlerini sınıflandırmak amacıyla çoklu sınıflandırma (multiclass classification) modelleri geliştirilmiştir. 13611 adet fasulye tohumunun 16 adet boyut özelliklerini içeren veri seti analiz edilip, tohumların sınıflandırılması için Multilayer Perceptron, Support Vector Machine, k Nearest Neighbor, Decision Tree, Logistic Regression and Random Forest modelleri oluşturulmuştur. Çeşitli teknikler kullanılarak performans artırılmış ve sonuçlar analiz edilmiştir.

Bu projede veri kümesi kullanılan ve temel alınan; Selçuk Üniversitesi'nde geliştirilmiş 'Multiclass Classification of Dry Beans Using Computer Vision and Machine Learning Techniques' projesinde kullanılan sınıflandırma modellerinin yanı sıra iki farklı sınıflandırma modeli algoritması daha uygulanmıştır. Temel alınan projeden farklı olarak iki ayrı teknik kullanılmış ve sonuçlarda benzer oranda başarı elde edilmiştir.

Proje Python ile ve Python programlama dilinin yetersiz kaldığı üst düzey matematiksel problemler için oluşturulmuş Numpy, veri bilimi için oluşturulmuş Pandas ve Seaborn, Sklearn gibi kütüphaneler kullanılarak geliştirilmiştir.

Dünyada en çok üretilen baklagil bitkileri arasında olan kuru fasulye gıda endüstrisinde önemli bir yer tutmaktadır. Kuru fasulye genotiplerinin analizi ve sınıflandırılması bitkisel üretimdeki ana süreçlerden biridir. Bu baklagilin genetik çeşitliliği oldukça fazladır ve ekotipleri farklılık gösterir. Dolayısıyla çeşidine göre yetiştirilme koşulları, strese karşı toleransı gibi faktörler de değişmektedir. Fasulye çeşitlerinin belirlenmesi çiftçilerin ekim ve pazarlama için doğru tohum seçimi yapmalarına yardımcı olur.