Kayıtlar

Temmuz, 2020 tarihine ait yayınlar gösteriliyor

Makine Öğrenmesinde Değişken Seçimi

Resim
Bu çalışmamızda model seçimi önemini UCI dizinindeki  banka pazarlama veri kümesi  üzerinden inceleyelim. Amaç müşterilerin özelliklerine ve ekonomik göstergelere bakarak müşterilerin kampanya tekliflerine dönüş yapıp yapmayacağını tahmin etmek. Elimizdeki problem iki sınıftan oluşan bir sınıflandırma problemi, burada Random Forest Algoritmasını kullandım. Algoritmanın iç işleyişini anlama konusunda yetkin olmak önemli olmakla birlikte, bulguları makine öğrenimi hakkında teorik / pratik bilgisi olmayan bir kitleye iletebilmek çok daha önemlidir.  Sadece algoritmanın iyi tahmin ettiğini göstermek yeterli değildir.  Tahminleri, doğruluğunuza katkıda bulunan giriş verilerinin öğelerine atfetmelisiniz.  Neyse ki, sklearn  veri kümesindeki özelliklerin tahmin gücünü açıklamamıza yardımcı olan  “ değişken önemi(feature importances)  ” adı verilen bir çıktı vermektedir  .  Ancak, bu çıktının dezavantajlarını ve bunların üstesinden nasıl geleceğimizi açıklayacağım. Verideki değişkenlerin anlam