Makine Öğrenmesinde Değişken Seçimi
Bu çalışmamızda model seçimi önemini UCI dizinindeki banka pazarlama veri kümesi üzerinden inceleyelim. Amaç müşterilerin özelliklerine ve ekonomik göstergelere bakarak müşterilerin kampanya tekliflerine dönüş yapıp yapmayacağını tahmin etmek. Elimizdeki problem iki sınıftan oluşan bir sınıflandırma problemi, burada Random Forest Algoritmasını kullandım. Algoritmanın iç işleyişini anlama konusunda yetkin olmak önemli olmakla birlikte, bulguları makine öğrenimi hakkında teorik / pratik bilgisi olmayan bir kitleye iletebilmek çok daha önemlidir. Sadece algoritmanın iyi tahmin ettiğini göstermek yeterli değildir. Tahminleri, doğruluğunuza katkıda bulunan giriş verilerinin öğelerine atfetmelisiniz. Neyse ki, sklearn veri kümesindeki özelliklerin tahmin gücünü açıklamamıza yardımcı olan “ değişken önemi(feature importances) ” adı verilen bir çıktı vermektedir . Ancak, bu çıktının dezavantajlarını ve bunların üstesinden nasıl geleceğimizi açıklayacağım. Verideki değişkenlerin anlam