Kayıtlar

2020 tarihine ait yayınlar gösteriliyor

Makine Öğrenmesinde Değişken Seçimi

Resim
Bu çalışmamızda model seçimi önemini UCI dizinindeki  banka pazarlama veri kümesi  üzerinden inceleyelim. Amaç müşterilerin özelliklerine ve ekonomik göstergelere bakarak müşterilerin kampanya tekliflerine dönüş yapıp yapmayacağını tahmin etmek. Elimizdeki problem iki sınıftan oluşan bir sınıflandırma problemi, burada Random Forest Algoritmasını kullandım. Algoritmanın iç işleyişini anlama konusunda yetkin olmak önemli olmakla birlikte, bulguları makine öğrenimi hakkında teorik / pratik bilgisi olmayan bir kitleye iletebilmek çok daha önemlidir.  Sadece algoritmanın iyi tahmin ettiğini göstermek yeterli değildir.  Tahminleri, doğruluğunuza katkıda bulunan giriş verilerinin öğelerine atfetmelisiniz.  Neyse ki, sklearn  veri kümesindeki özelliklerin tahmin gücünü açıklamamıza yardımcı olan  “ değişken önemi(feature importances)  ” adı verilen bir çıktı vermektedir  .  Ancak, bu çıktının dezavantajlarını ve bunların üstesinden nasıl geleceğimizi açıklayacağım. Verideki değişkenlerin anlam

Veri Bilimi ile COVID-19 Vaka Tahmini

Resim
 COVID-19 vaka sayılarında görüldüğü üzere değerler arasında bir korelasyon vardır. Bugünün değeri, yarın ve ondan sonraki birkaç gün için bize bir tahmin üretme olanağı tanır. Bu değerleri sıralı bir şekilde grafiğe döktüğümüzde eğrinin ilk başlarda üssel bir artışa sahip olduğunu ancak zamanla bu artışın yavaşladığını görürüz.  Buradan hareketle ileriye yönelik tahminleri değerler arasındaki farka bakarak daha kolay tahmin edebiliriz. Örneğin vaka sayısı iki gün önce 800 , dün 780 olan bir ülkede, bugün 760 civarında yeni vaka çıkacağını tahmin edebiliriz.  O yüzden verileri farklılaştırarak şu şekilde dönüştürebiliriz :  değer(t) = gözlem(t) - gözlem(t - 1) Model Kurulumu

COVID-19 İçin Veri Görselleştirmesi: İtalya-Türkiye-İran Karşılaştırması

Resim
 COVID-19 salgını ilk başladığında Çin hariç hemen hemen tüm ülkeler bu durumu pek ciddiye almadı. Virüs kapıdan içeri girdiğinde bile alınan önlemler yetersizdi ve bu durum çok daha büyük felaketlere yol açtı. Virüs kimi ülkelerde çok hızlı yayıldı ve öldürücülük oranı normalin üstüne çıktı. Uzmanlar uzunca bir süredir bu konu hakkında düşünüp konuşuyorlar. Bu yazımızda biz de birbirlerine her açıdan çok benzeyen üç ülke ;İtalya,Türkiye ve İran'ın COVID-19 verilerine göz atacağız. Grafikler üzerinden farklılıkları anlamaya ve çıkarımlar yapmaya çalışacağız. İlk Bakış : Pandemi Öncesi Genel Bilgiler