Bayes Teoremi Giriş

Bayes sınıflandırma, olasılığa dayalı bir sınıflandırma yöntemidir. Naive Bayes sınıflandırma uygulamasını geçmeden önce Bayes Teoremi altında yatan mantığı basit bir örnekle açıklayacağız. Bu teorem bir sonucun sebebini bulurken sonucun hangi olasılıkla hangi sebepten kaynaklandığını bulmaya yardımcı olur. Bu teorem koşullu olasılıktan faydalanır.

Bir market düşünelim. Markete iki ayrı marka yumurta gelmektedir. Edinilen tecrübe ve tutulan kayıtlardan yumurtalar ile ilgili bilgiler şu şekildedir:

  1. Markalar; Şefkat Yumurta ve Yerimdar Yumurta
  2. Günlük tedarik miktarı; Şefkat 800, Yerimdar 600 adet
  3. Kırık yumurta oranı; %05

Buradaki soru şu: bir gün için Yerimdar’dan gelen bir yumurtanın kırık olma olasılığı nedir.

Mantığı işletelim:

Toplam 1400 yumurta,

600 adedi Yerimdar’dan geliyor

günlük 70 adet kırık yumurta (toplam  X kırık oranı)

Kırıkların markalara göre dağılımını eşit kabul edersek 35 adet Yerimdar

O halde Yerimdar’ın kırık olma olasılığı 35/600 = % 058333

Bunu Bayes teoremi formülü ile yapalım. Formül:

Örneğimize uyarlayalım:

Formülün açıklaması:

Naive Bayes

Bayes teoreminin temelinden yukarıda bahsettik şimdi Naive Bayes sınıflandırıcıdan ve bunun mantığından biraz bahsedelim. Bir örnek üzerinden açıklayalım:

Bir grup insan olsun. Bunların yaş ve maaş bilgileri ile işe servis veya araba ile gittiklerine dair bilgiler elimizde olsun. Biz yeni bir insanın yaş ve maaş bilgilerine dayanarak işe servis veya araba ile gideceğini Naive Bayes kullanarak tahmin etmeye çalışalım. Bir kere bir kişi işe gidiyorsa ya servis ile ya da özel arabası ile gidiyor olsun ve başka bir ihtimal söz konusu olmasın. Öyleyse araba ile işe gitme ihtimali ile servisle işe gitme ihtimalinin toplamı bire eşit olacaktır. Şöyle yapacağız. Servisle işe gitme olasılığını ve araba işe gitme olasılığını hesaplayacağız. Sonuçta büyük olan hangi oran ise o sınıfa dahil edeceğiz. Adım adım ilerleyelim:

  1. Servis ile işe gitme olasılığı: Burada yaş ve maaş bilgisi yok o yüzden servis ile gidenlerin toplam işe gidenlere oranı bulunur. Formül ile: P(Servis) = Servis kullanan sayısı / Çalışan sayısı
  2. Yeni bir nesneyi sınıflandırmaya karar verdiğimizde o nesnenin yakınında (o nesneye benzeyen) nesneleri içeren bir dairede bulunan nesnelerin toplama olan oranı bulunur. Bu oran dairenin genişliğine göre değişir.
  3. İkinci maddede bahsedilen daire içinde servis ile gidenlerin toplam servisle gidenlere oranı bulunur.
  4. Birinci ve üçüncü maddede bulunan oranların çarpımını ikinci maddede bulunan orana böldüğümüzde yaşı ve maaşı belli herhangi bir X kişisinin servis ile işe gitme olasılığını buluruz.
  5. İlk dört maddedeki işlemlerin aynısını arabayla işe gidenler için tekrarlayarak aynı kişinin araba ile işe gitme olasılığını hesaplarız.
  6. İki olasılığı karşılaştırırız. Hangi olasılık daha yüksek ise X şahsını o sınıfa (işe servisle veya arabayla giden) yerleştiririz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir