K-Ortalamalar Kümeleme (K-Means Clustering) Tekniğinde Küme Sayısını Belirlemek

Kümeleme serimizin son iki yazısında kümeleme konusuna giriş yaptık ve K-Ortalamalar algoritmasının temel çalışma mantığından bahsettik. Bu yazımızda küme sayısının nasıl seçileceğinden bahsedeceğiz.

Öncelikle bir çok konuda olduğu gibi ideal küme sayısını neye göre seçeceğimizi belirleyecek bir metrik olmalıdır. Kümelemedeki temel mantığı hatırlayalım: Birbirine benzeyenler, yakın olanlar aynı kümede olsun birbirine benzemeyenlerle mümkün olduğunca uzak olsunlar (yabancı düşmanlığı :)). Bunu sağlayacak bir metrik var: Within Clusters Sum of Square (WCSS) Türkçesi şöyle: Kümeler içi kareler toplamı.

WCSS =\sum _{ { P }_{ i }Kume_1 }^{ }{ mesafe({ P }_{ i },C_{ 1 })^{ 2 }+ } \sum _{ { P }_{ i }Kume_2 }^{ }{ mesafe({ P }_{ i },C_{ 2 })^{ 2 }+... }

Yukarıdaki resmin yardımıyla metriğimiz olan (WCSS) kümelerin kareler toplamına değinelim. Küme sayısını belirledik. Algoritmayı çalıştırdık. Algoritma her bir noktayı bir kümeye yerleştirdi. Her bir noktanın küme merkezine olan uzaklığının karesinin toplamını alıyoruz. Bunu her küme için yapıyoruz. Toplamda çıkan rakam ne kadar düşük ise kümeleme o kadar iyi çalışmış merkez noktalar ile kümeye dahil noktalar birbirine yakın durmuş demektir.

Bilmem aklınıza hiç geldi mi? Aslında her nokta bir kümedir ve aynı zamanda küme merkezidir. Her nokta aynı zamanda bir küme ve küme merkezi olursa mesafeler hep sıfır olacaktır. O halde her noktanın küme olduğu modelde WCSS sıfır olacaktır. Peki o halde bu model mi en iyi diyeceğiz? Tabi ki hayır. Eğer böyle dersek kümeleme yapmamızın anlamı kalmaz. Kümelemedeki temel amaç birbirine benzeyen nesneleri sınırlı bir sayıda kümede toplayabilmekti.

Yukarıda küme sayısı ve WCSS arasındaki ilişkiye dair grafiği görüyoruz.  İyi modelin WCSS’i daha düşük olur demiştik. Yukarıda küme sayısı 3’e kadar WCSS çok hızlı bir şekilde düşüyor. 3’ten sonra yatay seyretmeye başlıyor. Burada anlıyoruz ki 3 bu veri seti için optimal küme sayısıdır. Çünkü daha fazla küme WCSS’i azaltmadığı gibi modelin yorumlanabilirliğini (interpretibility) azaltıyor. Yönteme dirsek yöntemi (elbow method) deniyor.

Yöntem elbette oldukça keskin bir şekilde bize küme sayısını vermez. Bu konuda biraz da alan bilgisi ve veri bilimcinin yorumları devreye girer. Zaten algoritma parametre olarak araştırmacıdan bir küme sayısı istiyor. Bu sebeple bu yöntem küme sayısına karar vermede yardımcı olabilecek iyi bir yöntem olarak kabul edilebilir. Veri bilimcinin de bu kadarlık da olsa çorbada tuzu bulunsun değil mi? 🙂 Arkadaş her şeyi makineler yapacak da veri bilimci ne iş yapacak? Artık bir küme sayısını da seçiversin…

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Barkod Etiketi üretimi yapan firmaların işi ciddi bir iştir. Bu anlamda sizin de hangi firmayla çalışma yatığınız çok büyük önem taşır. Kullanım alanı sınırsızdır. Her alanda ve her sektörde bu etiketlere ihtiyaç duyulur. Etiket çeşitleri ve Barkod etiketleri, seri üretimle hazırlanmaktadır. Etiketler ahşap, plastik, metal ya da cam gibi ambalajlı ürünlerin üzerilerine ugulanır.
Mide botoksu midenin belirli yerlerine botoks maddesi enjekte etme suretiyle midedeki kasların çalışmasını sınırlandırmayı ve sayede midenin gıdaları sindirim sürecini yavaşlatarak buna bağlı olan açlık-tokluk hissi süresinin de uzatılmasını amaçlayan ameliyatsız kolay kilo verme tedavisidir. Botoks uygulanırken, midenin detaylı şekilde içerden görüntülenmesini sağlayan endoskopi uygulaması ile gerçekleştirilir. Bu sayede hastaya sadece gastroskpik uygulaması kadar bir rahatsızlık olur. Özellikle diyet programlarına ve düzenli egzersizlere uymakta zorlanan ve buna bağlı olarak da obeziteye yakalanan, bu yüzdende obezitenin sebep olduğu çeşitli sağlık sorunları olan kişiler için mide botoksu bir devrim niteliğindedir ve son yıllarda ülkemizde yaygın olarak kullanılmaktadır.
En güzel cami halısı dış avlusu olup bunun çevresi pencereli duvarlarla çevrilidir. Bu avulya 3 ü cephede olmak üzere, 8 kapıdan girilir. Şadırvan avlusu, 26 adet granit mermer ve porfir sütuna oturtulmuş, 30 kubbeyle çevrili geniş alandır. Mermer döşemeli bu geniş sahanın ortasında 6 mermer sütunlu şadırvan, sahanın azametini gösterir. Şadırvanın kemerleri, kabartma olarak Rumi geçmelerle ve köşebentleri, kabartma, lale ve karanfil motifleriyle bezelidir.
En güzel cami halısı dış avlusu olup bunun çevresi pencereli duvarlarla çevrilidir. Bu avulya 3 ü cephede olmak üzere, 8 kapıdan girilir. Şadırvan avlusu, 26 adet granit mermer ve porfir sütuna oturtulmuş, 30 kubbeyle çevrili geniş alandır. Mermer döşemeli bu geniş sahanın ortasında 6 mermer sütunlu şadırvan, sahanın azametini gösterir. Şadırvanın kemerleri, kabartma olarak Rumi geçmelerle ve köşebentleri, kabartma, lale ve karanfil motifleriyle bezelidir.
Termal Etiket Eco Termal etiket, yüzeyinde hami bir katman bulunmayan miktar çeşididir. Kumbara üzerine termal lamine edilmesi sonucunda oluşmaktadır. Kullanılan barkod yazıcının baş bölgesindeki ısı beraberlik birlikte termal sıvılaşma özelliği gösterir dahi bu şekilde Eco termal etiketin üzerine baskı alınır. Bu termal etiketlere yumruk termal olarak (ısıyla) yapılır ve yerde yüzden ribon kullanılmaz. Ribon kullanımı olmadığı için tahakküm maliyeti sıfıra yakındır.
Dijital Baskı ve baskı etiketi teknolojileri geliştikçe firmaların büyük ebatlı etiket ihtiyaçlarına da dijital çözümler sunulmaya başlamıştır. Böylece, birbirinden canlı renklerin ve kusursuz çizgilerin hakimiyetindeki büyük ebatlı dijital baskı etkileri; kurumsal firmaların reklam kampanyalarındaki en iddialı unsurlarına dönüşmüştür.