BİLDİRİLER

BİLDİRİ DETAY

Ümran ŞEKER ERTUĞRUL
CURE HİYERARŞİK KÜMELEME YÖNTEMİ
 
Veri analizinde sınıflandırma, kümeleme gibi teknikler yaygın olarak kullanılmaktadır. Kümeleme tekniği, uzaklık matrisi kullanılarak nesnelerin homojen veya heterojen olarak gruplanmasıdır. Kümeleme teknikleri, hiyerarşik ve hiyerarşik olmayan olmak üzere iki temel gruba ayrılmaktadır. Yapılan gruplama işleminde amaç, farklılıkları ve benzerlikleri en üst düzeye getirerek gruplamayı oluşturmaktır. Kümeleme yönteminde, CF ağacı olarak ifade edilen özellik ağacı kullanılmaktadır. CF ağacı yapısında ekleme, silme gibi işlemler yapılmaktadır. Ağaç dinamik bir şekilde büyümektedir. Kümeleme işleminin başlangıcında her birey bir küme olarak kabul edilir. Hiyerarşik kümeleme yönteminde, veriler arasında ilişki kurulur ve nesneler dizisi oluşur. Hiyerarşik kümeleme yöntemleri, BIRCH, CURE ve ROCK yöntemlerinden oluşmaktadır. CURE, kümeleme yöntemi BIRCH yönteminin geliştirilmesiyle oluşturulmuştur. Hiyerarşik metotların zayıflıklarını gidermek amacıyla ortaya çıkmıştır. Aykırı değerlerin kümelenmesi için uygundur. Büyük ölçekli verilerde kolay kümeleme yaptığı için CURE en çok tercih edilen hiyerarşik kümeleme yöntemlerinden birisi olarak kabul edilmektedir. Bu yöntem, kümeden dağıtılan noktaları seçer. Küme başına birden fazla temsil noktası vardır. Büyük veri kümelerinde kümelemeyi hızlandırmak için rastgele örnekleme ve bölümleme kombinasyonu kullanır. Kümeleme kalitesinden ödün vermeden büyük veri tabanları için iyi ölçekleme yapar. Algoritmanın başarılı sonuçlara ulaşabilmesi parametrelerin doğru seçilmesine bağlıdır. En iyisi sonuçların bulunabilmesi için algoritmanın birkaç kez tekrarlanması gerekebilir. Bu çalışmada, CURE kümeleme tekniğinin detaylı incelenmesi yapılarak diğer hiyerarşik kümeleme tekniklerine göre avantaj ve dezavantajları karşılaştırılmıştır.

Anahtar Kelimeler: BIRCH, CURE, Hiyerarşik Kümeleme, Kümeleme Teknikleri, ROCK



 


Keywords: