İçerik
Küme analizi, verileri benzer özelliklere dayalı temsili gruplar halinde organize etme yöntemidir. Kümenin her üyesi, aynı kümenin diğer üyeleriyle, diğer grupların üyelerinden daha fazla ortak noktaya sahiptir. Grup içindeki en temsili noktaya centroid denir. Genellikle bu, kümedeki veri noktalarının değerlerinin ortalamasıdır.
Verileri düzenleyin. Veriler tek bir değişkenden oluşuyorsa, histogram uygun olabilir. İki değişken varsa, verileri bir koordinat düzlemi üzerinde grafik haline getirin. Örneğin, bir sınıftaki okul çocuklarının boyuna ve kilosuna bakıyorsanız, her çocuğun veri noktalarını grafik üzerinde çizin, ağırlık yatay eksen ve yükseklik dikey eksendir. İkiden fazla değişken varsa, verileri görüntülemek için matrisler gerekebilir.
Verileri kümeler halinde gruplandırın. Her küme, kendisine en yakın veri noktalarından oluşmalıdır. Boy ve kilo örneğinde, birbirine yakın görünen herhangi bir veri noktasını gruplayın. Küme sayısı ve her noktanın bir kümede olması gerekip gerekmediği, çalışmanın amaçlarına bağlı olabilir.
Her küme için tüm üyelerin değerlerini ekleyin.Örneğin, bir veri kümesi (80, 56), (75, 53), (60, 50) ve (68,54) noktalarından oluşuyorsa, değerlerin toplamı olacaktır (283, 213).
Toplamı kümenin üye sayısına bölün. Yukarıdaki örnekte, dörde bölü 283, 70,75 ve dörde bölü 213, 53,25'tir, yani kümenin centroid değeri (70,75, 53,25).
Küme centroidlerini çizin ve herhangi bir noktanın başka bir kümenin centroidine, kendi kümelerinin centroidinden daha yakın olup olmadığını belirleyin. Herhangi bir nokta farklı bir centroid'e daha yakınsa, onları daha yakın centroid içeren kümeye yeniden dağıtın.
Tüm veri noktaları en yakın oldukları centroidi içeren kümede bulunana kadar Adım 3, 4 ve 5'i tekrarlayın.