Laporkan Masalah

Analisis Klaster Dengan Metode Robust Sparse K-means

YOSINTA MEGA MUSTIKA, Dr. Herni Utami, M. Si.

2018 | Skripsi | S1 STATISTIKA

Witten and Tibshirani (2010) mengusulkan algoritma untuk menemukan klaster dan memilih variabel yang tepat, bernama Sparse K-means. Sparse K-means sangat berguna apabila terdapat data dengan noise variable (variabel tanpa informasi yang berguna untuk membedakan klaster). Sparse K-means bekerja sangat baik pada data yang bersih tanpa noise variable dan data yang komplit tapi tidak dapat menanggani data yang mengandung pencilan ataupun missing value. Untuk mengatasi masalah ini, Kondo (2012) mengajukan robustification dari algoritma Sparse K-means berdasarkan algoritma Trimmed K-means dari Cuesta-Albertos et al (1997). Dengan menggabungkan antara algoritma Sparse K-means dan Trimmed K-means, Robust Sparse K-means dapat mengatasi dataset yang berukuran besar dan mengandung pencilan.

Witten and Tibshirani (2010) proposed an algorithm to simultaneously find clusters and select clustering variables, called sparse K-means. Sparse K-means is particularly useful when the dataset has large fraction of noise variable (that is, variables without useful information to separate the cluster). Sparse K-means works very well on clean and complete data but cannot handle outliers nor missing data. To remedy this problems, Kondo (2012) propose a robustification of their sparse K-means algorithm based on the trimmed K-means algorithm of Cuesta-Albertos et al (1997). By combining algorithm from sparse K-means and trimmed K-means, robust sparse K-means can handle high dimension data with outlier on it.

Kata Kunci : K-means, robust sparse K-means, sparse K-means, trimmed K-means, pencilan


    Tidak tersedia file untuk ditampilkan ke publik.