Laporkan Masalah

METODE RCE-KMEANS UNTUK CLUSTERING DATA RCE-KMEANS METHOD FOR DATA CLUSTERING

IZMY ALWIAH MUSDAR, Dr. Azhari SN, M.T.

2014 | Tesis | S2 Ilmu Komputer

Clustering merupakan teknik analisa data yang telah banyak dimanfaatkan dalam berbagai bidang. Telah banyak metode yang dikembangkan untuk memecahkan berbagai masalah clustering seperti metode-metode dari bidang kecerdasan kelompok. Metode Rapid Centroid Estimation (RCE) merupakan salah satu metode clustering yang berbasis Particle Swarm Optimization. RCE, seperti varian PSO clustering lainnya, memiliki kelebihan yaitu hasil clustering tidak tergantung pada inisialisasi pusat cluster awal. RCE juga memiliki waktu komputasi yang jauh lebih cepat dibandingkan dengan metode sebelumnya yaitu Particle Swarm Clustering (PSC) dan modified Particle Swarm Clustering (mPSC), tetapi metode RCE memiliki standar deviasi kualitas skema clustering yang lebih tinggi dibandingkan PSC dan mPSC dimana ini dipengaruhi oleh variasi hasil clustering. Hal ini terjadi karena equilibrium state, yaitu kondisi dimana posisi partikel tidak mengalami perubahan lagi, kurang tepat pada saat kriteria berhenti tercapai. Metode RCE-Kmeans digunakan untuk memecahkan masalah equilibrium state pada metode RCE. Metode K-means diaplikasikan setelah equilibrium state metode RCE tercapai untuk memperbarui posisi partikel yang dihasilkan dari metode RCE. Dataset yang digunakan pada penelitian ini berjumlah 10. Kualitas skema clustering diukur dengan menggunakan overall entropy, overall purity serta percentage misclassification. Kualitas skema clustering yang dihasilkan oleh metode RCE-Kmeans kemudian dibandingkan dengan kualitas skema clustering dari metode RCE dan metode K-means. Hasil penelitian menunjukkan bahwa dari sepuluh dataset metode RCEKmeans memiliki nilai kualitas skema clustering yang lebih baik pada 7 dataset dibandingkan metode K-means dan lebih baik pada 8 dataset dibandingkan dengan metode RCE. Penggunaan K-means pada metode RCE juga mampu menurunkan nilai standar deviasi dari metode RCE. Kata kunci : Clustering Data, Particle Swarm, K-means, Rapid Centroid Estimation.

Clustering is a data analysis technique that has been widely used in various fields. There have been many methods developed for solving clustering problems such as the methods in swarm intelligence field. Rapid Centroid Estimation (RCE) is one of Particle Swarm Optimization based method. RCE, like other variants of PSO clustering, does not depend on the initial centroid. RCE also has faster computitional time than the previous method like Particle Swarm Clustering (PSC) and the modified Particle Swarm Clustering (mPSC). However, its standard deviation of clustering scheme quality is higher than the PSC and mPSC which is influenced by variations of clustering results. This occurs because of improper equilibrium state, a condition in which the position of the particle does not change anymore, when stopping criteria is reached. RCE-Kmeans using K-means is used to solve equilibrium state problem in RCE method. K-means is applied after equilibrium state of RCE reached to update particle position result of RCE. There are 10 dataset used in this study. The quality of clustering scheme is measured by overall entropy, overall purity, and percentage misclassification. The quality of clustering scheme of RCE-Kmeans metode is compared with The quality of clustering scheme of RCE and K-means. The result of this study shows that RCE-Kmeans has better quality of the clustering scheme in 7 of 10 dataset compared to K-means and better in 8 of 10 dataset then RCE method. Moreover, using K-means in RCE can decrease standard deviation value of RCE method. Keyword : Clustering, Particle Swarm, K-means, Rapid Centroid Estimation

Kata Kunci : Clustering Data, Particle Swarm, K-means, Rapid Centroid Estimation; Clustering, Particle Swarm, K-means, Rapid Centroid Estimation


    Tidak tersedia file untuk ditampilkan ke publik.