Laporkan Masalah

ANALISIS KLASTER MENGGUNAKAN ALGORITMA CLAM (CLUSTERING LARGE APPLICATION USING METAHEURISTICS) UNTUK DATASET BESAR DENGAN PENCILAN

NAURA GHINA AS-SHOFA, Vemmie Lestari Nastiti, S.Si., M.Sc.

2022 | Skripsi | S1 STATISTIKA

Analisis klaster non-hirarki atau partitioning methods merupakan metode analisis klaster yang jumlah klasternya ditentukan diawal dan setiap klaster memiliki titik pusat klaster. K-medoids adalah salah satu metode partitioning methods dengan medoid sebagai pusat klaster, dimana medoid merupakan objek yang letaknya terpusat pada suatu klaster, sehingga tangguh terhadap pencilan. Algoritma k medoids yang digunakan dalam penelitian ini adalah Clustering Large Application Using Metaheuristics (CLAM), di mana CLAM merupakan pengembangan dari algoritma Clustering Large Application based on Randomized Search (CLARANS) dalam meningkatkan kualitas analisis klaster dengan mengaplikasikan hybrid metaheuristik antara Tabu Search (TS) dan Variable Neighborhood Search (VNS). Metode CLAM menggunakan empat parameter, yaitu numlocal untuk membatasi iterasi, maxneighbor untuk membatasi neighbor pada suatu node, tls untuk membatasi node yang disimpan dalam tabu list dan setradius untuk mengatur jadwal pengurangan linear. Metode analisis klaster terbaik untuk mengelompokkan kecamatan yang ada di Pulau Sumatera berdasarkan ketersediaan SD dan standar proses SD adalah metode CLAM dengan k = 6, numlocal = 2, maxneighbor = 154, tls = 50 dan setradius = 100-10:5. Pada studi kasus, dapat diketahui bahwa berdasarkan nilai overall average silhouette width metode CLAM lebih baik dibandingkan metode CLARANS.

Non-hierarchical clustering or partitioning methods is a cluster analysis method that the number of clusters is determined at the beginning and each cluster has a center cluster. K-medoids is one of the partitioning methods with the medoid as its center cluster, where medoid is the most centrally located object in a cluster, which is robust to outliers. The k-medoids algorithm used in this study is Clustering Large Application Using Metaheuristics (CLAM), where CLAM is a development of the Clustering Large Application based on Randomized Search (CLARANS) algorithm in improving the quality of cluster analysis by using hybrid metaheuristics between Tabu Search (TS ) and Variable Neighborhood Search (VNS). The CLAM method uses four parameters, named as numlocal to limit iterations, maxneighbor to limit neighbors to a node, tls to limit nodes stored in the tabu list and setradius to set a linear reduction schedule. The best cluster analysis method for classifying sub-districts on the island of Sumatra based on elementary school availability and elementary school process standards is the CLAM method with k=6, numlocal = 2, maxneighbor = 154, tls = 50 and setradius = 100-10:5. In the case study, it can be seen that based on the overall average silhouette width value, the CLAM method is better than the CLARANS method.

Kata Kunci : k-medoids, Clustering Large Application Using Metaheuristics, pencilan, dataset besar, silhouette width, Clustering Large Application based on Randomized Search, Tabu Search, Variable Neighborhood Search