JARAK DYNAMIC TIME WARPING PADA METODE K-MEDOIDS UNTUK PENGELOMPOKAN DATA RUNTUN WAKTU (STUDI KASUS DATA KEMISKINAN INDONESIA MENURUT PROVINSI TAHUN 2012-2023)
RUNI HIDAYAHNA, Dr. Gunardi, M,Si.
2024 | Skripsi | STATISTIKA
Penyusunan kebijakan untuk memberantas kemiskinan dapat dilakukan dengan melihat data historis persentase penduduk miskin atau indeks P0 tiap provinsi. Untuk mengelompokkan provinsi di Indonesia menurut kemiripan pola dan karakteristik kemiskinannya dapat dilakukan dengan analisis klaster data runtun waktu. Salah satu metode analisis klaster yang dapat digunakan adalah metode k-medoids dengan algoritma PAM. Dalam pengelompokan data runtun waktu yang berbeda panjangnya, jarak euclidean yang umum digunakan pada analisis klaster data statis, tidak dapat digunakan, sehingga diperlukan jarak alternatif. Jarak Dynamic Time Warping (DTW) dapat menjadi alternatif. Jika dibandingkan dengan penggunaan jarak euclidean pada algoritma PAM untuk pengelompokan provinsi menurut data runtun waktu indeks P0 dengan panjang yang sama, penggunaan jarak DTW pada metode k-medoids dapat meningkatkan kualitas hasil pengelompokan, yakni meningkatkan koefisien silhouette sebesar 9?n menurunkan rasio average distance within-between cluster sebesar 20,8%. Pengelompokan provinsi di Indonesia menurut data runtun waktu indeks P0 dengan panjang yang berbeda menghasilkan kesimpulan bahwa penggunaan jarak DTW pada metode k-medoids dapat menghasilkan hasil pengelompokan yang tergolong sebagai good classification, yakni dengan koefisien silhouette sebesar 0,702 dan rasio average distance within-between cluster sebesar 0,216. Dari dua studi kasus, diperoleh kesimpulan bahwa penggunaan jarak DTW pada metode k-medoids dapat menghasilkan hasil pengelompokan yang baik.
Policy formulation to eradicate poverty can be done by looking at historical data on the percentage of poor people or the P0 index for each province. To group provinces in Indonesia according to the similarity of their poverty patterns and characteristics, a time series clustering can be done. One of the cluster analysis methods that can be used is the k-medoids method with the PAM algorithm. In clustering time series data of different lengths, the euclidean distance, which is commonly used in static data cluster analysis, cannot be used, so an alternative distance is needed. Dynamic Time Warping (DTW) distance can be an alternative. When compared with the use of euclidean distance in the PAM algorithm on clustering provinces in Indonesia according to P0 index time series data of the same length, the use of DTW distance results in the conclusion that the use of DTW distance in the k-medoids method can improve the quality of clustering results, which increase the silhouette coefficient by 9% and reducing the average distance within-between cluster ratio by 20.8% compared to the use of euclidean distance in the k-medoids method. Clustering provinces in Indonesia according to P0 index time series data with different lengths resulted in the conclusion that the use ofDTW distance in the k-medoids method can produce clustering results classified as good classification, with a silhouette coefficient value at 0.702 and an average within-between cluster ratio distance at 0.216. From the two case studies, it was concluded that the use of DTW distance in the k-medoids method can produce good clustering results.
Kata Kunci : Persentase Penduduk Miskin, Analisis Klaster, Jarak Dynamic Time Warping, Jarak Euclidean, K-Medoids, Algoritma PAM (Partitioning Around Medoids).