Clustering Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN) untuk Data Spasial (Studi Kasus: Pemetaan Kawasan Wisata Terpadu di Kabupaten Gunungkidul, Daerah Istimewa Yogyakarta)
LUTHFI SYAFI ABDILLAH, Dr. Dwi Ertiningsih, S.Si., M.Si.
2024 | Skripsi | STATISTIKA
Metode Clustering HDBSCAN
(Hierarchical Density-Based Spatial Clustering of Applications with Noise)
adalah pengembangan dari metode clustering DBSCAN dengan algoritma hierarchical
dan berbasis density. Algoritma ini memiliki kelebihan dapat menangani cluster
dengan bentuk yang beragam, dimensi yang tinggi, dan jumlah cluster yang
tidak menentu. Cluster ini cocok digunakan untuk data spasial tanpa
perlu menentukan parameter jumlah cluster yang optimal terlebih dahulu.
Dalam penelitian ini akan
digunakan metode clustering HDBSCAN untuk mengelompokkan data spasial
kemudian akan dibandingkan dengan metode clustering lainnya yaitu
KMeans, Agglomerative, dan DBSCAN. Studi kasus yang diambil adalah data
koordinat lokasi wisata di Kabupaten Gunungkidul, Daerah Istimewa Yogyakarta.
Metode HDBSCAN menghasilkan 24 kelompok lokasi wisata di Kabupaten Gunungkidul,
Daerah Istimewa Yogyakarta. Diperoleh bahwa metode clustering HDBSCAN
lebih baik dalam mengelompokkan lokasi wisata dengan nilai Silhouette Score,
Davis-Bouldin Index, Calinski-Harabasz Index, jarak rata-rata, dan jarak maksimal antar lokasi
wisata dalam cluster yang terbaik dibandingkan metode lainnya.
HDBSCAN (Hierarchical
Density-Based Spatial Clustering of Applications with Noise) is a development
of the DBSCAN clustering method with a hierarchical and density-based
algorithm. This algorithm has the advantage of being able to handle clusters
with diverse shapes, high dimensions, and an uncertain number of clusters. This
cluster is suitable for spatial data without the need to determine the optimal
number of cluster parameters first.
In this research, the HDBSCAN clustering method will be used to cluster spatial data and then will be compared with other clustering methods, namely KMeans, Agglomerative, and DBSCAN. The case study taken is the coordinate data of tourist locations in Gunungkidul Regency, Yogyakarta Special Region. The HDBSCAN method produces 24 groups of tourist locations in Gunungkidul Regency, Yogyakarta Special Region. The HDBSCAN clustering method was found to be superior to other methods in terms of grouping tourist sites with the best Silhouette Score, Davis-Bouldin Index, Calinski-Harabasz Index, average distance, and maximum distance between tourist sites in the cluster.
Kata Kunci : clustering, HDBSCAN, spasial, potensi daerah, pariwisata