Laporkan Masalah

Clustering Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN) untuk Data Spasial (Studi Kasus: Pemetaan Kawasan Wisata Terpadu di Kabupaten Gunungkidul, Daerah Istimewa Yogyakarta)

LUTHFI SYAFI ABDILLAH, Dr. Dwi Ertiningsih, S.Si., M.Si.

2024 | Skripsi | STATISTIKA

Metode Clustering HDBSCAN (Hierarchical Density-Based Spatial Clustering of Applications with Noise) adalah pengembangan dari metode clustering DBSCAN dengan algoritma hierarchical dan berbasis density. Algoritma ini memiliki kelebihan dapat menangani cluster dengan bentuk yang beragam, dimensi yang tinggi, dan jumlah cluster yang tidak menentu. Cluster ini cocok digunakan untuk data spasial tanpa perlu menentukan parameter jumlah cluster yang optimal terlebih dahulu.

Dalam penelitian ini akan digunakan metode clustering HDBSCAN untuk mengelompokkan data spasial kemudian akan dibandingkan dengan metode clustering lainnya yaitu KMeans, Agglomerative, dan DBSCAN. Studi kasus yang diambil adalah data koordinat lokasi wisata di Kabupaten Gunungkidul, Daerah Istimewa Yogyakarta. Metode HDBSCAN menghasilkan 24 kelompok lokasi wisata di Kabupaten Gunungkidul, Daerah Istimewa Yogyakarta. Diperoleh bahwa metode clustering HDBSCAN lebih baik dalam mengelompokkan lokasi wisata dengan nilai Silhouette Score, Davis-Bouldin Index, Calinski-Harabasz Index, jarak rata-rata, dan jarak maksimal antar lokasi wisata dalam cluster yang terbaik dibandingkan metode lainnya.

HDBSCAN (Hierarchical Density-Based Spatial Clustering of Applications with Noise) is a development of the DBSCAN clustering method with a hierarchical and density-based algorithm. This algorithm has the advantage of being able to handle clusters with diverse shapes, high dimensions, and an uncertain number of clusters. This cluster is suitable for spatial data without the need to determine the optimal number of cluster parameters first.

In this research, the HDBSCAN clustering method will be used to cluster spatial data and then will be compared with other clustering methods, namely KMeans, Agglomerative, and DBSCAN. The case study taken is the coordinate data of tourist locations in Gunungkidul Regency, Yogyakarta Special Region. The HDBSCAN method produces 24 groups of tourist locations in Gunungkidul Regency, Yogyakarta Special Region. The HDBSCAN clustering method was found to be superior to other methods in terms of grouping tourist sites with the best Silhouette Score, Davis-Bouldin Index, Calinski-Harabasz Index, average distance, and maximum distance between tourist sites in the cluster.

Kata Kunci : clustering, HDBSCAN, spasial, potensi daerah, pariwisata

  1. S1-2024-459364-abstract.pdf  
  2. S1-2024-459364-bibliography.pdf  
  3. S1-2024-459364-tableofcontent.pdf  
  4. S1-2024-459364-title.pdf