Laporkan Masalah

Pengelompokan Data Gempa Bumi di Indonesia Menggunakan Metode Reduksi Dimensi t-SNE dan Metode Klastering DBSCAN

ATIKA INDAH MENTARI, Dr. Irwan Endrayanto A., S.Si., M.Sc.

2024 | Skripsi | STATISTIKA

Indonesia merupakan negara yang terletak di pertemuan tiga titik lempeng besar bumi dan wilayah Cincin Api Pasifik yang menyebabkan banyak terjadi gempa bumi di Indonesia yang dapat menimbulkan banyak kerugian. Salah satu langkah dalam meminimalisir dampak yang mungkin terjadi adalah dengan mengenali karakteristik gempa bumi di Indonesia melalui pengelompokan data atau klastering. Pada penelitian ini, dilakukan klastering gempa bumi di Indonesia menggunakan metode density-based spatial clustering of applications with noise (DBSCAN) pada data gempa bumi di Indonesia tahun 2019 hingga tahun 2023 yang akan dianalisis per tahun. Variabel digunakan adalah longitude, latitude, magnitude, dan depth. Pada analisis klastering menggunakan DBSCAN, terdapat metode penentuan parameter ? pada DBSCAN dengan melihat knee point pada k-distance plot. Namun, metode tersebut tidak dapat memberikan hasil yang optimal sehingga diperlukan pemahaman terhadap data melalui penyederhanaan data menggunakan metode reduksi dimensi nonlinear t-distributed stochastic neighbor embedding (t-SNE) yang mempermudah visualisasi data, mampu mempertahankan struktur data, dan diharapkan mempermudah penyetelan parameter pada DBSCAN. Hasil dari DBSCAN tanpa menggunakan reduksi dimensi dan menggunakan reduksi dimensi t-SNE dievaluasi menggunakan average silhouette score dan indeks Davies Bouldin. Hasil evaluasi menunjukkan bahwa klastering gempa bumi di Indonesia menggunakan metode reduksi dimensi t-SNE pada metode klastering DBSCAN memberikan hasil yang lebih baik daripada tanpa metode reduksi dimensi t-SNE.

Indonesia is a country located at the intersection of three major tectonic plates and within the Pacific Ring of Fire, which results in frequent earthquakes that can cause significant damage. One of the steps to minimize the potential impact is to understand the characteristics of earthquakes in Indonesia through data clustering. This study aims to cluster earthquakes in Indonesia using the density-based spatial clustering of applications with noise (DBSCAN) method on earthquake data from 2019 to 2023, analyzed annually. The variables to be used are longitude, latitude, magnitude, and depth. In the clustering analysis using DBSCAN, there is a method for determining the parameter ? by examining the knee point on the k-distance plot. However, this method may not provide optimal results, so a better understanding of the data is needed by simplifying the data using the nonlinear dimensionality reduction method t-distributed stochastic neighbor embedding (t-SNE), which facilitates data visualization, preserves data structure, and is expected to assist in tuning DBSCAN parameters. The results of DBSCAN without dimensionality reduction and with t-SNE dimensionality reduction are evaluated using the average silhouette score and Davies Bouldin index. The evaluation results indicate that earthquake clustering in Indonesia using the t-SNE dimensionality reduction method applied to DBSCAN clustering produced better results compared to DBSCAN without t-SNE dimensionality reduction.

Kata Kunci : gempa bumi, klastering, DBSCAN, reduksi dimensi, t-SNE

  1. S1-2024-459358-abstract.pdf  
  2. S1-2024-459358-bibliography.pdf  
  3. S1-2024-459358-tableofcontent.pdf  
  4. S1-2024-459358-title.pdf