Estimasi Curah Hujan dari Data Multikanal Himawari-8/9 Menggunakan Machine Learning dan Metode Konvensional di Pulau Bali
Floren Silvana Ayu Silalahi, Dr. Nur Mohammad Farda, S.Si., M.Cs.;Dr. Emilya Nurjani, S.Si., M.Si.
2024 | Tesis | S2 Penginderaan Jauh
Salah satu tantangan yang sering dihadapi untuk mendapatkan estimasi curah hujan adalah keterbatasan pada data dengan resolusi spasial dan temporal yang tinggi, sehingga pengindraan jauh hadir untuk mengatasi masalah tersebut. Estimasi curah hujan dengan memanfaatkan pengindraan jauh dapat dilakukan dengan metode konvensional (AE, IMSRA, NI, dan NR) yang menggunakan satu saluran inframerah. Namun, seiring dengan perkembangan teknologi, machine learning (ML) hadir untuk memanfaatkan penggunaan variabel masukan yang lebih bervariasi. Oleh karena itu, tujuan dari penelitian ini yaitu memanfaatkan ML untuk mengembangkan model estimasi curah hujan, kemudian mengevaluasi akurasi model, serta mengimplementasikan model untuk memetakan variabilitas curah hujan pada wilayah penelitian.
Data utama pada penelitian ini yaitu data dari 16 kanal satelit Himawari-8/9 yang disandingkan dengan data curah hujan dari 30 titik penakar hujan otomatis milik Badan Meteorologi Klimatologi dan Geofisika (BMKG). Jumlah data yang digunakan sebanyak 67.428 data latih dan 12.854 data uji yang diperoleh pada periode data selama 36 bulan. Tahapan ML pada penelitian ini terdiri pra-pemrosesan data, pelatihan dan evaluasi model, serta implementasi. Model ML dilatih dengan menggunakan algoritma Random Forest (RF) yang dilakukan secara bertahap yaitu (i) klasifikasi piksel hujan dan tidak hujan (ii) pengklasifikasian kelas hujan dan (iii) estimasi curah hujan. Model ML dilatih dengan menggunakan 2 skenario dengan perbedaan data masukan.
Hasil evaluasi model dengan metode konvensional memperlihatkan bahwa persamaan yang paling sesuai untuk wilayah Pulau Bali yaitu IMSRA dengan % Mean Absolute Error (MAE) 102.453%, namun model ML memperoleh hasil evaluasi yang lebih baik dibandingkan dengan model IMSRA. Pada model klasifikasi hujan dan tidak hujan, model ML memiliki akurasi di atas 80%, kemudian pada model klasifikasi kelas hujan memiliki akurasi diatas 70%. Performa model ML secara keseluruhan menghasilkan estimasi curah hujan dengan selisih 30,947 % (skenario 1) dan 29,978% (skenario 2). Perbandingan antar model ML memperlihatkan bahwa model ML pada skenario 2 yang memanfaatkan seluruh data satelit memiliki %MAE yang lebih rendah dibandingkan dengan model ML yang hanya menggunakan data IR saja. Penelitian ini mendukung bahwa penambahan informasi spektral pada proses pemodelan menghasilkan akurasi yang lebih tinggi.
One of the common challenges in obtaining accurate rainfall estimates is the limitation of data with high spatial and temporal resolution, which is where remote sensing comes in to address this issue. Rainfall estimation using remote sensing can be done with conventional methods (such as AE, IMSRA, NI, and NR), which rely on a single infrared channel. However, with advancements in technology, machine learning (ML) has emerged to make use of more diverse input variables. Therefore, the objective of this research is to utilize ML to develop a rainfall estimation model, evaluate the accuracy of the model, and implement the model to map rainfall variability in the study area.
The primary data in this study comes from 16 channels of Himawari-8/9 satellite data, combined with rainfall data from 30 automatic rain gauges provided by the Indonesian Meteorological, Climatological, and Geophysical Agency (BMKG). A total of 67,428 training data points and 12,854 testing data points were used, covering a 36-month period. The ML process in this study includes data preprocessing, model training and evaluation, and implementation. The ML model is trained using the Random Forest (RF) algorithm in three stages: (i) classification of rain and no-rain pixels, (ii) classification of rainfall intensity classes, and (iii) rainfall estimation. The model is trained using two scenarios with different input data.
The evaluation results of the model using conventional methods showed that the most suitable equation for the Bali Island region is IMSRA, with a %Mean Absolute Error (MAE) of 102.453%, but the ML model achieved better evaluation results compared to the IMSRA model. In the rain/no-rain classification model, the ML model achieved an accuracy of over 80%, while in the rainfall intensity classification model, the accuracy exceeded 70%. The overall performance of the ML model resulted in rainfall estimation differences of 30.947% (scenario 1) and 29.978% (scenario 2). A comparison between the ML models showed that the model in scenario 2, which utilized all satellite data, had a lower %MAE compared to the ML model that only used IR data. This research supports the idea that adding spectral information in the modeling process leads to higher accuracy.
Kata Kunci : Satelit Himawari, hujan, machine learning, konvensional, VNIR, SWIR, IR/Himawari Satellite, rainfall, machine learning, conventional, VNIR, SWIR, IR