Laporkan Masalah

Normalisasi Missing Value menggunakan Time Series Forecasting pada High Frequency Radar (HFR) Bali

Yuni Hartika, Ir. Adhistya Erna Permanasari, S.T., M.T., Ph.D., IPM.;Dr.Eng. Silmi Fauziati, S.T., M.T.

2024 | Tesis | S2 Teknologi Informasi

High frequency Radar (HFR) adalah sebuah instrumen yang digunakan untuk mengukur arus permukaan laut dan arah angin. Pengamatan arus laut secara real-time memang telah berjalan di beberapa titik pesisir laut. Namun, data yang dihasilkan tidak mengilustrasikan keseluruhan data karena adanya beberapa faktor yang menyebabkan data menjadi tidak lengkap dan mengalami missing value. Data yang hilang memiliki karakteristik hilang yang berbeda-beda seperti MCAR, MAR dan MNAR yang tidak boleh diabaikan karena dapat mengakibatkan kesalahan pemanfaatan data. Tindakan diperlukan untuk menangani data yang hilang guna mengidentifikasi pola data dan mendukung proses normalisasi data. Tujuan penelitian ini adalah mengatasi data hilang pada HFR Bali menggunakan metode BiLSTM dan menguji performa model dengan membandingkan hasil imputasi dengan metode tradisional lainnya. Penelitian ini akan berfokus pada pengisian nilai hilang dengan karakteristik hilang MAR dan MNAR. 

Time series Forecasting merupakan metode untuk memprediksi nilai pada data yang diamati dalam interval waktu yang teratur dan mampu menjadi pemecahan untuk prediksi data yang hilang secara acak. Bidirectional Long-short Term Memory (BiLSTM) digunakan karena kemampuannya mengenali pola dalam data berurutan dengan menganalisis dari arah maju dan mundur. Metode ini juga pengembangan dari LSTM yang dikenal mampu memberikan kinerja yang lebih baik pada data urutan waktu. BiLSTM juga dibandingkan dengan metode lainnya untuk mengukur performa model.

Hasil penelitian menunjukkan bahwa metode BiLSTM menghasilkan prediksi yang lebih akurat metode tradisional seperti Cubic Spline dan STL terutama pada data dengan karakteristik hilang MNAR. BiLSTM mendapatkan hasil RMSE dan MAE terkecil pada skenario missing 5%, 10%, 15%, 20%, dan 30% yaitu sebesar 17,77, 13,69,19,30, 19,74, 24,67 (komponen U) dan 11,28, 13,56, 19,32, 20,36, 25,37 (komponen V). 

High-frequency Radar (HFR) is an instrument used to measure ocean surface currents and wind direction. Real-time ocean current observations have indeed been carried out at several coastal points. However, the data produced does not illustrate the entire data because several factors cause the data to be incomplete and experience missing values. Missing data has different missing characteristics such as MCAR, MAR, and MNAR which should not be ignored because they can result in data utilization errors. Actions are needed to handle missing data to identify data patterns and support the data normalization process. The purpose of this study is to overcome missing data on the Bali HFR using the BiLSTM method and test model performance by comparing the imputation results with other traditional methods. This study will focus on filling in missing values with the characteristics of MAR and MNAR.

Time series Forecasting is a method for predicting values in data observed at regular time intervals and can be a solution for predicting randomly missing data. Bidirectional Long-short Term Memory (BiLSTM) is used because of its ability to recognize patterns in sequential data by analyzing from the forward and backward directions. This method is also a development of LSTM which is known to provide better performance on time series data. BiLSTM is also compared with other methods to measure model performance. 

The study results show that the BiLSTM method produces more accurate predictions than traditional methods such as Cubic Spline and STL, especially on data with MNAR missing characteristics. BiLSTM gets the smallest RMSE and MAE results in the 5%, 10%, 15%, 20%, and 30%  missing scenarios, namely 17,77, 13,69,19,30, 19,74, 24,67 (U component) and 11,28, 13,56, 19,32, 20,36, 25,37 (V component).

Kata Kunci : Arus Laut, HFR, Missing Value, Time series, BiLTSM

  1. S2-2024-508572-abstract.pdf  
  2. S2-2024-508572-bibliography.pdf  
  3. S2-2024-508572-tableofcontent.pdf  
  4. S2-2024-508572-title.pdf