Laporkan Masalah

Pendeteksian Anomali Menggunakan Local Outlier Factor Pada Data Untuk Meningkatkan Performa Prediksi Jumlah Obat

EFREM HERI BUDIARTO, Adhistya Erna Permanasari, S.T., M.T., Ph.D;Silmi Fauziati, Dr.Eng., S.T., M.T

2020 | Tesis | MAGISTER TEKNOLOGI INFORMASI

Obat merupakan salah satu hal yang penting bagi rumah sakit. Hal ini dikarenakan obat dapat membantu kesembuhan pasien. Memahami fungsi obat yang sangat penting maka perlu dipastikan ketersediannya. Salah satu cara untuk memastikan ketersediaan obat adalah dengan melakukan prediksi berdasarkan dari data penggunaan yang ada. Melakukan prediksi tidaklah mudah apabila data yang ada terdapat noise atau anomali. Sehingga sebelum dilakukan prediksi, data perlu diberikan pra-pemrosesan untuk mendeteksi noise atau anomali. Untuk melakukan pendeteksian ini dapat dilakukan dengan menggunakan metode yang berbasis density. Salah satu metode yang mampu menangani anomali dan berbasis density adalah Local Outlier Factor (LOF). Metode ini mampu memisahkan data yang bersih dan anomali. Faktor lain yang mempengaruhi ketepatan dalam memprediksi adalah penghalusan data. Metode penghalusan yang dipilih pada penelitian ini adalah penghalusan Whittaker-Handerson. Metode ini cocok digunakan untuk data bertipe runtutan waktu. Data yang telah bersih dan telah dihaluskan dapat digunakan untuk melakukan prediksi. Penelitian ini menggunakan metode Artificial Neural Network (ANN), Gated Recurrent Unit (GRU) dan Long-Short Term Memories (LSTM) untuk melakukan prediksi. Hal itu dikarenakan performanya yang baik, kompleksitas model dan kemampuannya dalam memprediksi data timeseries. Penelitian ini bertujuan untuk mengetahui dampak dari anomali pada data terhadap performa prediksi. Performa prediksi diukur dalam Mean Squared Error (MSE). Hasil penelitian ini adalah LOF mampu menemukan anomali pada kedua dataset utama. Pada Dataset 1 didapatkan 3 anomali pada index 13, 20 dan 25 sedangkan pada Dataset 2 didapatkan 2 anomali pada index 38 dan 48. Anomali tersebut setelah diperbaiki dapat mempengaruhi performa secara signifikan. Metode GRU menghasilkan performa terbaik pada masing-masing dataset.

Medicine is one of the important things for hospitals, especially in the pharmaceutical department. This is because the drug can help patients recover faster. Understanding the function of drugs is very important, it is necessary to ensure availability. One way to ensure the availability of drugs is to make predictions based on available usage data. Making predictions is not easy if there is noise or anomaly in the data. So before the prediction is made, the data needs to be given pre-processing to detect noise or anomalies. To make this detection can be done using a density-based method. One method that is capable of handling anomalies and density-based is the Local Outlier Factor. This method can separate clean and anomalous data. Another factor that influences accuracy in predicting is data smoothing. Smoothing to data can improve accuracy. The method chosen in this study is Whittaker-Handerson refinement. This method is suitable for time series data types. Cleaned and smoothed data can be used to make predictions. This research uses Artificial Neural Network (ANN), Gated Recurrent Unit (GRU) and Long-Short Term Memories (LSTM) methods to make predictions. That is due to good performance, complexity of the model and its ability to predict timeseries data. This study aims to determine the impact of anomalies on data on predictive performance. Prediction performance is measured in Mean Squared Error (MSE). In this study, the results show that LOF can find anomalies in the two main datasets. In Dataset 1 there were 3 anomalies in index 13, 20 and 25 while in Dataset 2 there were 2 anomalies in index 38 and 48. Based on the Mann-Whitney test, there is a significant difference between the original data and the anomalous data that has been fixed. The best performance in this study was obtained by the GRU method in each dataset.

Kata Kunci : anomaly detection, artificial neuron network, gated recurrent unit, local outlier factor, long-short term memories, prediksi jumlah obat, whittaker-handerson

  1. S2-2020-422520-abstract.pdf  
  2. S2-2020-422520-bibliography.pdf  
  3. S2-2020-422520-tableofcontent.pdf  
  4. S2-2020-422520-title.pdf