Implementasi Imputasi Data Berbasis Machine Learning Pada IoT Gateway
Jovanka Addin Prasetya Alief, Bakhtiar Alldino Ardi Sumbodo, S.Si., M.Cs., Drs. Bambang Nurcahyo Prastowo, M.Sc., Dr. Yohanes Suyanto, M.I.Kom.
2025 | Skripsi | ELEKTRONIKA DAN INSTRUMENTASI
Sistem Permasalahan hilangnya data pada jaringan Internet of Things (IoT) menjadi tantangan kritis yang dapat mengurangi keandalan sistem pemantauan. Penelitian ini bertujuan untuk merancang, mengimplementasikan, dan mengevaluasi sebuah sistem imputasi data berbasis machine learning yang diimplementasikan secara langsung pada IoT gateway (edge computing) untuk mengatasi masalah tersebut. Sistem ini dirancang untuk menangani data yang hilang pada pemantauan suhu dan kelembapan, dengan memanfaatkan korelasi temporal antar node sensor.
Metodologi penelitian meliputi perancangan sistem yang terdiri dari enam node sensor berbasis ESP32 dengan sensor SHT20 dan sebuah IoT gateway menggunakan Raspberry Pi 4B. Algoritma K-Nearest Neighbors (KNN) yang dimodifikasi (k=3) diterapkan pada gateway untuk melakukan imputasi pada data yang hilang secara Missing Completely At Random (MCAR) dengan skenario kehilangan data yang disimulasikan sebesar 10%, 20%, 30%, dan 40%. Evaluasi kinerja sistem diukur melalui uji fungsionalitas, akurasi dengan metrik Mean Absolute Error (MAE) dan Root Mean Squared Error (RMSE), serta analisis beban komputasi pada gateway.
Hasil pengujian menunjukkan fungsionalitas sistem sangat tinggi, dengan keberhasilan imputasi mendekati 100%, meskipun ditemukan satu anomali kegagalan pada kondisi data tertentu. Dari segi akurasi, algoritma menghasilkan rata-rata MAE sebesar 0.351?C dan RMSE 0.634?C untuk suhu, serta rata-rata MAE sebesar 0.876?n RMSE 1.622% untuk kelembapan. Nilai error ini terbukti berada dalam rentang toleransi akurasi sensor SHT20 (±0.3?C untuk suhu dan ±3% untuk kelembapan), yang mengindikasikan bahwa data hasil imputasi memiliki keandalan setara dengan data pengukuran asli. Analisis komputasi menunjukkan penggunaan CPU yang efisien dengan pemanfaatan komputasi paralel, namun mengindikasikan adanya potensi kebocoran memori (memory leak) skala kecil pada penggunaan RAM dalam jangka panjang. Secara keseluruhan, sistem imputasi berbasis KNN pada IoT gateway terbukti menjadi solusi yang efektif, akurat, dan efisien untuk menjaga integritas data pada sistem pemantauan lingkungan.
The issue of missing data in Internet of Things (IoT) networks presents a crit-ical challenge that can reduce the reliability of monitoring systems. This research aims to design, implement, and evaluate a machine learning-based data imputation system implemented directly on an IoT gateway (edge computing) to address this problem. The system is designed to handle missing data in temperature and hu-midity monitoring by leveraging temporal correlations among sensor nodes.
The research methodology involves designing a system comprising six sensor nodes based on ESP32 with SHT20 sensors and an IoT gateway using a Raspberry Pi 4B. A modified K-Nearest Neighbors (KNN) algorithm (k=3) is implemented on the gateway to perform imputation on Missing Completely At Random (MCAR) data, with simulated data loss scenarios of 10%, 20%, 30%, and 40%. System per-formance is evaluated through functionality tests, accuracy measured by Mean Ab-solute Error (MAE) and Root Mean Squared Error (RMSE) metrics, and an analy-sis of the computational load on the gateway.
The test results show very high system functionality, with an imputation suc-cess rate approaching 100% , although one anomaly was noted under specific data conditions. In terms of accuracy, the algorithm achieved an average MAE of 0.351?C and an RMSE of 0.634?C for temperature, along with an average MAE of 0.876% and an RMSE of 1.622% for humidity. These error values are proven to be within the accuracy tolerance range of the SHT20 sensor (±0.3?C for temperature and ±3% for humidity), indicating that the imputed data has a reliability compara-ble to the original measurements. Computational analysis reveals efficient CPU usage with effective utilization of parallel computing but suggests a potential for a small-scale memory leak in long-term RAM usage. Overall, the KNN-based impu-tation system on the IoT gateway proves to be an effective, accurate, and efficient solution for maintaining data integrity in environmental monitoring systems.
Kata Kunci : Imputasi Data, Machine Learning, KNN, Internet of Things, IoT Gateway, Edge Computing, Data Hilang