Laporkan Masalah

Deteksi Okupansi Ruangan Menggunakan Microphone Array dengan Ekstraksi Fitur Mel-Frequency Cepstral Coefficient dan Direction of Arrival Berbasis Kecerdasan Buatan

ALIKA AMALIA PUTRI, Ir. Azkario Rizky Pratama, S.T., M.Eng., Ph.D.; Enas Dhuhri Kusuma, S.T., M.Eng.

2024 | Skripsi | TEKNIK ELEKTRO

Gedung konvensional sering kali mengonsumsi energi secara berlebih karena sistem HVAC dan penerangannya tidak menyesuaikan tingkat okupansi secara real-time. Upaya deteksi okupansi berbasis sensor konvensional, seperti PIR atau kamera, memiliki keterbatasan, seperti ketidakmampuan mendeteksi objek diam dan isu privasi. Untuk mengatasi hal ini, digunakan pendekatan berbasis audio menggunakan ReSpeaker Mic Array v2, yang mampu merekam suara dengan kualitas tinggi, mengurangi noise, dan mendeteksi arah datangnya suara atau direction of arrival (DOA). Fitur audio diekstraksi menggunakan Mel-Frequency Cepstral Coefficients (MFCC) dan dipadukan dengan informasi DOA untuk mengklasifikasikan status ruangan menjadi ruangan yang diam, satu orang berbicara, atau banyak orang berbincang.

Dataset selanjutnya menjadi masukan untuk metode pelatihan berbasis artificial intelligent (AI) yakni NN shallow, CNN, random forest, dan decision tree. Semua model dari keempat metode tersebut dievaluasi dengan menggunakan metrik evaluasi dan model terbaik ditentukan dengan menggunakan akurasi. Evaluasi menunjukkan bahwa CNN memberikan akurasi tertinggi sebesar 94,51%, diikuti NN shallow dengan akurasi 94,27?n waktu pelatihan yang lebih singkat. Terlihat pula metode berbasis tree memiliki performa yang lebih rendah dengan random forest sebesar 91,17?n decision tree sebesar 81,15%. Dengan akurasi yang hampir setara dengan CNN, tetapi dengan waktu pelatihan lebih cepat, NN shallow dapat menjadi pilihan yang lebih efisien dalam deteksi okupansi ruangan berbasis audio.

Conventional buildings often consume excessive energy as their HVAC systems and lighting do not adjust to real-time occupancy levels. Traditional occupancy detection methods using sensors, such as PIR or cameras, have limitations, including an inability to detect stationary objects and privacy concerns. To address these issues, an audio-based approach utilizing the ReSpeaker Mic Array v2 was proposed. This device captures high quality audio, reduces noise, and determines the direction of arrival (DOA) of sounds. Audio features were extracted using Mel-Frequency Cepstral Coefficients (MFCC) and combined with DOA information to classify room states into silent, one person talking, or multiple people talking. The dataset was then used to train artificial intelligence (AI) models, including Shallow Neural Network (SNN), Convolutional Neural Network (CNN), Random Forest (RF), and Decision Tree (DT). The models were evaluated based on performance metrics, with accuracy determining the best model. Results showed that CNN achieved the highest accuracy of 94.51%, followed by SNN at 94.27%, with the latter having faster training times. Tree-based methods showed lower performance, with Random Forest and Decision Tree achieving accuracies of 91.17% and 81.15%, respectively. With comparable accuracy to CNN but faster training times, SNN presents a more efficient option for audio-based room occupancy detection.

Kata Kunci : Deteksi Okupansi Ruangan, MFCC, Neural Network, Decision Tree, Random Forest

  1. S1-2024-460166-abstract.pdf  
  2. S1-2024-460166-bibliography.pdf  
  3. S1-2024-460166-tableofcontent.pdf  
  4. S1-2024-460166-title.pdf