Klasfikasi Suara Lingkungan dengan Metode Convolutional Neural Network dan Augmentasi Data
Alfina Shafiyyah Makarim, Dr. Mardhani Riasetiawan, SE Ak, M.T.
2025 | Skripsi | ELEKTRONIKA DAN INSTRUMENTASI
Suara lingkungan memiliki karakteristik yang lebih kompleks dibandingkan dengan suara lainnya. Data klasifikasi suara lingkungan berperan dalam memperoleh informasi terkait kondisi suatu lingkungan. Penelitian ini mengembangkan metode klasifikasi suara lingkungan menggunakan Convolutional Neural Network (CNN) dengan penerapan teknik augmentasi data. Dataset yang digunakan dalam penelitian ini terdiri dari ESC-50 dan UrbanSound8K. Proses ekstraksi fitur dilakukan dengan mengubah data suara menjadi Log-mel spectrogram untuk dapat diproses oleh model CNN. Augmentasi data diterapkan secara bertahap dengan menggunakan Gaussian noise dan time shifting. Penelitian ini menganalisis efektivitas augmentasi dengan membandingkan pada dataset dengan jumlah sampel yang berbeda.
Evaluasi model dilakukan untuk mengukur akurasi serta pengaruh penambahan augmentasi bertahap terhadap performa model klasifikasi suara lingkungan. Hasil penelitian menunjukkan bahwa augmentasi data membantu meningkatkan kemampuan model dalam mengenali pola suara baru yang belum pernah dilatih sebelumnya. Model CNN yang dikembangkan menunjukkan performa paling optimal saat diterapkan augmentasi sebesar 20?ngan akurasi tertinggi sebesar 85% pada dataset ESC-50 dan 98% pada dataset UrbanSound8K.
Environmental sounds have complex characteristics than other sounds. Environmental sounds classification data plays a crucial role in obtaining information about the condition of a given environment. This research develops a method for classifying environmental sounds using a Convolutional Neural Network (CNN) with data augmentation. The datasets used in this research consist of ESC-50 and UrbanSound8K. The feature extraction process is performed by converting the sound data into Log-mel spectrograms to enable processing by the CNN model. Data augmentation is applied incrementally using Gaussian noise and time shifting. The effectiveness of augmentation is analyzed by comparing datasets with different number of samples.
The model evaluation is conducted to measure accuracy and assess the impact of incremental augmentation on the performance of environmental sound classification. The results show that data augmentation enhances the model’s ability to recognize new sound patterns that have never been trained before. The developed CNN model achieves optimal performance when 20% augmentation is applied, attaining the highest accuracy of 85% on the ESC-50 dataset and 98% on the UrbanSound8K dataset.
Kata Kunci : Convolutional Neural Network, Klasifikasi Suara Lingkungan, Log-mel Spectrogram, Augmentasi Data