Pengenalan Pola Permainan Bonang Barung Berbasis Spectral Subtraction dan Neural Network
Viga Laksa Hardjanto, Wahyono, S Kom., Ph.D.
2025 | Tesis | S2 Ilmu KomputerKecerdasan artifisial terus berkembang dan mampu memenuhi berbagai kebutuhan manusia, termasuk dalam pemrosesan data audio, teks, dan gambar. Namun, dalam dunia nyata kualitas data audio sering kali terpengaruh oleh kontaminasi noise yang menyebabkan penurunan kualitas secara signifikan. Penelitian ini bertujuan untuk meningkatkan kinerja klasifikasi audio menggunakan metode neural network dengan fokus pada peningkatan kualitas audio. Dataset yang digunakan adalah rekaman audio dari teknik permainan instrumen gamelan bonang barung. Penelitian ini menggunakan fitur Mel Frequency Cepstral Coefficients (MFCC) dan mel spektrogram untuk mengidentifikasi fitur terbaik dalam menganalisis data gamelan. MFCC dipilih karena kemampuannya memodelkan respons pendengaran manusia dengan skala logaritmik. Hasil penelitian menunjukkan bahwa model multi layer perceptron (MLP) mampu mengklasifikasikan berbagai teknik permainan gamelan seperti gembyang, mipil lamba, mipil rangkep, nduduk gembyang, dan mbalung. Metode spectral subtraction terbukti efektif dalam meningkatkan kualitas audio yang berdampak pada peningkatan kinerja model. Namun, metode ini memiliki kekurangan karena potensi munculnya artefak yang dapat memengaruhi kualitas audio. Pada pengujian akhir, model MLP mencapai akurasi 87,22?ngan noise dan meningkat menjadi 90% setelah noise dibersihkan.
Artificial intelligence (AI) is constantly growing and is capable of fulfilling various human needs, including processing audio, text, and images. However, in the real world, the quality of audio data is often affected by noise contamination which causes significant decrease in quality. This research aims to improve audio classification performance using neural network methods with a focus on improving audio quality. The dataset used consists of audio recordings of gamelan bonang barung instrument playing techniques. This research uses Mel Frequency Cepstral Coefficients (MFCC) and mel spectrogram features to identify the best features for analyzing gamelan data. MFCC was chosen for its ability to model human auditory response on a logarithmic scale. The results show that the Multi Layer Perceptron (MLP) model can classify various gamelan playing techniques such as gembyang, mipil lamba, mipil rangkep, nduduk gembyang, and mbalung. The spectral subtraction method proved effective in improving audio quality, which contributed to better model performance. However, this method has the drawback of introducing artifacts that may affect the audio quality. In the final test, the MLP model achieved 87,22?curacy with noise and increased to 90?ter the noise was removed.
Kata Kunci : Pengenalan Pola, Peningkatan Kualitas Audio, MFCC, Mel Spektrogram, Neural Network.