HISYAM MUSTOFA, Dr. Agfianto Eko Putro, M. Si.


Gamelan terdiri dari berbagai macam instrumen yang memiliki karakteristik dalam hal frekuensi dasar, amplitudo, sinyal envelope. Selain itu perbedaan cara memainkannya menghasilkan perbedaan daya sustain sinyal antar instrumen. Karakteristik tersebut menimbulkan masalah vanishing gradient pada model Elman Network yang digunakan pada penelitian sebelumnya. Model kurang akurat dalam mempelajari pendeteksian onset yang ada dalam sinyal instrumen Saron yang memiliki rata-rata interval onset lebih dari 0,6 detik. Penelitian ini berfokus pada penyelesaian vanishing gradient pada deteksi onset Gamelan. Transformasi paket wavelet dengan tipe coif5 digunakan untuk mengekstraksi fitur psychoacoustic critical bandwidth pada data. Sebagai model pelatihan, penelitian ini menggunakan jaringan BLSTM (Bidirectional Long Short Term Memory) dengan 2 hidden layer yang masing-masing memiliki 100 unit neuron. Metode peak picking penelitian ini menggunakan metode ambang batas fix dengan nilai 0,25. Penggunaan model BLSTM yang didukung oleh Transformasi Wavelet Packet diharapkan dapat mengatasi vanishing gradient yang ada pada arsitektur RNN sederhana. Model diuji berdasarkan 3 parameter evaluasi yaitu precision, recall dan F-Measure. Berdasarkan hasil percobaan model dapat mempertahankan nilai gradien pada norm 0,001 serta menurunkan nilai validation loss mendekati 0,03. Model dapat mempelajari instrumen saron yang memiliki dependensi jangka panjang. Dari total onset sebanyak 428 pada instrumen saron, model berhasil mendeteksi 426 secara benar, dengan 2 onset yang salah terdeteksi dan 2 onset yang tidak terdeteksi. Evaluasi menyeluruh untuk masing-masing precision, recall, dan F1-Measure algoritma ini mendapatkan 0,975, 0,945 dan 0,960.

Gamelan consists of various kinds of instruments that have characteristics in terms of fundamental frequency, amplitude, signal envelope. In addition, the difference in how to play it produces differences in signal sustain power between instruments. These characteristics cause vanishing gradient problems in the Elman Network model used in previous studies. The model is less accurate in studying the detection of onset in the signal of the Saron instrument which has an average interval of more than 0.6 seconds. This research focuses on solving the vanishing gradient in the detection of Gamelan onset. s Wavelet packet transformation with type coif5 is used to extract psychoacoustic critical bandwidth features in data. As a training model, this study uses a BLSTM (Bidirectional Long Short Term Memory) network with 2 hidden layers, each of which has 100 neuron units. The peak picking method in this study uses a fixed threshold method with a value of 0,25. The use of the BLSTM model supported by the Wavelet Packet Transform is expected to overcome the vanishing gradient that exists in a simple RNN architecture. The model was tested based on 3 evaluation parameters namely precision, recall and F-Measure. Based on the experimental results, the model can maintain the gradient value at the norm of 0.001 and reduce the validation loss value to close to 0,03. The model can learn Saron instrument that have long-term dependencies. Out of a total of 428 onsets on the Saron instrument, the model successfully detected 426 correctly, with 2 incorrectly detected and 2 undetected onsets. Overall evaluation for each of the precision, recall, and F1-Measure algorithms get 0.975, 0.945 and 0.960.

Kata Kunci : Music Information Retrieval, Deteksi Onset, Transformasi Wavelet, Bidirectional Long Short Term Memory

