Laporkan Masalah

Komposisi Potongan Musik Menggunakan Gated Recurrent Unit dan Notewise Encoding pada Berkas Musical Instrument Digital Interface

SEPTIAN WIJAYA, Anny Kartika Sari, S.Si., M.Sc., Ph.D

2020 | Skripsi | S1 ILMU KOMPUTER

Seiring berkembangnya teknologi, manusia kini dapat menciptakan berbagai hal dengan bantuan teknologi digital, salah satunya hiburan berupa musik. Musik kini dapat diciptakan menggunakan proses pembelajaran mesin. Salah satu teknik yang umum digunakan adalah model model neural network dengan sel recurrent neural network (RNN) dan long short-term memory (LSTM) dengan input yang bervariasi. Terdapat penelitian baru yang mencoba merepresentasikan input dengan pendekatan natural language processing (NLP) yang diberi nama notewise encoding. Ditemukan juga penelitian yang menunjukkan performa varian RNN bernama gated recurrent unit (GRU) memiliki performa yang sebanding dengan LSTM yang umum digunakan namun dengan waktu latih yang lebih rendah. Pada penelitian ini dibuat model menggunakan representasi input notewise encoding terhadap model neural network yang menggunakan sel GRU. Model dilatih menggunakan dataset berkas MIDI yang berisikan melodi piano ciptaan komposer klasik. Model yang telah dilatih dibandingkan antara varian GRU dengan LSTM dan musik ciptaan model terbaik diujikan pada manusia untuk menentukan seberapa baik model dalam menciptakan musik. Berdasarkan penelitian yang dilakukan ditemukan bahwa model GRU merupakan model dengan evaluasi kuantitatif terbaik denganwaktu latih sebesar 267.9972s/epoch dan loss pada data tes sebesar 1.22235, dibandingkan dengan model LSTM memiliki waktu latih sebesar 313.9038s/epoch dan loss pada data tes sebesar 1.21709. Berdasarkan hasil proses penyaringan klip, 34 dari 100 klip komposisi model berhasil menyerupai komposisi manusia. Hasil tes "identify the human" menunjukkan bahwa 68% klip musik berhasil diidentifikasi oleh responden awam, dan 84% oleh responden ahli.

Along with the development of technology, humans can now create various things with digital technology, one of which is entertainment in the form of music. Music can now be created using the machine learning process. One of the techniques commonly used is the neural network model with a recurrent neural network (RNN) cells and long short-term memory (LSTM) with various inputs. New research tries to represent input with a natural language processing (NLP) approach named notewise encoding. Research has also found that the RNN variant's performance called the gated recurrent unit (GRU), has a performance comparable to the commonly used LSTM but with a lower training time. In this study, a model was created using an input representation notewise encoding to a neural network model using GRU cells. The models are trained using a dataset of MIDI files containing piano melodies created by classical composers. The trained model was compared between the GRU variants with the LSTM, and the best model-created music was tested on humans to determine how well the model was at creating music. Based on the research conducted, it was found that the GRU model was a model with the best quantitative evaluation with a training time of 267.9972s / epoch and a loss of 1.22235 in the test data, compared to the LSTM model, which had a training time of 313.9038s / epoch and a loss of 1.21709 test data. Based on the clip screening process results, 34 of the 100 clips of the model composition managed to resemble human compositions. The "identify the human" test results showed that lay respondents identified 68% of music clips and 84% by expert respondents.

Kata Kunci : Komposisi musik, GRU, LSTM, notewise encoding, MIDI

  1. S1-2020-398528-abstract.pdf  
  2. S1-2020-398528-bibliography.pdf  
  3. S1-2020-398528-tableofcontent.pdf  
  4. S1-2020-398528-title.pdf  
  5. S1-2021-398528-abstract.pdf  
  6. S1-2021-398528-bibliography.pdf  
  7. S1-2021-398528-tableofcontent.pdf  
  8. S1-2021-398528-title.pdf