Laporkan Masalah

SINTESIS NYANYIAN BERBAHASA INDONESIA BERBASIS KONTROL F0 MENGGUNAKAN MBROLA

GALIH PRABASIDI, Dr. Yohanes Suyanto, M.I.Kom.

2019 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASI

Penelitian ini bertujuan untuk melalukan pembuatan sistem suara nyanyian yang berbasis kontrol F0 dengan menggunakan metode penyambung diphone MBRO- LA. Sintesis nyanyian berbahasa Indonesia dibuat dengan cara menggunakan backend TTS (Text to Speech) yaitu MBROLA. Masukan backen TTS yang digunakan untuk menyediakan informasi-informasi fonem seperti not dan lirik, yaitu berkas MIDI. Saat manusia bernyanyi, grafik F0 yang dihasilkan memiliki beberapa macam fluk- tuasi, diantaranya yaitu overshoot, vibrato, dan preparation. Agar hasil sintesis sua- ra lebih alami maka informasi F0 perlu ditambah fluktuasi-fluktuasi di atas. Proses penambahan fluktuasi ini yaitu kontrol F0 (frekuensi dasar). Respon impuls untuk masing-masing fluktuasi F0 menggunakan rumus yang dikembangkan oleh Saitou dkk. Selain fluktuasi F0, terdapat juga waktu reaksi perubahan F0, yaitu waktu yang dibutuhkan untuk perubahan dari satu frekuensi ke frekuensi lainnya. Untuk waktu reaksi ini menggunakan persamaan yang dikembangkan oleh Xu dan Sun. Hasil pene- litian menunjukkan bahwa sintesis nyanyian berbahasa Indonesia berbasis control F0 menggunakan MBROLA telah berhasil dilakukan. Hasil sintesis nyanyian berbaha- sa Indonesia dengan menggunakan kontrol F0 adalah lebih baik jika diperdengarkan pada responden yang terlatih musik jika dibandingkan dengan tanpa menggunakan kontrol F0. Responden yang tidak terlatih musik tidak dapat membedakan antara sin- tesis nyanyian dengan menggunakan kontrol dan tanpa menggunakan kontrol F0.

The purpose of this research was to make an Indonesian voice singing syn- thesizer based on F0 control using the MBROLA diphone connector method. The synthesis of Indonesian songs was made by using the TTS (Text to Speech) backend, which is MBROLA. Enter backen TTS which was used to provide phoneme informa- tion such as notes and lyrics, namely MIDI files. When humans sing, the resulting F0 graph had several kinds of fluctuations, including overshoot, vibrato, and preparation. In order for sound synthesis results to be more natural, then F0 information needs to be added to the above fluctuations. This process of adding fluctuations was control F0 (basic frequency). The impulse response for each of the F0 fluctuations used a formula developed by Saitou et al. In addition to F0 fluctuations, there was also a reaction time of F0, which was the time needed to change from one frequency to an- other. For this reaction time used the equation developed by Xu and Sun. The results of Indonesian singing synthesizer with F0 control is better if heard by respondents who are trained in music compared to without F0 control. Respondents who are not trained in music cannot differentiate between synthesized song with F0 control and synthesized song without F0 control.

Kata Kunci : sintesis nyanyian berbahasa Indonesia, kontrol F0, MBROLA, Indonesian voice singing synthesizer, F0 control

  1. S1-2019-334715-abstract.pdf  
  2. S1-2019-334715-bibliography.pdf  
  3. S1-2019-334715-tableofcontent.pdf  
  4. S1-2019-334715-title.pdf