Laporkan Masalah

TEXT TO SPEECH UNTUK BAHASA ARAB MENGGUNAKAN PERANGKAIAN DIPHONE

ACHMAD FAUZAN, Prof. Dra., Sri Hartati., M.Sc., Ph.D.

2017 | Tesis | S2 Ilmu Komputer

Bahasa Arab merupakan salah satu bahasa yang banyak digunakan di dunia. Di Indonesia yang mayoritas penduduknya beragama Islam, bahasa Arab digunakan sebagai bagian dalam mempelajari Al-Qur'an yang menggunakan tulisan berbahasa Arab. Namun berdasarkan data BPS tahun 2015, sebanyak 54 persen muslim di Indonesia masih buta aksara Al Qur'an/bahasa Arab. Penelitian ini bertujuan merancang dan menyusun sistem text to speech yang dapat membangkitkan suara pengucapan untuk teks masukan berbahasa Arab. Pada proses normalisasi teks masukan, karakter ilegal dihilangkan dan karakter angka diubah ke dalam bentuk penulisan pelafalannya. Ketentuan pengucapan dasar diperoleh menggunakan pendekatan berbasis aturan. Aturan-aturan yang diterapkan adalah hukum bacaan nun sukun dan tanwin, vokal rangkap, bacaan panjang (madd), tanwin, tasydid, ta marbutah, dan sukun. Identifikasi hukum bacaan nun sukun dan tanwin dilakukan dengan menerapkan konsep mesin mealy yang merupakan pengembangan dari finite state automata. Proses pembangkitan suara diawali dengan membuat kode diphone dari rangkaian fonem hasil modul text to phoneme. Kode-kode diphone digunakan untuk memanggil dan merangkai file-file suara diphone yang telah direkam. Keluaran yang dihasilkan berupa sebuah file suara. Pengujian dilakukan dengan melibatkan 13 responden yang memahami ilmu tajwid. Pada pengujian menggunakan teks masukan hukum bacaan idghaam bilaagunnah, idghaam bighunnah, iqlab, ikhfa' adna, ta marbutah, dan sukun, 100% responden menilai suara yang dihasilkan sudah tepat. Sedangkan dengan teks masukan hukum bacaan idzhaar, responden yang menilai suara dihasilkan sudah tepat mencapai 92%. Persentase lebih rendah terdapat pada hukum bacaan vokal rangkap (diftong), ikhfa' ausath, tasydid, ikhfa' aqrab, dan bacaan panjang (madd) yang masing-masing memperoleh 81%, 77%, 73%, 69%, dan 65%.

Arabic is one of the most widely used languages in the world. In a predominantly Muslim Indonesia, Arabic is used as part of studying the Qur'an that uses Arabic writing. However, based on data from BPS in 2015, as many as 54 percent of Muslims in Indonesia are still illiterate Al Qur'an / Arabic. This study aims to design and compose a text to speech system that can generate sound pronunciation for Arabic input text. In the normalization process of the input text, the illegal characters are omitted and the numeric characters are converted into their pronunciation form. Basic pronunciation provisions are obtained using a rule-based approach. The rules applied are the law of reading nun sukun and tanwin, double vowels, long reading (madd), tanwin, tasydid, ta marbutah, and breadfruit. The identification of the reading law of sukun and tanwin is done by applying the concept of mealy machine which is the development of finite state automata. The sound generation process begins with making the diphone code from the phoneme sequence of the text to phoneme module results. The diphone codes are used to call and compose sound files of the recorded diphone. The resulting output is a sound file. The test was conducted by involving 13 respondents who understand the science of tajwid. In the test using the text of the legal input reading idghaam when amar, idghaam bighunnah, iqlab, ikhfa 'adna, ta marbutah, and breadfruit, 100% of respondents assess the sound produced is correct. While the text input legal reading idzhaar, respondents who assess the resulting sound has reached exactly 92%. The lower percentage is found in the law of diphthong (diphthong), ikhfa 'ausath, tasydid, ikhfa' aqrab, and long reading (madd), 81%, 77%, 73%, 69%, and 65% respectively.

Kata Kunci : text to speech, bahasa arab, perangkaian diphone, finite state automata

  1. S2-2017-356470-abstract.pdf  
  2. S2-2017-356470-bibliography.pdf  
  3. S2-2017-356470-tableofcontent.pdf  
  4. S2-2017-356470-title.pdf