Laporkan Masalah

Sistem Text-to-Speech bahasa ndonesia dengan menggunakan Diphone Synthesis

SUTARMAN, Drs. Agus Harjoko, M.Sc.,Ph.D

2006 | Tesis | S2 Ilmu Komputer

Teknologi sintesis suara dan ucapan secara digital atau dikenal dengan Text-To- Speech (TTS) bekerja dengan cara melakukan pengubahan suatu masukan yang berupa huruf atau teks menjadi gelombang suara, yang dapat dimengerti oleh manusia (Basuki, 2002). Dengan kata lain, bentuk-bentuk teks yang diketikkan akan diproses oleh aplikasi tersebut menjadi bunyi bahasa. TTS tidak hanya merupakan sebuah software yang mampu menghasilkan tiruan ucapan manusia, namun juga dapat diimplementasikan dalam teknologi-teknologi yang dapat mempermudah pekerjaan manusia. Contoh-contoh kegunaannya antara lain untuk otomatisasi pembicaraan dalam aplikasi telekomunikasi dan multimedia, membantu orang-orang tuna wicara (cacat), ataupun pendidikan bagi sebuah bahasa. Pada tesis ini, penulis mencoba membuat basis data difon menggunakan segmen ucapan dari rekaman suara seorang wanita kemudian membuat konversi dari Text ke Ucapan. Dalam perancangan dan pembuatan Basis Data Diphone bahasa Indonesia dilakukan dengan beberapa tahapan : mempelajari bentuk-bentuk fonem dalam bahasa Indonesia dan meneliti kemungkinan kombinasinya untuk menjadi bentukbentuk difon dan menggabungkannya menjadi bentuk difon, mencari contoh kata yang mengandung diphone yang telah tersusun sebelumnya kemudian melakukan perekaman contoh kata tersebut, melakukan segmentasi hasil perekaman contoh kata yang telah direkam sebelumnya. Proses dalam Sistem Text-to-Speech bahasa Indonesia terdiri atas proses yaitu proses konversi dari Text yang akan dibunyikan ke dalam fonem dan proses konversi dari fonem ke speech.

Digital synthesis voice and speech technology as known as Text-To-Speech (TTS) is a mechanism that changes words and texts to sound waves, that can be understood by man (Basuki, 2002). Meaning, texts that are typed and processed by the application thus creating speech sound. TTS is not only a software capable imitating mans speech, but it can also be implemented in forms of technology in order to ease mans work. For example, one of its many usages is automatic speech in multimedia and telecommunication application, helping the physically deformed, or education for a certain language. In this thesis, the writer creates a diphone database using speech segment of recorded voice of a woman and then converts the text to speech. There are some steps in designing and creating the diphone database (1) exploring Indonesian phonemes and the possibility of combining the phonemes to form diphones. (2) combining some possible phonemes to form diphones (3) finding sample words consisting the selected diphones (4) recording samples of the selected words, and (5) segmenting recorded words. The process of Text-to-Speech system Indonesian language is twofold : the process of Text to Phoneme conversion and the process of phoneme to speech conversion.

Kata Kunci : Teknologi Informasi,Perancangan Sistem,Text to Speech,diphone, Text-to-Speech, Conversion


    Tidak tersedia file untuk ditampilkan ke publik.