Laporkan Masalah

Silabifikasi Fonemis Bahasa Indonesia Menggunakan Pseudo Nearest Neighbour Rule dan Kaidah Fonotaktik

SUYANTO, Prof. Dra. Sri Hartati, M.Sc., Ph.D.; Drs. Agus Harjoko, M.Sc., Ph.D.

2016 | Disertasi | S3 Ilmu Komputer

Silabifikasi sangat penting dalam pengenalan ucapan berbasis silabel. Untuk bahasa Inggris, silabifikasi umumnya dibangun menggunakan metode berbasis statistik dan diaplikasikan pada barisan fonem. Walaupun memberikan syllable error rate (SER) yang relatif rendah, model silabifikasi bahasa Inggris yang ada saat ini memiliki dua kekurangan: klasifikasi dilakukan secara global dan kemiripan pola dihitung secara biner atau menggunakan pengkodean fonem biner ortogonal. Untuk bahasa Indonesia, silabifikasi yang ada saat ini dibangun menggunakan metode berbasis aturan dan diaplikasikan pada barisan grafem sehingga performansinya rendah. Pada penelitian ini dikembangkan model silabifikasi fonemis (gabungan fonemisasi dan silabifikasi) bahasa Indonesia menggunakan Pseudo Nearest Neighbour Rule (PNNR) dan kaidah fonotaktik. Model fonemisasi mengkonversi barisan grafem menjadi barisan fonem, lalu silabifikasi menentukan titik-titik silabisnya. Evaluasi menggunakan 5-fold cross-validation dari 50 ribu kata menunjukkan bahwa: 1) pengkodean grafem biner ortogonal parsial dan aturan fonemis yang diusulkan dapat mereduksi phoneme error rate (PER), secara relatif, pada model fonemisasi sebesar 6,06%; dan 2) pengkodean fonem empat-fitur dan kaidah fonotaktik yang diusulkan mampu mereduksi SER, secara relatif, pada model silabifikasi hingga 28,89%. Evaluasi model silabifikasi fonemis terhadap barisan fonem yang dihasilkan model fonemisasi menunjukkan bahwa kekeliruan konversi grafem <e> menjadi fonem /E/ dan /@/ tidak mempengaruhi pergeseran titik-titik silabis yang dihasilkan model silabifikasi. Tetapi, jika dihitung berdasarkan silabel fonemisnya, kekeliruan tersebut secara signifikan menurunkan akurasi model silabifikasi fonemis. Performansi model ini jauh lebih baik dibanding model berbasis aturan maupun Look-Up Procedure. Model ini dapat diperbaiki dengan menambahkan prosedur stemming untuk menyelesaikan kekeliruan fonemisasi grafem <e> dan kesalahan silabifikasi pada barisan fonem yang mengandung /b@r/, /p@r/, dan /t@r/.

Syllabification is very important in a syllable-based speech recognition. For English, syllabification is commonly developed using a statistic-based method and applied to a phoneme sequence. Although it gives a low syllable error rate (SER), the existing English syllabification models have two drawbacks: the classification is performed globally and the pattern similarity is calculated binary or using a binary orthogonal phoneme encoding. For Indonesian language, an existing syllabification is developed using a rule-based method and applied to a grapheme sequence so that its performance is low. In this research an Indonesian phonemic syllabification (combination of phonemization and syllabification) is developed using Pseudo Nearest Neighbour Rule (PNNR) and phonotactic knowledge. The phonemization model converts a grapheme sequence into a phoneme sequence, then the syllabification defines its syllabification points. Evaluating on 5-fold cross-validation from 50K words shows that: 1) the proposed partial orthogonal binary grapheme encoding and phonemic rule are capable of relatively reducing phoneme error rate (PER) of the phonemization model 6.06%; and 2) the proposed four-feature phoneme encoding and phonotactic knowledge are capable of reducing syllable error rate (SER) of syllabification model relatively up to 28.89%. Evaluating the phonemic syllabification model on phoneme sequences produced by phonemization model shows that the mistakes of converting grapheme <e> into phoneme /E/ and /@/ do not shift syllabification points resulted by the syllabification model. But, if the calculation considers phonemic syllable, those mistakes significantly decrease the accuracy of phonemic syllabification model. The performance of this model is much better than both rule-based and Look-Up Procedure-based models. This model can be improved by incorporating a stemming procedure to solve the phonemization mistakes of grapheme <e> and syllabification errors on phoneme sequences containing /b@r/, /p@r/, and /t@r/.

Kata Kunci : bobot kontekstual, pengkodean grafem biner ortogonal parsial, pengkodean fonem empat-fitur

  1. S3-2016-340393-abstract.pdf  
  2. S3-2016-340393-bibliography.pdf  
  3. S3-2016-340393-tableofcontent.pdf  
  4. S3-2016-340393-title.pdf