PENGENALAN SUKU KATA BAHASA INDONESIA BERDASARKAN FITUR GERAK BIBIR MENGGUNAKAN JARINGAN SYARAF TIRUAN
HELMI AINUN NAIM, Faridah, S.T. M.Sc.;Balza Achmad, S.T., M.Sc.E.
2017 | Skripsi | S1 TEKNIK FISIKABagi penderita tuna rungu komunikasi menjadi masalah utama dalam berinteraksi dengan masyarakat. Oleh karena itu dibutuhkan suatu cara untuk memudahkan mereka dalam berkomunikasi. Idenya adalah dengan membaca gerak bibir manusia saat mengucapkan suku kata dengan menangkap citra dari gerak bibirnya. Citra tersebut digunakan untuk melatih suatu jaringan syaraf tiruan (JST) backpropagation sehingga dapat mengenali suku kata yang sedang diucapkan.Tujuan utama penelitian ini adalah mengenali suku kata dari fitur gerak bibir. Citra bibir sebelumnya diolah sehingga didapatkan titik-titik koordinat fitur gerak bibir yang diperoleh dari penelitian sebelumnya. Suku kata yang digunakan adalah Ba, Be, Bi, Bo, Cak, Dak, Ja, La, Ma, Me, Pa, Pi, Pu, Sa, Ta, Tol, seperti yang digunkan pada penelitian sebelumnya. Data target suku kata tersebut dikonversi terlebih dahulu menjadi bilangan sehingga mudah untuk diolah. Proses awal pelatihan adalah menentukan arsitektur jaringan yang optimal dengan cara mengubah-ubah nilai learning rate dan cacah neuron (node) dalam hidden layer. Setelah dilakukan pelatihan, didapatkan arsitektur jaringan optimal, yaitu nilai learning rate sebesar 3x10^-7 dan jumlah neuron pada hidden layer sebanyak 10 neuron. Diperoleh nilai terbaik MSE (mean square error) training sebesar 1,00 danvalidasi sebesar 1.699. Kemudian pengujian dilakukan dengan arsitektur JST tersebut dengan 3 orang koresponden diperoleh nilai MSE terbaik yang sama yaitu 1.699 pada epoch ke-8.610. Terdapat 5 data hasil yang tidak sesuai dengan target yaitu pada koresponden 2 suku kata Tol, dan Koresponden 3 suku kata Bi, Bo, Cak, dan Tol. Pengambilan dan pengolahan data yang lebih banyak dan lebih baik akan meningkatkan kualitas dan kinerja dari JST.
Communication for deaf people become a major problem in interacting with the public. Therefore we need a way to enable them to communicate. One of many possible solution is reading lips motion when pronounce syllables by capturing the image of the lips. These images are used to train a neural network (ANN) backpropagation so it can recognize syllables being spoken. The main objective of this study was to identify a syllable from the lip motion features. Lip image is processed so that we get coordinate points lip motion features that be obtained from previous studies. Syllables that used are Ba, Be, Bi, Bo, Cak, Dak, Ja, La, Ma, Me, Pa, Pi, Pu, Sa, Ta, Tol, as it is used mainly in previous studies. The target data syllable first converted into numbers so it is easy to be processed in neural network. Beginning of the training process is to determine the optimal network architecture by way of varying the value of learning rate and the number of neurons (nodes) in the hidden layer. After training ANN, we obtained optimal network architecture, namely the value of learning rate of 3x10^-7 and the number of neurons in the hidden layer of 10 neurons. Best values obtained training MSE (mean square error) of 1.00 and validation MSE for 1699. Then the test is carried out with the ANN architecture with three correspondents obtained the same best MSE value is 1,699 on 8610th epoch. There are 5 results data that is not in accordance with the target of the correspondent 2 syllables Tol, and correspondent 3 syllables Bi, Bo, Cak, and Tol. More and better retrieval and processing of data will improve the quality and performance of ANN.
Kata Kunci : jaringan syaraf tiruan, backpropagation, learning rate, node, MSE