Laporkan Masalah

ANALISIS AKURASI SISTEM PENGENALAN SUARA PADA KALIMAT BAHASA INDONESIA

IRFAN HADIATMA, Hanung Adi Nugroho, S.T. , M.E. , Ph.D. ; Dr. Ir. Eko Nugroho, M.si.

2018 | Tesis | S2 Teknik Elektro

Kemampuan teknis dan komputasi perangkat yang semakin berkembang mendorong inovasi di bidang teknologi pengolahan data. Automatic Speech Recognition (ASR) merupakan sebuah teknologi yang memungkinkan sebuah perangkat untuk menerima masukan berupa kata yang diucapakan. Hasil dari identifikasi kata yang diucapkan tersebut dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat sebagai sebuah perintah. Bidang ini bersentuhan langsung dengan kecerdasan buatan, dimana merupakan kajian yang menarik khususnya bagi bahasa-bahasa diluar bahasa inggris. Kajian terkait Automatic Speech Recognition (ASR) berbahasa Indonesia dinilai penting karena beberapa faktor yang saling berkaitan. Pertama tingkat penetrasi penggunaan smartphone di Indonesia pada tahun 2015 menurut rieset Google mencapai 50 persen, dimana angka tersebut merupakan penetrasi tertinggi di Asia. Kedepannya hampir semua perangkat dan smartphone akan menggunakan sistem berbasis suara, sehingga basis interaksi manusia dan komputer berupa suara menggantikan huruf dan string. Kedua tingkat adaptasi Automatic Speech Recognition (ASR) di Indonesia yang dinilai kurang begitu bagus. Untuk mengetahui performa dan faktor �faktor apa saja yang mempengaruhi ASR bahasa Indonesia dilakukan studi komparatif yang melibatkan beberapa layanan Automatic Speech Recognition (ASR) berbahasa Indonesia. Penelitian ini menghasilkan nilai tingkat akurasi dan performa ASR bahasa Indonesia yang cukup baik dengan word error rate dibawah 10 persen. Faktor faktor yang mempengaruhi seperti kelas kata tunggal, frase, klausa dan kalimat digunakan sebagai data uji sistem. Pengujian yang dilakukan dengan menggunakan parameter word error rate menunjukkan hasil yang baik dalam perkembangan ASR berbahasa indonesia.

The growing technical and computing capabilities of devices are driving innovation in the field of data processing technology. Automatic Speech Recognition (ASR) is a technology that allows a device to receive input in the form of a spoken word. The results of the spoken word identification can be displayed in writing or can be read by the device as a command. This field is in direct contact with artificial intelligence, which is an interesting study, especially for languages ��outside the English language. The study related to Automatic Speech Recognition (ASR) in Indonesian language is considered important because of several interrelated factors. The first penetration rate of smartphone usage in Indonesia in 2015 according to Google riset reached 50 percent, which is the highest penetration rate in Asia. In the future almost all devices and smartphones will use a sound-based system, so the base of human and computer interaction in the form of sound replacing letters and strings. Both levels of adaptation of Automatic Speech Recognition (ASR) in Indonesia are considered less good. To know the performance and what factors affect the ASR of Indonesia, a comparative study involving several Automatic Speech Recognition (ASR) services in Indonesian language is conducted. This research resulted in accuracy of ASR level and ASR performance with a word error rate of less than 10 percent. Factors influencing factors such as single word classes, phrases, clauses and sentences are used as system test data. Tests performed using the word error rate parameter showed good results in the development of ASR in Indonesian language.

Kata Kunci : Automatic Speech Recognition (ASR), word error rate, API

  1. S2-2018-370686-abstract.pdf  
  2. S2-2018-370686-bibliography.pdf  
  3. S2-2018-370686-tableofcontent.pdf  
  4. S2-2018-370686-title.pdf