Rancang Bangun API untuk Membangkitkan Subtitle Berbahasa Indonesia dengan Azure Cognitive Services
Rifka Khairani Anisa, Dr. Ridi Ferdiana, S.T., M.T.; Dr. Ir. Rudy Hartanto, M.T.
2019 | Skripsi | S1 TEKNOLOGI INFORMASIDi masa kini, Subtitle menjadi elemen penting pada video karena memudahkan penonton dalam mendapatkan informasi dari video. Kini subtitle semakin berkembang, tidak hanya berupa translasi dari bahasa asing yang diucapkan pada video, namun bisa juga berupa bahasa yang sama dengan video. Subtitle dengan bahasa yang sama dengan video bermanfaat bagi siapa saja yang menonton video. Hanya saja, pembuatan subtitle tidaklah mudah. Pembuatan subtitle video masih dilakukan secara manual menggunakan perangkat lunak tertentu, sehingga membutuhkan waktu yang lama untuk membuat satu buah file subtitle. Pada tugas akhir ini, dikembangkan sebuah API untuk auto-generated subtitle yang dapat menghasilkan subtitle bahasa Indonesia dari video berbahasa Indonesia secara otomatis. API dikembangkan dengan memanfaatkan fasilitas dari Azure Cognitive Services yang mampu menghasilkan teks dari audio dan menambahkan model pelatihan bahasa. Sementara situs Youtube dipilih sebagai sumber video karena merupakan situs penyedia video yang paling banyak dikunjungi masyarakat Indonesia setiap harinya. Pengembangan API ini menghasilkan sekumpulan URI yang dapat digunakan untuk konversi video Youtube ke audio, memproses audio ke teks, dan menghasilkan subtitle dalam format .srt. API diuji menggunakan uji fungsionalitas dan uji akurasi untuk mengetahui besar akurasi subtitle keluaran. Subtitle yang dihasilkan oleh API mendapatkan akurasi tertinggi sebesar 80%. Akurasi subtitle bisa ditingkatkan dengan menggunakan audio yang lebih baik dan melatih model bahasa Indonesia dalam skala yang lebih besar.
In this current society, subtitles play an important role to help viewers understand the contents of video. Now subtitles are contain not only the translation text of video, but also the same language as the video. Same language subtitle are useful for any video viewers, from children, adult, until deaf people. However, the process of making subtitles is not an easy task. Subtitling for videos is generally done manually using particular software and particular method which is time consuming. In this study, auto-generated subtitle API for Indonesian language videos based on RESTful is developed using Azure Cognitive Services to accomplish the automatic speech recognition. Youtube is chosen as the video source of the API because of its high accessibility from Indonesian viewers. The RESTful API provides a series of URIs that can be used to convert Youtube video into audio, process audio to text, and produce subtitle with .srt format. Those URIs is tested to examine the functionality and to calculate the accuration of the output subtitles. The output subtitles were able to get accuracy up to 80%. Using the better quality of audio and training the bigger scale of Indonesian model may increase the accuration of the output subtitles.
Kata Kunci : API, Subtitle, Speech Recognition, Azure Cognitive Services, Bahasa Indonesia, Youtube