Pengembangan Data Pipeline ETL untuk Input Analisis Sentimen pada Video Berita Youtube Berbahasa Indonesia Menggunakan Teknologi Automatic Speech Recognition
RESIYANDA WAFA RAMADANINGTYAS ARIBOWO, Widyawan, ST, M.Sc., Ph.D.; Ir. Agus Bejo, S.T., M.Eng., D.Eng., IPM.
2024 | Skripsi | TEKNOLOGI INFORMASI
Analisis sentimen, yang termasuk dari bentuk analisis media sosial, adalah bidang yang sedang berkembang dan berperan penting dalam sektor pengambilan keputusan. Video berita adalah sumber yang berharga untuk analisis ini, karena secara langsung memproyeksikan emosi pembicara terkait peristiwa terkini. Salah satu perhatian utama adalah membangun jalur untuk mengakses sumber data ini dengan membuat pipeline yang mengambil dan menambang konten dari YouTube, sebuah platform yang berisi berbagai video berita terbaru dan terkini, khususnya untuk penelitian ini, dalam Bahasa Indonesia. Penelitian ini akan secara langsung memanfaatkan teknologi ASR (Automatic Speech Recognition) untuk mentranskripsi video berita dalam Bahasa Indonesia. Penelitian ini bertujuan untuk mengeksplorasi transformasi video berita menjadi teks transkripsi untuk analisis lebih lanjut dengan membuat pipeline ETL (Extract, Transform, Load) data. Teknologi ASR akan diterapkan pada tahap transformasi pipeline dengan membandingkan dua teknologi ASR yang berbeda, yaitu Whisper dan Google Speech-to-Text API, berdasarkan metrik seperti akurasi Word Error Rate (WER), waktu yang diperlukan, penggunaan CPU, harga dan efisiensi alur kerja. Hasil penelitian ini menunjukkan bahwa Whisper merupakan pilihan teknologi ASR yang lebih cocok untuk diimplementasikan dalam pipeline untuk mentranskripsi video berita dalam Bahasa Indonesia, dan pipeline yang telah dirancang berhasil dieksekusi. Dengan hasil WER mencapai 20.43%, bersifat open-source dan membuka peluang untuk fine-tuning untuk meningkatkan akurasi hasil transkripsi di penelitian selanjutnya, serta kesederhanaan workflow yang mumpuni. Pipeline yang dirancang juga berhasil dieksekusi dan terbukti layak melalui proof of concept (PoC).
Sentiment analysis, one of the forms of social media analytics, is both an emerging and important field in decision-making sectors. News videos are a valuable source for these analyses, as they directly project speakers’ emotions regarding current events. One of the main concerns to build paths to access this resource is to create pipelines that takes and mines from YouTube, a platform that contains various and up to date news videos, specifically for this research, in Indonesian Language. This research will utilize ASR (Automatic Speech Recognition) technology to transcribe Indonesian news videos. This research aims to explore transforming news videos into transcription scripts for further analysis by creating an ETL (Extract, Transform, Load) data pipeline. ASR technology will be implemented in the transforming stage of the pipeline by comparing two different ASR technologies with Whisper and Google Speech-to-Text API by metrics such as Word Error Rate (WER) accuracies, time elapsed, CPU usage, pricing, and workflow efficiency. The results of this research indicates that Whisper will be the better choice of ASR technology to be implemented in the pipeline for transcribing Indonesian news videos with WER score of 20.43%, and room for tweaking its model by fine tuning. The designed pipeline was also successfully executed and proven feasible through a proof of concept (PoC).
Kata Kunci : ETL data pipeline, transkripsi video, ASR, video berita