PENAMBAHAN EMPATI PADA OPEN-DOMAIN GENERATIVE BASED CHATBOT BERBAHASA INDONESIA DENGAN MENGGUNAKAN SEQ2SEQ DAN BERT
AJIE KUSUMA WARDHANA, Dr. Ir. Ridi Ferdiana, S.T., M.T., IPM.;Dr. Indriana Hidayah, S.T., M.T.
2022 | Tesis | MAGISTER TEKNOLOGI INFORMASIBelakangan ini popularitas chatbot telah memunculkan kebutuhan baru da- lam renah HCI (Human Interaction with Computer) karena telah mengubah pola perilaku interaksi antara manusia dengan komputer. Dalam permasalahan agen per- cakapan yang tersedia saat ini masih hanya mampu menjawab pertanyaan dengan memilih atau dengan melakukan ekstraksi respon percakapan. Berdasarkan pene- litian dan pengembangan agen percakapan pada beberapa tahun terakhir, empati dan respon kontekstual dalam pengembangan agen percakapan menjadi sangat pen- ting dalam aspek interaksi manusia dan komputer. Dalam pengembangan chatbot berempati, pendekatan pengembangan sistem terbagi menjadi dua teknik yaitu de- ngan mengembangangkan dalam aspek psikologis atau teknis. Dalam aspek tek- nis, penggunaan model deep learning dapat digunakan dalam memunculkan respon berdasarkan data yang tidak berpola. Data percakapan yang tidak berpola ini se- ring ditemukan pada domain terbuka karena kalimat yang tidak terlabel dan tidak kontekstual. Penelitian ini bertujuan untuk mengembangkan chatbot berbahasa Indone- sia dengan pemodelan empatik dari aspek teknis. Untuk mengembangkan respon yang empatik dan kontekstual digunakan pemodelan algoritma yang Seq2Seq seba- gai penyusun kalimat respon. Dalam sistem chatbot generative yang diusulkan juga menambahkan kemampuan untuk mendeteksi emosi berdasarkan teks menggunak- an model BERT. Model BERT akan dibandingkan dengan model LSTM yang juga sering digunakan dalam klasifikasi kalimat berdasarkan teks dalam penelitian dan pengembangan deep learning. Penelitian ini menghasilkan dataset sebanyak 12348 pasang masukan dan respon kalimat dalam berbahasa Indonesia, dan juga sistem agen percakapan yang dapat mengatasi permasalahan domain terbuka. Dalam evaluasi menggunakan ma- triks BLEU score sebagai pengukuran variasi respon yang terseusun, akurasi pe- ngenalan emosi, F1 score, precision, dan recall. Berdasarkan hasil yang didapatkan score yang dihasilkan adalah 35% untuk BLEU score, 81% akurasi BERT dalam proses pelatihan data, dan 69% untuk pengujian data.
The popularity of chatbots has created a new challenge in HCI (Human- Computer Interaction) because it has changed the pattern of interaction between hu- mans and computers. The challenge provided by the conversational agent recently is answering questions by choosing and doing extractions regarding the contextual response. Based on the research and development for conversational agents lately, empathy and contextual response considered in conversational agent development becoming crucial. In the necessity of developing an empathetic, the approach for development split into two techniques which through psychological aspect or tech- nical. In the technical aspect, the usage of the deep learning method can be used to give appropriate responses based on unpatterned data. Unpatterned conversa- tional data could be found in open domain problems because of its unlabelled and non-contextual data. This research goal is to develop a chatbot using Indonesian with the empa- thetic model from the technical aspect. To develop the empathetic and contextual response, the model to be used is Seq2Seq to generate the output response. For generative chatbot, the method that proposed to adding emotion detection ability through text using BERT model. BERT model will be compared with LSTM which is a method often used for text classification in deep learning research and develo- pment. This research produces 12348 paired input and response data in Indonesian, and also a conversation agent system to tackle the open domain problems. The evaluation metrics to be used are the BLEU score to measure response variations assembled, emotion recognition accuracy, F1 score, precision, and recall. Based on the score acquired is 35% for BLEU score, 81% BERT accuracy in the learning process, and 69% for data testing.
Kata Kunci : Human Computer Interaction, Chatbot, Deep Learning, Generative Model