Laporkan Masalah

DETEKSI PERISTIWA LALU LINTAS MENGGUNAKAN KOMBINASI CONVOLUTIONAL NEURAL NETWORK (CNN) DAN BIDIRECTIONAL ENCODER REPRESENTATIONS FROM TRANSFORMERS (BERT) DARI DATA TWITTER

GREGORIUS ARIA NERUDA, Drs. Edi Winarko, M.Sc., Ph.D.

2021 | Skripsi | S1 ILMU KOMPUTER

Mengetahui kondisi lalu lintas secara real-time merupakan salah satu hal yang penting bagi masyarakat modern ini. Hal ini menjadi tantangan, karena sulitnya untuk mendeteksi peristiwa lalu lintas menggunakan sensor fisik konvensional. Perkembangan sosial media dapat menjadi alternatif solusi untuk masalah ini. Twitter merupakan salah satu sosial media yang populer di kalangan masyarakat Indonesia. Mayoritas pengguna Indonesia menggunakan Twitter untuk mengungkapkan keluh kesahnya di dalam sebuah tweet, di antaranya adalah keluh kesah tentang lalu lintas. Beberapa penelitian telah memanfaatkan data tweet untuk membangun sebuah model klasifikasi tweet lalu lintas berbahasa Indonesia. Namun, belum ada yang mengombinasikan model deep learning dan contextualized word embedding di dalam arsitekturnya. Pada penelitian ini akan dilakukan deteksi peristiwa lalu lintas menggunakan data Twitter dengan mengombinasikan model Convolutional Neural Network (CNN) dan Bidirectional Encoder Representations from Transformers (BERT). CNN akan digunakan untuk klasifikasi dan BERT digunakan untuk ekstraksi fitur. Ada 4 macam peristiwa yang diklasifikasi: insiden, alam, intensitas lalu lintas, dan lainnya.

Knowing traffic condition in a real-time manner is one of an important feature for modern society. This can be a challenge due to how hard it is to detect a traffic event using a conventional physical sensor. The growth of social media can be an alternative solution for this problem. Twitter is one of these social media popular in Indonesian society. The majority of Indonesian users use Twitter to talk about something in a tweet, one of them being complaint about traffic. A few researches has taken advantage of tweet data to build a traffic tweet classification model in Bahasa Indonesia. However, non has combined a deep learning model and contextualized word embedding in its architecture. This research proposes a model that combines Convolutional Neural Network (CNN) and Bidirectional Encoder Representations from Transformers (BERT). CNN will be used to classify whilst BERT is used for feature extraction. 4 kinds of traffic events is classified: incident (insiden), nature (alam), traffic intensity (intensitas lalu lintas), and others (lainnya).

Kata Kunci : deteksi peristiwa lalu lintas, text classification, tweet classification, multi-label classification, Convolutional Neural Network, CNN, Bidirectional Encoder Representations from Transformers, BERT