Laporkan Masalah

ANALISIS DAN KOMPARASI KINERJA METODE DQN DAN DDPG DALAM PENGATURAN SINYAL LAMPU LALU LINTAS ADAPTIF

ANSGARIUS PANGESTU A, M. Idham Ananta Timur, S.T., M.Kom.

2022 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASI

Kemacetan merupakan salah satu permasalahan yang sering terjadi terutama di kota-kota besar. Permasalahan ini diakibatkan oleh banyak faktor seperti lebar jalan yang kurang sesuai, desain tata ruang letak dari kota, jumlah kendaraan yang semakin banyak, dan pengaturan lampu lalu lintas yang kurang baik. Pengaturan lampu lalu lintas yang kurang baik bisa menyebabkan permasalahan seperti kemacetan. Pengaturan yang dilakukan secara konvensional menyebabkan lampu lalu lintas tidak bisa beradaptasi dengan jumlah kendaraan yang lewat sehingga menyebabkan kemacetan terutama di waktu sibuk, oleh karena itu dibutuhkanlah sebuah metode untuk mengatur lampu lalu lintas secara adaptif. Pada penelitian ini pengaturan lampu lalu lintas adaptif menggunakan reinforcment learning yaitu dengan algoritme Deep Q-Network (DQN) dan Deep Deterministic Policy Gradient (DDPG). Algoritme Deep Q-Network merupakan algoritme hasil pengembangan dari Q-Learning sedangkan Deep Deterministic Policy Gradient merupakan algoritme hasil penggabungan dari DQN dan Deep Policy Gradient. Penelitian dibagi menjadi lima skenario dengan batasan kendaraan 90, 150, 300, 600, dan 900. Hasil waktu tunggu dari simulasi kedua algoritme tersebut adalah DDPG lebih cepat 7,5% hingga 9,7% dari DQN serta lebih stabil.

Congestion is one of the problems that often occurs, especially in big cities. This problem is caused by many factors such as inadequate road width, city layout design, increasing number of vehicles, and poor traffic light settings. Poor traffic light settings can cause problems such as traffic jams. Conventional settings cause traffic lights to be unable to adapt to the number of passing vehicles, causing congestion, especially at busy times, therefore a method is needed to adjust traffic lights adaptively. In this study, adaptive traffic light settings use reinforcement learning, namely the Deep Q-Network (DQN) and Deep Deterministic Policy Gradient (DDPG) algorithms. The Deep Q-Network algorithm is an algorithm developed from Q-Learning while the Deep Deterministic Policy Gradient is an algorithm that is the result of a combination of DQN and Deep Policy Gradient. The study was divided into five scenarios with vehicle limits of 90, 150, 300, 600, and 900. The results of the waiting time from the simulations of the two algorithms were that DDPG was 7.5% to 9.7% faster than DQN and more stable.

Kata Kunci : Reinforcement Learning, algoritme, DQN, DDPG

  1. S1-2022-430183-abstract.pdf  
  2. S1-2022-430183-bibliography.pdf  
  3. S1-2022-430183-tableofcontent.pdf  
  4. S1-2022-430183-title.pdf