Laporkan Masalah

ANALISIS PERBANDINGAN PERFORMA PROXIMAL POLICY OPTIMIZATION (PPO) DAN ADVANTAGE ACTOR-CRITIC (A2C) PADA KOMBINASI 2 PERSIMPANGAN BERPENGATURAN LALU LINTAS 4 FASE MENGGUNAKAN SIMULATOR SUMO

David Dwi Nugroho, Idham Ananta Timur, ST. M.Kom; Dyah Aruming Tyas, S.Si., Dr.

2023 | Skripsi | ELEKTRONIKA DAN INSTRUMENTASI

Meningkatnya pengunaan kendaraan pribadi secara masif menciptakan kemacetan lalu lintas terutama pada persimpangan yang terletak di kota besar. Salah satu upaya dalam mengatasi permasalahan tersebut adalah dengan membuat sebuah sistem pengaturan lampu lalu lintas adaptif (ATSC). Pengaturan lampu lalu lintas adaptif memungkinkan pengurangan jumlah kendaraan yang menumpuk pada lajur-lajur persimpangan dengan mengatur fase dan/atau durasi lampu lalu lintas secara langsung berdasarkan kondisi yang ada. Pada penelitian ini dilakukan pengujian pengaturan lampu lalu lintas secara adaptif menggunakan reinforcement learning dengan simulasi lalu lintas melalui SUMO. Pengujian dilakukan pada environment dua persimpangan yang saling terhubung dengan mengatur fase lampu lalu lintas dan durasi sinyal lampu hijau. Algoritma Proximal Policy Optimization (PPO) diuji pada environment dengan sebuah skenario tertentu untuk mendapatkan performa agen melalui indikator keberhasilan yang ditentukan. Hasil pengujian PPO akan dibandingkan dengan Advantage Actor-Critic (A2C) untuk didapatkan performa mana yang lebih baik. Hasil penelitian yang dilakukan menunjukan bahwa Algoritma Proximal Policy Optimization (PPO) memiliki performa yang lebih baik dalam mengurangi penumpukan atau waktu tunggu kendaraan pada persimpangan dibandingkan dengan Advantage Actor-Critic (A2C). PPO mengunguli performa diatas 19% untuk setiap skenario yang diujikan.

Overusing private cars leads to traffic congestion, mainly at intersections in cities. One way to solve this problem is by creating an Adaptive Traffic Signal Control (ATSC). ATSC potentially reduces the number of vehicles that accumulate in intersection lanes by adjusting the phase and/or duration of traffic lights directly based on existing conditions. In this research, we tested ATSC using reinforcement learning with traffic simulation through SUMO. The test was carried out in an environment of two interconnected intersections by adjusting the phase of the traffic light and the duration of the green light signal. The Proximal Policy Optimization (PPO) algorithm is tested in an environment with a particular scenario to obtain agent performance through the specified success indicators. The results of the PPO test will be compared with the Advantage Actor-Critic (A2C) to get which performance is better. The results of the research show that the Proximal Policy Optimization (PPO) algorithm has a better performance in reducing vehicle accumulation or waiting time at intersections compared to Advantage Actor-Critic (A2C). PPO outperformed above 19% for each scenario tested.

 

Kata Kunci : Reinforcement Learning, ATSC, SUMO, PPO, A2C

  1. S1-2023-439103-abstract.pdf  
  2. S1-2023-439103-bibliography.pdf  
  3. S1-2023-439103-tableofcontent.pdf  
  4. S1-2023-439103-title.pdf