ANALISIS PERBANDINGAN PERFORMA PROXIMAL POLICY OPTIMIZATION (PPO) DAN ADVANTAGE ACTOR-CRITIC (A2C) PADA KOMBINASI 2 PERSIMPANGAN BERPENGATURAN LALU LINTAS 4 FASE MENGGUNAKAN SIMULATOR SUMO
David Dwi Nugroho, Idham Ananta Timur, ST. M.Kom; Dyah Aruming Tyas, S.Si., Dr.
2023 | Skripsi | ELEKTRONIKA DAN INSTRUMENTASI
Meningkatnya pengunaan kendaraan pribadi secara masif menciptakan kemacetan lalu lintas terutama pada persimpangan yang terletak di kota besar. Salah satu upaya dalam mengatasi permasalahan tersebut adalah dengan membuat sebuah sistem pengaturan lampu lalu lintas adaptif (ATSC). Pengaturan lampu lalu lintas adaptif memungkinkan pengurangan jumlah kendaraan yang menumpuk pada lajur-lajur persimpangan dengan mengatur fase dan/atau durasi lampu lalu lintas secara langsung berdasarkan kondisi yang ada. Pada penelitian ini dilakukan pengujian pengaturan lampu lalu lintas secara adaptif menggunakan reinforcement learning dengan simulasi lalu lintas melalui SUMO. Pengujian dilakukan pada environment dua persimpangan yang saling terhubung dengan mengatur fase lampu lalu lintas dan durasi sinyal lampu hijau. Algoritma Proximal Policy Optimization (PPO) diuji pada environment dengan sebuah skenario tertentu untuk mendapatkan performa agen melalui indikator keberhasilan yang ditentukan. Hasil pengujian PPO akan dibandingkan dengan Advantage Actor-Critic (A2C) untuk didapatkan performa mana yang lebih baik. Hasil penelitian yang dilakukan menunjukan bahwa Algoritma Proximal Policy Optimization (PPO) memiliki performa yang lebih baik dalam mengurangi penumpukan atau waktu tunggu kendaraan pada persimpangan dibandingkan dengan Advantage Actor-Critic (A2C). PPO mengunguli performa diatas 19% untuk setiap skenario yang diujikan.
Overusing private cars leads to
traffic congestion, mainly at intersections in cities. One way to solve this
problem is by creating an Adaptive Traffic Signal Control (ATSC). ATSC
potentially reduces the number of vehicles that accumulate in intersection
lanes by adjusting the phase and/or duration of traffic lights directly based
on existing conditions. In this research, we tested ATSC using reinforcement
learning with traffic simulation through SUMO. The test was carried out in an
environment of two interconnected intersections by adjusting the phase of the
traffic light and the duration of the green light signal. The Proximal Policy
Optimization (PPO) algorithm is tested in an environment with a particular
scenario to obtain agent performance through the specified success indicators.
The results of the PPO test will be compared with the Advantage Actor-Critic
(A2C) to get which performance is better. The results of the research show that
the Proximal Policy Optimization (PPO) algorithm has a better performance in
reducing vehicle accumulation or waiting time at intersections compared to
Advantage Actor-Critic (A2C). PPO outperformed above 19% for each scenario
tested.
Kata Kunci : Reinforcement Learning, ATSC, SUMO, PPO, A2C