Laporkan Masalah

KOMBINASI AGEN DEEP REINFORCEMENT LEARNING DENGAN SISTEM ADAPTASI PLATOON UNTUK KENDALI ALAT PEMBERI ISYARAT LAMPU LALU LINTAS CERDAS

Muhammad Idham Ananta Timur, Prof. Dr. Ir. Jazi Eko Istiyanto, M.Sc., IPU, ASEAN Eng.; Dr. Andi Dharmawan, S.Si., M.Cs.

2025 | Disertasi | S3 Ilmu Komputer

Pengendalian sistem alat pemberi isyarat lalu lintas (APILL) adaptif yang mengharuskan pengumpulan data dan pembuatan model dalam jangka waktu yang panjang memiliki keterbatasan dalam mengantisipasi dinamika arus kendaraan. Sebaliknya, metode berbasis Deep Reinforcement Learning (Deep RL) seperti Deep Q-Network (DQN) dan Proximal Policy Optimization (PPO) mampu berinteraksi secara lebih efektif dengan dinamika arus kendaraan, meskipun sering menghadapi masalah stabilitas pelatihan dan waktu konvergensi yang lama. Penelitian ini mengusulkan kerangka kerja terintegrasi yang menggabungkan sistem adaptasi platoon, terinspirasi oleh prinsip Self-Organizing Traffic Light (SOTL), dengan agen DQN dan PPO untuk pengendalian APILL. Pendekatan tersebut dievaluasi menggunakan platform simulasi Simulation of Urban Mobility (SUMO) dengan jaringan jalan dan persimpangan yang diambil dari kawasan Yogyakarta, mencakup skenario arus kendaraan lancar, padat, dan macet. Selain itu, validasi juga dilakukan pada jaringan jalan dan persimpangan dari skenario kota Ingolstadt dan Cologne yang dikembangkan berdasarkan data arus kendaraan nyata. Hasil eksperimen menunjukkan bahwa kombinasi agen DQN dan PPO dengan sistem adaptasi platoon secara signifikan meningkatkan kinerja pengendalian APILL, terbukti dari penurunan waktu perjalanan dan waktu tunggu, terutama pada kondisi arus kendaraan yang padat.

Adaptive APILL control systems that require extensive data collection and prolonged model construction periods face limitations in anticipating dynamic traffic flows. In contrast, deep reinforcement learning (Deep RL)-based methods such as DQN and PPO can interact more effectively with traffic dynamics, albeit often encountering issues with training stability and extended convergence times. This study proposes an integrated framework that combines a platoon adaptation system—drawn from the principles of Self-Organizing Traffic Lights (SOTL)—with DQN and PPO agents for APILL control. The proposed approach was evaluated using the SUMO simulation platform with road networks and intersections from the Yogyakarta region, covering scenarios of smooth, dense, and congested traffic. Additionally, validation was conducted on road networks and intersections from the Ingolstadt and Cologne scenarios developed based on real traffic flow data. Experimental results indicate that the combination of DQN and PPO agents with the platoon adaptation system significantly enhances APILL control performance, as demonstrated by reductions in travel and waiting times, particularly under heavy traffic conditions.

Kata Kunci : TSC Combination Agent, DQN, PPO, SOTL, Platoon

  1. S3-2025-450300-abstract.pdf  
  2. S3-2025-450300-bibliography.pdf  
  3. S3-2025-450300-tableofcontent.pdf  
  4. S3-2025-450300-title.pdf