Laporkan Masalah

MULTI AGENT DEEP REINFORCEMENT LEARNING PADA SIMULASI MOBILE ROBOT PEMECAH LABIRIN

M IMAM MUTTAQIN, Muhammad Arrofiq, S.T., M.T., Ph.D.,

2021 | Tugas Akhir | D4 Teknologi Rekayasa Instrumentasi dan Kontrol

Labirin merupakan salah satu contoh dari permasalahan dengan area yang tidak diketahui oleh sistem, sehingga membutuhkan observasi dan penjelajahan untuk mendapatkan data labirin tersebut. Penelitian ini bertujuan untuk memecahkan pencarian jalur keluar dari labirin dengan menggunakan multi agent (robot) dan metode Reinforcement Learning (RL). Algoritma RL yang digunakan yaitu MultiAgent Deep Deterministic Policy Gradient (MADDPG) akan melakukan proses pemberian action yang dihasilkan dari semua observasi untuk semua agent. Observasi pada lingkungan berupa percepatan sudut rotasi (X dan Y), 15 buah sensor jarak yang terdapat pada masing-masing agent dengan 3 buah penanda dengan objek agent, wall dan exit point. Sedangkan action yang diberikan berupa pergerakan agent dalam bidang 2 dimensi yaitu depan, belakang, sudut rotasi ke kanan dan kiri. Pengujian dilakukan dengan simulasi Unity3D dengan bantuan pustaka ML-Agents yang akan diakses menggunakan Application Programming Interface (API) pada Python. Algortima MADDPG ditulis menggunakan bahasa Python dengan framework PyTorch untuk membantu perancangan model Deep Learning

Maze is just one example of a problem with uncertainly and unknown area. Because of that, system need observation and exploration to get data of maze area. This research purpose is to solve an exit path of the maze using multi agent and Reinforcement Learning (RL). Multi-Agent Deep Deterministic Policy Gradient (MADDPG) algorithm will givin some actions from all observations for agents. Observation data used are angular acceleration and 15 distance of each agents with 3 flag for wall, agent and exit point. The action of each agents are moving direction including forward, backward, rotation for left and right. Simulation using Unity3D with ML-Agents library and accessed via Application Programming Interface (API) with Python. MADDPG algorithm writen using Python with PyToch framework to simplify designing of Deep Learning model.

Kata Kunci : Multi Agent, Maze Solving, Reinforcement Learning, Multi Agent Deep Deterministic Gradient

  1. D4-2021-450797-abstract.pdf  
  2. D4-2021-450797-bibliography.pdf  
  3. D4-2021-450797-tableofcontent.pdf  
  4. D4-2021-450797-title.pdf