Laporkan Masalah

SIMULASI PERGERAKAN ROBOT MENGHINDARI RINTANGAN UNTUK MENUJU SATU TITIK TUJUAN DENGAN METODE DEEP Q-NETWORK

IVAN FABRIANO S, M. Idham Ananta Timur, S.T. M.Kom

2021 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASI

Robot pengikut adalah robot yang bertugas menuju dan mengikuti suatu objek sekaligus menghindari suatu obstacle. Suatu robot pengikut diharapkan mampu bekerja di lingkungan sederhana maupun di lingkungan yang luas dan dinamis. Oleh karena itu, robot pengikut membutuhkan sistem kendali yang memiliki kemampuan mengumpulkan dataset secara mandiri, belajar, berinteraksi dan beradaptasi terhadap lingkungan. Metode yang digunakan pada penelitian ini adalah reinforcement learning khususnya deep Q-network (DQN). Dengan menggunakan metode DQN, robot dapat melakukan pembelajaran secara mandiri dengan mengumpulkan informasi (dataset) dari lingkungan sehingga dapat menghasilkan tindakan yang tepat bagi agen. Pengujian dilakukan dengan menggunakan simulator PyBullet, robot dilatih di delapan skenario lintasan yang telah dibuat. Hasil pengujian menunjukan bahwa dengan menggunakan suatu set pelatihan yang sama, agen dapat berinteraksi, belajar, dan beradaptasi di 6 dari 8 skenario yang telah dibuat. Agen mampu melakukan pembelajaran kurang dari 3000 episode ditandai dengan nilai reward yang cenderung konvergen disetiap keberhasilan pembelajaran agen, serta nilai loss function yang semakin mendekati nol.

The follower robot is a robot whose job is to go to and follow an object while avoiding an obstacle. A follower robot is expected to be able to work in simple environments as well as in a wide and dynamic environment. Therefore, the follower robot needs a control system that has the ability to independently collect datasets, learn, interact and adapt to the environment. The method used in this research is reinforcement learning, especially deep Q-network (DQN). By using the DQN method, robots can learn independently by collecting information (datasets) from the environment so that they can produce appropriate actions for agents. Tests are carried out using the PyBullet simulator, where the robot is trained in eight trajectory scenarios that have been made. The test results show that by using the same training set, agents can interact, learn, and adapt in 6 of the 8 scenarios that have been created. The agent is able to learn less than 3000 episodes marked by the reward value that tends to converge on each agent's learning success, and the loss function value is getting closer to zero.

Kata Kunci : Robot pengikut, Reinforcement Learning, Deep Q-Network

  1. S1-2021-414577-abstract.pdf  
  2. S1-2021-414577-bibliography.pdf  
  3. S1-2021-414577-tableofcontent.pdf  
  4. S1-2021-414577-title.pdf