Laporkan Masalah

Simulasi Quadrotor Mengikuti Kabel Listrik Menggunakan Metode Reinforcement Learning

ROIS NUR HAKIM, M. Idham Ananta Timur, ST.M.Kom.

2020 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASI

Keamanan dalam operasi transmisi daya dapat diketahui salah satunya dengan melakukan monitoring kabel listrik. Monitoring kabel listrik biasanya dilakukan dengan patroli kaki oleh dua orang, namun kegiatan tersebut sulit dilakukan pada daerah yang susah dijangkau sehingga quadrotor dapat menjadi alternatif yang lebih efisien untuk melakukan monitoring kabel listrik. Pada penelitian ini digunakan metode reinforcement learning menggunakan algoritma Deep Q-Network. Penggunaan metode reinforcement learning dipilih karena memungkinkan pengembangan kebijakan kontrol yang optimal pada quadrotor tanpa membuat asumsi dari suatu kondisi. Pengujian penelitian menggunakan simulator AirSim yang dilakukan untuk mengetahui kemampuan agen dalam melakukan pembelajaran sistem. Hasil pengujian menunjukkan bahwa pembelajaran sistem berjalan dengan baik yang dibuktikan dengan nilai sum rewards per episode semakin konvergen dan stabil serta nilai loss function yang diperoleh semakin kecil merepresentasikan pemilihan jenis aksi saat sistem berjalan semakin tepat.

The safety of power transmission operations can be known by the monitoring of the powerline. Monitoring powerline is usually done by foot patrol by two people, but the activity is difficult to do in areas that are difficult to reach so that quadrotor can be a more efficient alternative to monitoring the powerline. In this study used reinforcement learning methods using Deep Q-Network algorithms. Use of the reinforcement learning method was chosen because it allowed the development of an optimal control policy on the quadrotor without making assumptions from a condition. Research testing using an AirSim simulator is done to find out the agent's ability to perform system learning. The test results showed that the learning of the system went well as evidenced with the value of the sum rewards per episode progressively converging and stabilized and the value of loss function gained smaller represents the selection of the type of action as the system goes more precisely.

Kata Kunci : Quadrotor, Reinforcement Learning, Deep Q-Network, Aksi, Rewards

  1. S1-2020-398423-abstract.pdf  
  2. S1-2020-398423-bibliography.pdf  
  3. S1-2020-398423-tableofcontent.pdf  
  4. S1-2020-398423-title.pdf