TRAJECTORY GENERATION UNTUK QUADCOPTER BERBASIS LARGE LANGUAGE MODEL (LLM)
Nurhadi Sutra, Ahmad Ataka Awwalur Rizqi, S.T., Ph.D.; Dr.Eng. Ir. Adha Imam Cahyadi, S.T., M.Eng., IPM.
2025 | Tesis | S2 Teknik Elektro
Perencanaan lintasan quadcopter
di lingkungan yang dinamis dan tidak terstruktur menghadapi tantangan
operasional yang signifikan, terutama bagi pengguna non-teknis. Metode
konvensional seringkali bergantung pada antarmuka pengguna grafis (GUI) yang rumit
dan kurang intuitif. Penelitian ini bertujuan untuk menghadirkan pendekatan
yang lebih fleksibel dan intuitif dengan memanfaatkan kapabilitas Large
Language Model (LLM), khususnya GPT-4.1, untuk menerjemahkan perintah bahasa
alami dari pengguna menjadi jalur penerbangan 3D yang dapat dieksekusi. Keunggulan utama dari pendekatan ini adalah penyederhanaan interaksi
manusia-robot, sehingga teknologi drone menjadi lebih mudah diakses.
Sistem yang diusulkan
memungkinkan pengguna memberikan perintah misi melalui antarmuka berbasis teks.
Perintah ini kemudian diolah oleh LLM untuk menghasilkan serangkaian titik
jalan (waypoint) dalam format JSON. Pengujian sistem dilakukan dalam lingkungan
simulasi menggunakan Webots dengan model drone virtual, serta antarmuka pengguna
yang dibangun dengan Customtkinter. Evaluasi sistem dilakukan melalui dua pendekatan:
pengujian teknis berdasarkan kriteria validitas format, struktur, dan kesesuaian
tugas, serta evaluasi pengalaman pengguna yang melibatkan 30 responden dengan berbagai
tingkat keahlian.
Hasil penelitian menunjukkan
bahwa sistem berbasis LLM mampu menangani sebagian besar perintah dan
menerjemahkannya ke dalam lintasan navigasi yang valid, dengan tingkat
keberhasilan teknis keseluruhan mencapai 76,6?ri 30 percobaan. Dari sisi evaluasi
pengguna, 83,3% responden menilai sistem sangat mudah digunakan, dan 90% merasa
sistem dapat memberikan hasil secara efisien. Meskipun demikian, tantangan teridentifikasi
dalam menangani prompt yang bersifat ambigu atau terlalu kompleks, yang menyoroti
isu language grounding sebagai area pengembangan di masa depan. Penelitian ini
berhasil memberikan kontribusi berupa solusi baru untuk pengendalian quadcopter
yang lebih intuitif dan efisien, serta menjadi fondasi bagi pengembangan sistem
interaksi manusia-robot berbasis bahasa alami yang lebih canggih.
Quadcopter trajectory planning in dynamic and unstructured environments poses significant operational challenges, particularly for non-technical users. Conventional methods often rely on complex and less intuitive Graphical User Interfaces (GUIs). This research aims to introduce a more flexible and intuitive approach by leveraging the capabilities of a Large Language Model (LLM), specifically GPT-4.1, to translate natural language commands from a user into an executable 3D flight path. The primary advantage of this approach is the simplification of human-robot interaction, making drone technology more accessible.
The proposed system allows users to provide mission commands through a text-based interface. These commands are then processed by the LLM to generate a series of waypoints in JSON format. System testing was conducted in a simulated environment using Webots with a virtual drone model and a user interface built with Customtkinter. The system was evaluated using a dual approach: technical testing based on criteria of format validity, structure, and task conformity, and a user experience evaluation involving 30 respondents with varying levels of expertise.
The results indicate that the LLM-based system is capable of handling most commands and translating them into valid navigation trajectories, achieving an overall technical success rate of 76.6% from 30 trials. From the user evaluation, 83.3% of respondents rated the system as very easy to use, and 90?lt the system could deliver results efficiently. Nevertheless, challenges were identified in handling ambiguous or overly complex prompts, highlighting the issue of language grounding as a key area for future development. This research successfully contributes a novel solution for more intuitive and efficient quadcopter control and serves as a foundation for the development of more advanced natural language-based human-robot interaction systems.
Kata Kunci : Large Language Model, Quadcopter, Path Planning, Natural Language Processing, Human-Robot Interaction.