Penerapan Imitation Learning untuk Otomatisasi Tugas Needle Picking pada Platform SurRoL

Sefvia Lie

Sefvia Lie, Ahmad Ataka Awwalur Rizqi , S.T., Ph.D;Dr.Eng. Ir. Adha Imam Cahyadi, S.T., M.Eng., IPM.

2025 | Skripsi | S1 TEKNIK BIOMEDIS

Abstrak
File Pdf

Perkembangan robotika medis mendorong terciptanya sistem yang semakin adaptif dan efisien, khususnya dalam otomatisasi tugas manipulasi seperti pengambilan jarum untuk meringankan beban kerja tenaga medis. Salah satu tantangan utama dalam otomatisasi tugas ini adalah bagaimana agen dapat meniru perilaku optimal dari seorang ahli secara efisien, sehingga dapat mencapai kinerja yang mendekati atau bahkan menyamai pakar manusia.

Penelitian ini bertujuan untuk mengevaluasi efektivitas berbagai model Imitation Learning (IL) pada tugas needle picking di lingkungan simulasi Surgical Robot Learning (SurRoL). Model yang dievaluasi menggunakan dua algoritma utama, yaitu Behavioral Cloning (BC) dan Dataset Aggregation (DAgger), dengan arsitektur MLP dan LSTM. Metodologi penelitian meliputi pengumpulan data demonstrasi dari kebijakan expert, pemrosesan dataset, pelatihan model dengan hyperparameter tuning menggunakan metode grid search, serta evaluasi performa model berdasarkan success rate dan episode return. Selain itu, penelitian ini juga menganalisis pengaruh variasi jumlah data demonstrasi dan tuning hyperparameter terhadap performa model.

Hasil penelitian menunjukkan bahwa model LSTM dengan algoritma BC dan kombinasi hyperparameter optimal memberikan tingkat keberhasilan (success rate) rata-rata tertinggi sebesar 84%, dengan beberapa evaluasi model mampu mencapai tingkat keberhasilan hingga 100%. Peningkatan jumlah episode demonstrasi terbukti secara konsisten meningkatkan kinerja model pada sebagian besar konfigurasi. Sementara itu, penggunaan algoritma DAgger tidak selalu menghasilkan performa yang lebih baik dibandingkan BC, meskipun memiliki implementasi yang lebih kompleks. Temuan ini menegaskan bahwa pemilihan arsitektur model, algoritma, dan strategi optimalisasi hyperparameter sangat berperan penting dalam keberhasilan agen imitasi pada tugas manipulasi robotik.

The rapid advancement of medical robotics necessitates the development of adaptive and efficient systems, particularly for automating manipulation tasks such as needle picking, which aim to reduce the workload of medical professionals. One of the main challenges in automating these tasks is enabling agents to efficiently mimic the optimal behavior of human experts, thereby achieving performance that approaches or even matches human experts.

This study aims to evaluate the effectiveness of various imitation learning (IL) models for the needle picking task in the SurRoL simulation environment. The models assessed utilize two main algorithms, namely Behavioral Cloning (BC) and Dataset Aggregation (DAgger), with MLP and LSTM architectures. The methodology involves collecting demonstration data from an expert policy, preprocessing the dataset, training the models with hyperparameter tuning via grid search, and performance evaluation based on success rate and episode return metrics. Additionally, this study analyzes the effects of varying the amount of demonstration data and hyperparameter tuning on model performance.

Results show that LSTM with BC, at optimal hyperparameter achieved the highest average success rate of 84%, with some trials reaching 100% success rate. Increasing demonstration episodes significantly improved performance across most configurations. Meanwhile, DAgger did not consistently outperform BC despite its implementation complexity. These findings highlight the critical importance of model architecture, algorithm choice, and hyperparameter tuning for successful imitation learning in robotic manipulation.

Kata Kunci : Robotika Medis, Imitation Learning, Needle Pick, Behavioral Cloning, Dataset Aggregation

S1-2025-478184-abstract.pdf
S1-2025-478184-bibliography.pdf
S1-2025-478184-tableofcontent.pdf
S1-2025-478184-title.pdf

LAYANAN

E-Resources

Quick Access