Laporkan Masalah

Peningkatan Akurasi Klasifikasi Gerakan Mata Melalui Optimasi Hyperparameter Arsitektur Temporal Convolutional Network Menggunakan Metode Particle Swarm Optimization (PSO)

MIFTAHUL JANNAH, Dr.Eng. Ir. Sunu Wibirama, ST, M.Eng., IPM. ; Syukron Abu Ishaq Alfarozi, S.T., Ph.D.

2025 | Skripsi | TEKNOLOGI INFORMASI

Perkembangan teknologi interaksi manusia dan komputer semakin meluas dalam berbagai aspek kehidupan manusia. Salah satu inovasi yang masif dikembangkan dalam bidang ini adalah interaksi berbasis pandangan mata (gaze-based interaction). Terobosan inovasi gaze-based interaction memberikan banyak manfaat, seperti meningkatkan aksesibilitas bagi individu dengan disabilitas fisik, meningkatkan efisiensi kontrol dan navigasi aplikasi serta perangkat lunak, serta berperan dalam berbagai penelitian kognitif mengenai pandangan mata. Tentunya, pengembangan sistem berbasis pandangan mata memerlukan kemampuan dalam mengenali dan mengklasifikasikan berbagai gerakan mata manusia. Arsitektur model Temporal Convolutional Network (TCN) telah menjadi state-of-the-art dalam klasifikasi gerakan mata seperti fixation, saccade, smooth pursuit, dan noise. Meskipun demikian, peningkatan akurasi klasifikasi masih diperlukan untuk meningkatkan responsivitas sistem eye tracking, terutama dalam teknologi touchless. Penelitian sebelumnya menunjukkan bahwa hasil klasifikasi gerakan smooth pursuit menggunakan TCN masih belum optimal dengan akurasi sebesar 0,764 lebih rendah dibandingkan dengan kelas lainnya. Oleh karena itu, penelitian ini akan berfokus pada peningkatan akurasi klasifikasi gerakan mata dengan mengoptimalkan hyperparameter pada model TCN yang ada menggunakan metode Particle Swarm Optimization (PSO). PSO dipilih karena kemampuannya dalam mengeksplorasi dan mengeksploitasi ruang pencarian untuk mencari solusi optimal. Evaluasi performa model dilakukan melalui dua metode, yaitu Leave One Video Out (LOVO) dan K-Fold Cross Validation. Hasil penelitian menunjukkan bahwa model TCN yang telah dioptimalkan dengan PSO mengalami peningkatan signifikan pada setiap kelas gerakan mata. Evaluasi metode LOVO menunjukkan peningkatan akurasi F1 Score sebesar 0,95% pada kelas fixation, 1,55% pada kelas saccade, 5,52% pada kelas smooth pursuit, dan 4,96% pada kelas noise. Sementara itu, K-Fold Cross Validation menghasilkan peningkatan akurasi F1 Score untuk semua kelas sebesar 0,97% untuk kelas fixation, 2,02% untuk saccade, 5,67% untuk smooth pursuit, dan 2,52% untuk noise. Penelitian ini tidak hanya memastikan model efisien dalam proses training, tetapi juga mampu menghasilkan evaluasi yang optimal sehingga diharapkan dapat mendukung pengembangan sistem berbasis pandangan mata yang lebih baik.

The advancement of human-computer interaction technology is rapidly expanding across various facets of human life. One notable innovation in this area is gazebased interaction, which offers numerous benefits, including enhanced accessibility for individuals with physical disabilities, improved efficiency in controlling and navigating applications and software, and significant contributions to cognitive research on eye movements. The development of gaze-based systems naturally requires the ability to accurately recognize and classify various human eye movements. The Temporal Convolutional Network (TCN) model architecture has emerged as the state-of-the-art in eye movement classification. However, further improvement in classification accuracy is necessary to enhance the responsiveness of eye tracking systems, particularly in touchless technology. Previous research indicates that the classification results for smooth pursuit movements using TCN are still suboptimal, with an accuracy of 0,764, which is lower compared to other classes. This study aims to enhance the accuracy of eye movement classification by optimizing the hyperparameters of an existing TCN model using the Particle Swarm Optimization (PSO) method. PSO was chosen for its ability to explore and exploit the search space to find an optimal solution. Model performance was evaluated using two methods: Leave One Video Out (LOVO) and K-Fold Cross Validation. The research results shows that the TCN model optimized with PSO achieved significant improvements across all eye movement classes. Evaluation using the LOVO method showed an increase in F1 Score accuracy 0,95% for the fixation, 1,55% for the saccade, 5,52% for the smooth pursuit, and 4,96% for the noise . Additionally, K-Fold Cross Validation resulted in F1 Score accuracy improvements of 0,97% for the fixation class, 2,02% for saccade, 5,67% for smooth pursuit, and 2,52% for noise. These enhancements in accuracy are expected to support the development of more effective gaze-based systems. This research focuses on the efficiency of the model’s performance in the training process and its ability to produce optimal evaluation results, which are expected to support the development of better eye movement based systems.

Kata Kunci : Eye movement classification, Temporal Convolutional Network, Hyperparameter Optimization, Particle Swarm Optimization, K-Fold Cross Validation

  1. S1-2025-456845-abstract.pdf  
  2. S1-2025-456845-bibliography.pdf  
  3. S1-2025-456845-tableofcontent.pdf  
  4. S1-2025-456845-title.pdf