Laporkan Masalah

Segmentasi Optic Disc dan Optic Cup Berbasis Vision Transformer untuk Klasifikasi Glaukoma pada Citra Fundus Multisumber

Iga Novinda Rantaya, Prof. Ir. Hanung Adi Nugroho., S.T., M.E., Ph.D., IPM.; Syukron Abu Ishaq Alfarozi., S.T., Ph.D.

2025 | Tesis | S2 Teknologi Informasi

Glaukoma merupakan penyakit mata kronis yang menjadi salah satu penyebab utama kebutaan permanen di dunia. Deteksi dini berbasis citra fundus retina sangat penting untuk mencegah kerusakan saraf optik yang progresif. Namun, tantangan utama dalam pengembangan model deteksi glaukoma otomatis adalah kemampuan model untuk melakukan generalisasi yang baik pada data baru yang tidak pernah dilibatkan saat pelatihan. Banyak model segmentasi sebelumnya gagal mempertahankan performa ketika diuji pada dataset dengan karakteristik visual yang berbeda. Untuk mengatasi tantangan ini, penelitian ini mengusulkan pendekatan dua tahap berbasis Vision Transformer (ViT) dengan kontribusi utama pada pengembangan model segmentasi optic disc (OD) dan optic cup (OC) yang akurat dan mampu melakukan generalisasi lintas dataset. Model segmentasi dibangun menggunakan arsitektur SegFormer dan dilatih pada dataset SMDG-19 yang terdiri atas berbagai sub-dataset fundus dengan ground truth tervalidasi. Untuk menguji generalisasi model, digunakan dataset eksternal Drions-DB yang tidak terlibat dalam proses pelatihan dan memiliki distribusi data yang berbeda. Model segmentasi berhasil mencapai Dice Score sebesar 0,9431 (OC) dan 0,9026 (OD) pada data pelatihan, serta mempertahankan performa tinggi pada data Drions-DB (DSC OD: 0,9287). Hasil segmentasi digunakan sebagai masukan untuk model klasifikasi glaukoma dalam tiga skenario input: citra fundus original, mask segmentasi, dan citra blended. Evaluasi lebih lanjut dilakukan pada dataset RFMiD sebagai data uji eksternal yang sepenuhnya tidak terlibat proses pelatihan. Pendekatan blended menghasilkan akurasi 0,8286 dan f1-score 0,7752, dan terbukti secara statistik lebih unggul berdasarkan uji McNemar. Hasil ini menegaskan bahwa segmentasi OC/OD yang akurat dan general merupakan fondasi penting dalam pipeline klasifikasi glaukoma berbasis ViT, serta memiliki potensi tinggi untuk diterapkan dalam sistem skrining klinis otomatis.

Glaucoma is a chronic eye disease and one of the leading causes of permanent blindness worldwide. Early detection based on retinal fundus images is crucial to prevent progressive damage to the optic nerve. However, a major challenge in developing automated glaucoma detection models lies in ensuring their ability to generalize well to new data that has not been seen during training. Many existing segmentation models fail to maintain performance when tested on datasets with different visual characteristics. To address this challenge, this study proposes a two-stage approach based on Vision Transformer (ViT), with its main contribution being the development of an accurate and generalized segmentation model for the optic disc (OD) and optic cup (OC). The segmentation model is built using the SegFormer architecture and trained on the SMDG-19 dataset, which consists of multiple validated fundus image sub-datasets. To evaluate the model's generalization capability, the external Drions-DB dataset unseen during training and possessing a distinct data distribution—is used. The segmentation model achieved a Dice Score of 0.9431 (OC) and 0.9026 (OD) on the training data, and maintained high performance on Drions-DB (DSC OD: 0.9287). The segmentation output was then used as input for glaucoma classification in three scenarios: original fundus image, segmentation mask, and blended image. Further evaluation was performed on the RFMiD dataset as an entirely unseen external test set. The blended input scenario produced the best classification results, with an accuracy of 0.8286 and an F1-score of 0.7752, and was statistically superior based on McNemar's test. These findings affirm that accurate and generalized OC/OD segmentation is a critical foundation for ViT-based glaucoma classification pipelines, and holds strong potential for implementation in automated clinical screening systems.

Kata Kunci : Glaukoma, Vision Transformer, SegFormer, Segmentasi, Klasifikasi citra medis

  1. S2-2025-512869-abstract.pdf  
  2. S2-2025-512869-bibliography.pdf  
  3. S2-2025-512869-tableofcontent.pdf  
  4. S2-2025-512869-title.pdf