Laporkan Masalah

Klasifikasi Lesi Kulit Berpigmen Pada Citra Dermoskop Melalui Integrasi Attention Mechanism Pada Pre-Trained Inception-V3

Erwin Setyo Nugroho, Hanung Adi Nugroho, Igi Ardiyanto

2026 | Disertasi | S3 Teknik Elektro

Lesi kulit berpigmen, khususnya melanoma, merupakan salah satu jenis kanker kulit yang berbahaya dan sering kali sulit dibedakan dari lesi jinak. Deteksi dini menjadi faktor yang sangat krusial dalam menurunkan risiko mortalitas. Namun, interpretasi citra dermoskop dalam praktik klinis menghadapi berbagai tantangan, seperti variasi bentuk dan warna lesi serta keberadaan artefak citra, yang dapat memengaruhi konsistensi penilaian antar-pengamat. Pendekatan deep learning, khususnya Convolutional Neural Network (CNN), telah banyak dimanfaatkan dalam klasifikasi lesi kulit berpigmen karena mampu mencapai tingkat akurasi yang tinggi. Meskipun demikian, model-model tersebut umumnya bersifat black-box, sehingga mekanisme pengambilan keputusannya sulit dipahami oleh pengguna klinis dan berpotensi menurunkan tingkat kepercayaan dalam proses pengambilan keputusan medis.

Sejumlah penelitian sebelumnya telah mengintegrasikan teknik Interpretable Machine Learning (IML) atau Explainable Artificial Intelligence (XAI) untuk meningkatkan transparansi model deep learning. Namun, pendekatan-pendekatan tersebut masih memiliki beberapa keterbatasan. Sebagian besar penelitian berfokus pada klasifikasi biner, interpretasi yang diberikan masih bersifat parsial dan teknis, belum mengombinasikan lebih dari satu mekanisme interpretasi secara terintegrasi, serta tidak melibatkan evaluasi langsung oleh pengguna klinis untuk menilai dampak fitur interpretatif terhadap tingkat kepercayaan dan keberterimaan sistem. Celah inilah yang mendorong penelitian ini untuk mengusulkan pendekatan IML yang tidak hanya meningkatkan kinerja klasifikasi, tetapi juga tervalidasi secara klinis dari perspektif pengguna akhir.

Penelitian ini mengembangkan model klasifikasi lesi kulit berpigmen berbasis Interpretable Machine Learning menggunakan dataset ISIC 2019 yang terdiri dari delapan kelas lesi kulit. Model dibangun dengan arsitektur pre-trained Inception-v3 yang dioptimasi melalui penerapan data augmentation, Bayesian hyperparameter tuning, serta penambahan attention module sebagai bagian dari arsitektur model.

Hasil eksperimen menunjukkan bahwa model yang diusulkan mencapai akurasi sebesar 97,38%, nilai AUC sebesar 0,985, dan sensitivitas sebesar 98,50%, yang mengindikasikan kemampuan sangat baik dalam mendeteksi lesi ganas seperti melanoma. Untuk meningkatkan transparansi model, disediakan dua keluaran interpretatif, yaitu attention map berbasis Grad-CAM yang menyoroti area penting pada citra, serta tiga citra dermoskop paling mirip dari kelas prediksi menggunakan pendekatan Content-Based Image Retrieval (CBIR).

Evaluasi interpretabilitas dilakukan melalui studi pengguna yang melibatkan 33 dokter spesialis kulit. Dalam penelitian ini, dokter tidak digunakan sebagai gold standard diagnostik, melainkan sebagai pengguna akhir (end-user) untuk mengevaluasi persepsi kepercayaan dan keberterimaan sistem bantu diagnosis yang diusulkan. Responden diminta menilai dua versi model, yaitu model awal tanpa fitur interpretatif dan model akhir dengan fitur interpretatif, menggunakan kuesioner delapan pertanyaan. Hasil uji statistik Wilcoxon Signed-Rank menunjukkan adanya peningkatan kepercayaan pengguna yang signifikan terhadap model interpretatif.

Secara keseluruhan, penelitian ini berkontribusi pada pengembangan sistem bantu diagnosis berbasis deep learning yang tidak hanya unggul dari sisi kinerja klasifikasi, khususnya dalam meningkatkan sensitivitas, tetapi juga lebih transparan dan memiliki tingkat akseptabilitas yang lebih baik dalam konteks praktik klinis.

Pigmented skin lesions, particularly melanoma, represent one of the most dangerous types of skin cancer and are often difficult to distinguish from benign lesions. Early detection is crucial for reducing mortality risk. However, the interpretation of dermoscopic images in clinical practice faces significant challenges due to variations in lesion shape and color, as well as the presence of image artifacts, which may affect inter-observer consistency. Deep learning approaches, particularly Convolutional Neural Networks (CNNs), have been widely adopted for pigmented skin lesion classification because of their high classification accuracy. Nevertheless, these models are generally regarded as black-box systems, making their decision-making processes difficult to interpret by clinicians and potentially reducing trust in clinical decision-making.

Several previous studies have integrated Interpretable Machine Learning (IML) or Explainable Artificial Intelligence (XAI) techniques to enhance the transparency of deep learning models. However, these approaches still exhibit notable limitations. Most studies predominantly focus on binary classification tasks, provide interpretability mechanisms that are partial and technically oriented, lack integrated multi-mechanism interpretability strategies, and do not include direct evaluation by clinical users to assess the impact of interpretability features on user trust and system acceptability. These gaps motivate the present study to propose an IML-based approach that not only improves classification performance but is also clinically validated from an end-user perspective.

This study develops an Interpretable Machine Learning–based model for pigmented skin lesion classification using the ISIC 2019 dataset, which consists of eight lesion classes. The model is built upon a pre-trained Inception-v3 architecture and optimized through data augmentation, Bayesian hyperparameter tuning, and the incorporation of an attention module as an integral component of the architecture. Experimental results demonstrate that the proposed model achieves an accuracy of 97.38%, an AUC value of 0.985, and a sensitivity of 98.50%, indicating strong capability in correctly identifying malignant lesions such as melanoma.

To enhance model transparency, two interpretability outputs are provided: attention maps generated using Grad-CAM to highlight diagnostically relevant regions in the images, and the three most similar dermoscopic images from the predicted class retrieved using a Content-Based Image Retrieval (CBIR) approach. Interpretability evaluation was conducted through a user study involving 33 board-certified dermatologists. In this study, dermatologists were not used as a diagnostic gold standard but rather as end-users to evaluate trust perception and system acceptability of the proposed clinical decision support system. Participants assessed two model versions—an initial model without interpretability features and a final model with interpretability features—using an eight-item questionnaire. Statistical analysis using the Wilcoxon Signed-Rank test revealed a significant increase in user trust toward the interpretable model.

Overall, this research contributes to the development of deep learning–based clinical decision support systems that are not only high-performing in classification accuracy, particularly sensitivity, but also more transparent and better accepted in real clinical practice.

Kata Kunci : Pigmented skin lesions, melanoma, Interpretable Machine Learning, Convolutional Neural Network, Inception-v3, Grad-CAM, Content-Based Image Retrieval, image classification.

  1. S3-2026-450412-abstract.pdf  
  2. S3-2026-450412-bibliography.pdf  
  3. S3-2026-450412-tableofcontent.pdf  
  4. S3-2026-450412-title.pdf