Klasifikasi Multi-Label Status Mutasi Genetik Cutaneous Melanoma Pada Whole Slide Imaging Dengan Attention-Based Multiple Instance Learning (ABMIL)
Jihaad Arief Pangestu, Afiahayati, S.Kom., M.Cs., Ph.D. ;dr. Paranita Ferronika, Ph.D., Sp.PA(K)
2025 | Tesis | MAGISTER KECERDASAN ARTIFISIAL
Analisis citra histopatologi berbasis Whole Slide Imaging (WSI) dengan dukungan kecerdasan buatan (Artificial Intelligence) telah banyak digunakan dalam diagnosis kanker. Cutaneous melanoma (SKCM) merupakan jenis kanker kulit yang agresif dan memiliki tingkat mortalitas tinggi, sehingga deteksi status mutasi genetik menjadi krusial untuk pemilihan terapi tepat sasaran. Namun penelitian yang memanfaatkan WSI untuk memprediksi mutasi pada SKCM masih terbatas. Penelitian terkini menunjukkan bahwa Attention-Based Multiple Instance Learning (ABMIL) efektif dalam memprediksi status mutasi kanker dari citra WSI. Namun, metode yang ada umumnya masih terbatas pada pendekatan biner (mutasi ada atau tidak), kurang efisien untuk prediksi beberapa mutasi.
Penelitian ini mengembangkan model machine learning berbasis Attention-Based Multiple Instance Learning (ABMIL) untuk klasifikasi multi-label status mutasi BRAF, NRAS, NF1, dan Triple Wild Type. Untuk menghasilkan model multi-label yang optimal, dilakukan serangkaian eksperimen guna menemukan kombinasi terbaik yang mencakup fungsi aktivasi (Softmax dan Sigmoid), fungsi loss (BCE, WBCE), teknik pembagian data (K-Fold CV, Stratified Split, dan Random Split), serta variasi threshold prediksi (0.15, 0.20, 0.25, dan Top-2K).
Hasil penelitian menunjukkan adanya dua kombinasi model terbaik yang masing-masing memiliki keunggulan berbeda. Kombinasi K-Fold CV + Gated Attention Pooling + Sigmoid + WBCE terbukti mampu memprediksi seluruh mutasi, terutama pada mutasi minoritas (NF1 dan TWT). Sebaliknya, kombinasi K-Fold CV + Attention Pooling + Softmax + Threshold Top-2 lebih optimal dalam mendeteksi mutasi mayoritas (BRAF dan NRAS). Selain itu, kedua kombinasi model multi-label terbukti lebih efisien secara komputasi dibandingkan pendekatan binary, ditunjukkan dengan kebutuhan waktu pelatihan yang lebih singkat dibandingkan total waktu yang diperlukan untuk melatih empat model terpisah pada pendekatan binary.
Histopathological image analysis based on Whole Slide Imaging (WSI) supported by Artificial Intelligence (AI) has been widely applied in cancer diagnosis. Cutaneous melanoma (SKCM) is an aggressive form of skin cancer with a high mortality rate, making the detection of genetic mutation status crucial for precision therapy selection. However, studies utilizing WSI to predict mutations in SKCM remain limited. Recent research has demonstrated that Attention-Based Multiple Instance Learning (ABMIL) is effective in predicting cancer mutation status from WSI images. Nevertheless, existing methods are generally constrained to binary approaches (mutation present or absent), which are less efficient for multi- mutation prediction.
This study developed a machine learning model based on Attention-Based Multiple Instance Learning (ABMIL) for multi-label classification of mutation status in BRAF, NRAS, NF1, and Triple Wild Type. To obtain an optimal multi- label model, a series of experiments was conducted to identify the best combination, which included activation functions (Softmax and Sigmoid), loss functions (BCE and WBCE), data splitting strategies (K-Fold Cross-Validation, Stratified Split, and Random Split), as well as prediction thresholds (0.15, 0.20, 0.25, and Top-2K).
The results revealed two best-performing model combinations, each with distinct strengths. The combination of K-Fold CV + Gated Attention Pooling + Sigmoid + WBCE successfully predicted all mutation types, with particular advantages in detecting minority mutations (NF1 and TWT). In contrast, the combination of K-Fold CV + Attention Pooling + Softmax + Top-2K threshold proved more effective for detecting majority mutations (BRAF and NRAS). Furthermore, both multi-label model combinations demonstrated higher computational efficiency compared to the binary approach, as indicated by shorter training times than the total time required to train four separate models in the binary setting.
Kata Kunci : Status Mutasi, ABMIL, Multi-label, TCGA-SKCM, Cutaneous melanoma