Optimized SMOTE And Radius-SMOTE For Data Imbalance In MRI-Based Brain Tumor Detection
Muhammad Fazil Maulana, Aina Musdholifah, S.Kom., M.Kom. Ph.D
2025 | Skripsi | ILMU KOMPUTER
Deteksi tumor otak menggunakan MRI memainkan peran krusial dalam diagnosis klinis, namun interpretasi manual masih memakan waktu dan rentan terhadap kesalahan manusia. Pembelajaran mesin dan pembelajaran mendalam telah secara signifikan meningkatkan keandalan diagnostik, namun dataset MRI yang tidak seimbang terus menghambat sensitivitas model terhadap kelas tumor minoritas. Penelitian ini mengusulkan kerangka kerja hibrida yang menggabungkan ekstraksi fitur VGG16 dengan klasifikasi XGBoost, yang diperkuat oleh teknik oversampling canggih termasuk SMOTE, Radius-SMOTE, dan SMOTE yang dioptimalkan oleh Algoritma Genetika (GA-SMOTE). Melalui prapemrosesan dan ekstraksi fitur yang sistematis, VGG16 menghasilkan representasi laten berkualitas tinggi, memungkinkan klasifikasi yang efisien dan andal. Hasil eksperimen menunjukkan bahwa baseline hybrid VGG16–XGBoost outperformed model VGG16 end-to-end, mencapai akurasi lebih tinggi dengan waktu komputasi yang jauh lebih singkat. Meskipun SMOTE standar dan Radius-SMOTE memberikan peningkatan yang tidak signifikan, pipeline GA-SMOTE menunjukkan kinerja yang superior, mencapai akurasi 95,78?ngan peningkatan recall untuk kelas tumor minoritas. Temuan ini membuktikan keefektifan model hibrida dan oversampling berbasis optimasi dalam meningkatkan presisi diagnostik, terutama dalam skenario di mana ketidakseimbangan kelas memengaruhi tugas pemrosesan citra medis. Pendekatan yang diusulkan menawarkan solusi yang andal dan efisien secara komputasi untuk deteksi tumor otak berbasis MRI secara otomatis.
Brain tumor detection using MRI plays a crucial role in
clinical diagnosis, yet manual interpretation remains time-consuming and
susceptible to human error. Machine learning and deep learning have
significantly improved diagnostic reliability, but imbalanced MRI datasets
continue to hinder model sensitivity toward minority tumor classes. This
research proposes a hybrid framework that integrates VGG16 feature extraction
with XGBoost classification, enhanced by advanced oversampling techniques
including SMOTE, Radius-SMOTE, and Genetic Algorithm–optimized SMOTE
(GA-SMOTE). Through systematic preprocessing and feature extraction, VGG16
produced high-quality latent representations, enabling efficient and robust
classification. Experimental results show that the hybrid VGG16–XGBoost
baseline outperformed the end-to-end VGG16 model, achieving higher accuracy
with drastically reduced computation time. While standard SMOTE and
Radius-SMOTE yielded negligible improvements, the GA-SMOTE pipeline
demonstrated superior performance, reaching 95.78?curacy with enhanced
recall for minority tumor classes. These findings validate the effectiveness of
hybrid models and optimization-based oversampling in improving diagnostic
precision, particularly in scenarios where class imbalance affects medical
imaging tasks. The proposed approach offers a reliable and computationally
efficient solution for automated MRI-based brain tumor detection.
Kata Kunci : Brain Tumor, MRI, Data Imbalance, VGG16, SMOTE, Genetic Algorithm, XGBoost, Classification.