SEGMENTASI TUMOR OTAK BERBASIS CITRA MRI DENGAN MULTI-MODAL BTS U-NET
Fariz Harisuddin Dharmawan, Oskar Natan, S.ST., M.Tr.T., Ph.D. ; Dr. Dyah Aruming Tyas, S.Si.
2026 | Tesis | S2 Ilmu Komputer
Segmentasi tumor otak pada citra Magnetic Resonance Imaging (MRI) memiliki berbagai masalah berupa batas tumor yang buram, rasio kontras yang rendah, variasi posisi dan luas area tumor otak, dan modalitas yang berbeda-beda. Permasalahan tersebut dapat diselesaikan menggunakan VGG-19, namun penambahan VGG-19 menyebabkan kenaikan parameter dan FLOPs. Kenaikan tersebut menyebabkan beban komputasi. Sehingga penelitian ini bertujuan untuk mengatasi permasalahan tersebut dengan mengusulkan arsitektur hibrida yang menggabungkan efisiensi BTS U-Net dengan kemampuan ekstraksi fitur spasial mendalam dari VGG-19 sebagai encoder. Metode yang diusulkan mengintegrasikan Edge Detection Block untuk mempertegas batas tumor, Instance Normalization untuk menstabilkan variasi intensitas, serta Convolutional Block Attention Module (CBAM) untuk memfokuskan fitur pada area tumor. Penelitian ini menggunakan dataset BraTS2021 dengan pendekatan multi-modal Channel stacking (T1, T1CE, T2, FLAIR). Kinerja model dibandingkan dengan arsitektur U-Net Standar, VGG-19 & U-Net, BTS U-Net, EfficientNet B7 & BTS U-Net, Swin Transformer, dan TransUNet. Hasil pengujian menunjukkan bahwa arsitektur usulan (BTS U-Net & VGG-19) menghasilkan performa segmentasi terbaik dibandingkan model lainnya, dengan capaian Dice Similarity Coefficient (DSC) sebesar 0,8522, Intersection over Union (IoU) sebesar 0,7442, dan Hausdorff Distance sebesar 17,1860. Dari segi komputasi, model ini terbukti efisien dengan mencatatkan waktu pelatihan tercepat yaitu 267,42 detik per epoch. Serta memiliki total waktu inferensi 106,03 detik dan inferensi rata-rata 8,45 ms. Kesimpulannya, perpaduan BTS U-Net dan VGG-19 mampu menyeimbangkan akurasi segmentasi yang tinggi dengan efisiensi waktu komputasi dalam menangani citra MRI multi-modal.
Brain tumor segmentation in Magnetic Resonance Imaging (MRI) images has various problems in the form of blurred tumor boundaries, low contrast ratios, variations in the position and area of the brain tumor, and different modalities. These problems can be solved using VGG-19, but the addition of VGG-19 causes an increase in parameters and FLOPs. This increase causes a computational burden. Thus, this research aims to overcome these problems by proposing a hybrid architecture that combines the efficiency of BTS U-Net with the deep spatial feature extraction capabilities of VGG-19 as an encoder. The proposed method integrates an Edge Detection Block to strengthen tumor boundaries, Instance Normalization to stabilize intensity variations, and a Convolutional Block Attention Module (CBAM) to focus features on the tumor area. This research uses the BraTS2021 dataset with a multi-modal Channel stacking approach (T1, T1CE, T2, FLAIR). The model performance is compared with Standard U-Net, VGG-19 & U-Net, BTS U-Net, EfficientNet B7 & BTS U-Net, Swin Transformer, and TransUNet architectures. The test results show that the proposed architecture (BTS U-Net & VGG-19) produces the best segmentation performance compared to other models, with a Dice Similarity Coefficient (DSC) of 0.8522, Intersection over Union (IoU) of 0.7442, and Hausdorff Distance of 17.1860. In terms of computation, this model is proven to be efficient by recording the fastest training time of 267.42 seconds per Epoch. It also has a total inference time of 106.03 seconds and an average inference of 8.45 ms. In conclusion, the combination of BTS U-Net and VGG-19 is able to balance high segmentation accuracy with computational time efficiency in handling multi-modal MRI images.
Kata Kunci : Brain Tumor Segmentation, MRI, BTS U-Net, VGG-19, Deep Learning, BraTS2021