MODEL AUGMENTASI CITRA KELAS MINORITAS UNTUK PENINGKATAN KINERJA CONVOLUTIONAL NEURAL NETWORKS (CNN) PADA KLASIFIKASI PENYAKIT DAUN
DERISMA, Dr. Nur Rokhman, S.Si., M.Kom. ; Dr. Dyah Aruming Tyas, S.Si.
2025 | Disertasi | S3 Ilmu Komputer
Ketidakseimbangan data merupakan tantangan signifikan dalam klasifikasi penyakit tanaman berbasis Convolutional Neural Network (CNN). Beberapa kelas penyakit, seperti Multiple diseases pada apel dan Gray Leaf Spot pada jagung, memiliki jumlah sampel yang jauh lebih sedikit dibandingkan kelas mayoritas, sehingga mengurangi kemampuan model dalam mengenali kelas minoritas secara akurat. Teknik augmentasi citra seperti MixUp, CutMix, CutOut, dan Mosaic telah digunakan untuk mengatasi ketimpangan ini, namun masih memiliki keterbatasan dalam mempertahankan informasi penting dari citra daun.
Penelitian ini mengusulkan teknik augmentasi baru bernama EdgeCutMix, yang menggabungkan pemotongan citra berbasis deteksi tepi dan strategi penggabungan gambar dalam grid 2×2. Teknik ini dirancang untuk mempertahankan kontur objek daun juga meningkatkan keragaman data. Evaluasi dilakukan menggunakan empat arsitektur CNN, yaitu DenseNet201, EfficientNet-B7, MobileNetV2, dan ResNet18, pada dua dataset: Plant Pathology 2020 (apel) dan PlantDoc (jagung).
Secara statistik, EdgeCutMix mampu menghasilkan citra augmentasi dengan distribusi warna yang mendekati citra asli, namun tetap memperluas keragaman visual secara alami. Hasil eksperimen menunjukkan bahwa EdgeCutMix memberikan performa klasifikasi paling konsisten dan unggul dibandingkan metode augmentasi lain. Pada dataset apel, EdgeCutMix mencapai akurasi rata-rata 94,20%, lebih tinggi dibandingkan CutOut (94,02%) dan Baseline (60,14). Pada dataset jagung, EdgeCutMix juga berada di posisi teratas dengan akurasi rata-rata 95,2 %, lebih tinggi dibandingkan CutOut (95,11%) dan Baseline (72,60%). Analisis loss juga menunjukkan pengurangan overfitting serta peningkatan kemampuan model dalam mendeteksi kelas minoritas secara lebih seimbang.
Data imbalance is a significant challenge in plant disease classification based on Convolutional Neural Network (CNN). Some disease classes, such as Multiple diseases in apples and Gray Leaf Spot in corn, have far fewer samples than the majority class, reducing the model's ability to accurately recognize minority classes.
Image augmentation techniques such as MixUp, CutMix, CutOut, and Mosaic have been used to address this imbalance, but they still have limitations in preserving important information from leaf images. This study proposes a new augmentation technique called EdgeCutMix, which combines edge detection-based image cropping and image merging strategies in a 2×2 grid.
This technique is designed to preserve the contours of leaf objects while increasing data diversity. Evaluations were conducted using four CNN architectures, namely DenseNet201, EfficientNet-B7, MobileNetV2, and ResNet18, on two datasets: Plant PathoLogy 2020 (apple) and PlantDoc (corn).
Statistically, EdgeCutMix is capable of producing augmented images with color distributions that are close to the original images, while still expanding visual diversity naturally. The experimental results show that EdgeCutMix provides the most consistent and superior classification performance compared to other augmentation methods. On the apple dataset, EdgeCutMix achieved an average accuracy of 94.20%, higher than CutOut (94.02%) and Baseline (60.14). On the corn dataset, EdgeCutMix also ranked first with an average accuracy of 95.2%, higher than CutOut (95.11%) and Baseline (72.60%). Loss analysis also showed a reduction in overfitting and an improvement in the model's ability to detect minority classes more evenly.
Kata Kunci : Augmentation Techniques, EdgeCutMix, Deep Learning, Leaf Disease Classification, Minority Classes, Class Imbalance, CNN