PERFORMA ARSITEKTUR CNN MOBILENETV3 PADA PENDETEKSIAN WAJAH BERMASKER
MUHAMMAD FULKI A A, Drs. Bambang Nurcahyo Prastowo, M.Sc.; Wahyono, Ph.D.
2022 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASIMunculnya versi ketiga setelah kesuksesan arsitektur CNN MobileNetV2 dalam klasifikasi dan deteksi gambar yang disebut sebagai arsitektur ringan dan memiliki akurasi yang bagus menimbulkan tantangan baru. Akankah MobileNetV3 akan sebaik pendahulunya atau malah sebaliknya. MobileNetV3 mempunyai dua varian model, yaitu MobileNetV3Small dan MobileNetV3Large. Meningkatnya kebutuhan arsitektur CNN yang rendah latensi, akurasi tinggi dan ukuran kecil terjadi akibat masalah keterbatasan memori, daya dan kecepatan komputasi karena naiknya kebutuhan pengguna. Pembuatan model pada penelitian ini dilakukan secara transfer learning features-extraction. Penggunaan transfer learning memungkinkan pengguna untuk mengubah pretrained model menjadi model yang dapat disesuaikan dengan keperluan pengguna. Model dilatih dengan menggunakan lima varian set data, penerapan variasi nilai dropout 0,2 dan 0,5 dengan menggunakan pretrained arsitektur MobileNetV3Large, MobileNetV3Small dan MobileNetV2. Pembuatan set data dibuat dengan rasio perbandingan 85% pelatihan: 15% validasi. Pelatihan dan validasi pada arsitektur MobileNetV3Large memiliki performa terbaik dengan menempati peringkat pertama pada pelatihan dan validasi, disusul dengan MobileNetV2 dan MobileNetV3Small. Pengujian pada penelitian ini dilakukan pada pendeteksian wajah bermasker. Pengujian yang dilakukan terdiri atas pengujian secara klasifikasi, pengujian secara deteksi dan pengujian latensi. Secara keseluruhan proses pengujian, MobileNetV3Small menduduki peringkat pertama dengan skor pengujian yang baik dan nilai latensi yang rendah diikuti MobileNetV3Large dan MobileNetV2. Rata-rata latensi MobileNetV3Small 18,36% lebih cepat dibanding MobileNetV2, sedangkan MobileNetV3Large 2,10% lebih lambat dibanding MobileNetV2.
The emergence of the third version after the success of the CNN MobileNetV2 architecture in image classification and detection which is referred to as a lightweight and well-accuracy architecture poses new challenges. Will MobileNetV3 be as good as its predecessor or vice versa. MobileNetV3 has two model variants, namely MobileNetV3Small and MobileNetV3Large. The increasing need for a low latency, high accuracy and small size CNN architecture occurs due to problems with limited memory, power and computing speed due to rising user needs. Model creation is carried out by transfer learning features-extraction. The use of transfer learning allows users to turn pretrained models into models that can be adapted to the user's needs. The model was trained by using five data set variants, implementing dropout value variations of 0.2 and 0.5 by using the pretrained architectures of MobileNetV3Large, MobileNetV3Small and MobileNetV2. The creation of the dataset is made with a ratio of 85% training: 15% validation. Training and validation on the MobileNetV3Large architecture has the best performance by ranking first in training and validation, followed by MobileNetV2 and MobileNetV3Small. Testing in this study was carried out on the detection of masked faces. The tests carried out consist of classifying tests, detection testing and latency testing. In the overall testing process, MobileNetV3Small was ranked first with a good test score and a low latency value followed by MobileNetV3Large and MobileNetV2. The average latency of MobileNetV3Small is 18.36% faster than MobileNetV2, while MobileNetV3Large is 2.10% slower than MobileNetV2.
Kata Kunci : MobileNetV3, MobileNetV2, CNN, Deteksi Masker