Laporkan Masalah

OPTIMISASI HYPERPARAMETER YOLO UNTUK PURWARUPA APLIKASI EKSTRAKSI JUDUL DAN ISI PADA SURAT KABAR DI MONUMEN PERS NASIONAL

HENDARTO KURNIAWAN, Dinar Nugroho Pratomo, S.Kom., M.IM., M.Cs.

2025 | Tugas Akhir | D4 Teknologi Perangkat Lunak

Monumen Pers Nasional (MPN) merupakan museum yang menyimpan berbagai koleksi serta artefak yang berkaitan tentang pers. MPN menyediakan berbagai koleksi, artefak sejarah dan informasi yang digunakan untuk pembelajaran diwujudkan melalui Sistem Informasi Database Koleksi (SIDAK). SIDAK menyediakan informasi terkait koleksi surat kabar. Tantangan sistem adalah keakuratan ekstraksi isi dari surat kabar yang disebabkan oleh tata letak pada surat kabar yang bervariasi. Penelitian menawarkan solusi melalui teknologi machine learning deteksi objek, dalam hal melakukan deteksi judul dan isi pada surat kabar sehingga dapat dilakukan ekstraksi yang lebih akurat. Deteksi dilakukan menggunakan basis YOLOv8 yang dilatih menggunakan data surat kabar milik MPN, model kemudian digunakan untuk melakukan tugas deteksi judul dan isi pada surat kabar. Model ini memerlukan optimasi berupa penentuan hyperparameter yang paling baik, metode yang dilakukan untuk menentukannya yaitu dengan cara membandingkan performa dari hyperparameter yaitu Stochastic Gradient Descent (SGD), Adaptive Moment Estimation (Adam) dan Adam with Weight Decay (AdamW). Pelatihan dalam 1000 epoch, menggunakan learning rate decay  yaitu cosine decay dengan nilai awal yaitu 0,1 dan nilai akhir 0,00001. Hasil analisis menunjukkan optimizer AdamW mengungguli SGD dan Adam dalam nilai f1-score dan mAP secara keseluruhan. Model dengan hasil paling unggul diimplementasikan pada sebuah purwarupa aplikasi berbasis website, hasil deteksi dari model digunakan sebagai acuan untuk melakukan ekstraksi teks menggunakan OCR pada sistem. Purwarupa diuji menggunakan User Acceptance Test acuan Skala Likert dan mendapatkan nilai 84,8% kategori sangat baik. Hasil penelitian diharapkan dapat membantu dalam melakukan ekstraksi informasi judul dan isi pada surat kabar di MPN.

The National Press Monument a.k.a MPN is museums that stores various collections and artifacts related to the press. MPN provides various collections, historical artifacts and information used for learning through  the Sistem Informasi Database Koleksi a.k.a SIDAK. SIDAK provides information related to MPN's collections, one of it, is a newspaper collection. The system encountered challenges in terms of accuracy in extracting content from newspapers due to the varied layout. The research offers a solution through object detection machine learning technology, in terms of detecting the title and content of newspapers so more accurate extraction can be carried out. Detection will be carried out using a YOLOv8, trained using MPN's newspaper data. Model will get optimization, the method used is determine by determine the optimizers. The optimizers used are Stochastic Gradient Descent (SGD), Adaptive Moment Estimation (Adam) and Adam with Weight Decay (AdamW). 1000 epochs will be used, cosine decay as learning rate decay with an initial value of 0,1 and a final value of 0,00001. The results show that  the AdamW optimizer outperforms SGD and Adam in the overall f1-score and mAP. The model with the best results implemented on a website-based application prototype, the detection results from the model are used as a reference to extracting text using OCR on the system. The prototype was tested using the User Acceptance Test and got very good performance with 84,8% score. The results of are expected to help in extracting information on the title and content of newspapers in MPN.

Kata Kunci : object detection, news paper, OCR, YOLO, website

  1. D4-2025-460932-abstract.pdf  
  2. D4-2025-460932-bibliography.pdf  
  3. D4-2025-460932-tableofcontent.pdf  
  4. D4-2025-460932-title.pdf