Laporkan Masalah

Sistem Informasi Persuratan Digital Berbasis Web dengan Teknologi OCR (Optical Character Recognition) untuk Pengarsipan Dokumen

Luthfia Nisa Azzahra, Dinar Nugroho P., S.Kom., M.IM., M.Cs.

2025 | Tugas Akhir | D4 Teknologi Perangkat Lunak

Sistem penyimpanan dan pencarian dokumen digital yang efisien hingga saat ini masih menjadi permasalahan serius, khususnya dalam mengelola volume surat yang terus bertambah. Proses pengajuan surat yang kurang terstruktur juga berpotensi menyebabkan kesalahan dan inkosistensi. Salah satu instansi yang mengalami kendala tersebut adalah Bagian Akademik Departemen Teknik Elektro dan Informatika (DTEDI) UGM. Oleh sebab itu, dikembangkan sebuah sistem bernama SuratTEDI, yang memiliki fitur penyimpanan, pembuatan, dan pengajuan surat. Teknologi OCR (Optical Character Recognition) digunakan untuk mengatasi kendala pencarian surat dan memperkuat fitur penyimpanan. Penelitian ini mengembangkan sistem manajemen surat digital yang mengintegrasikan framework Laravel dengan Tesseract OCR melalui wrapper PyTesseract berbasis Python. Integrasi ini memungkinkan ekstraksi otomatis bagian-bagian surat, memfasilitasi pencarian, dan manajemen surat digital dengan lebih mudah. Pengujian akurasi OCR pada 20 dokumen (Tugas, Keterangan, Permohonan, Tidak Terklasifikasi) menunjukkan Character Error Rate (CER) sebesar 5,71?n Word Error Rate (WER) sebesar 9,59%. Persentase tersebut membuktikan sistem mampu mengonversi dokumen berkualitas baik. Dengan User Acceptance Testing (UAT) mencapai 94,29%, SuratTEDI terbukti diterima dan layak digunakan oleh staf Bidang Akademik maupun mahasiswa DTEDI UGM. Diharapkan sistem ini dapat menjadi solusi efektif yang meningkatkan efisiensi administrasi DTEDI. 

Efficient digital document storage and retrieval systems remain a significant challenge, especially with the continuously increasing volume of correspondence. Unstructured letter submission processes also carry the risk of errors and inconsistencies. The Academic Section of the Department of Electrical and Information Engineering (DTEDI) at UGM is one institution experiencing these obstacles. To address these issues, a system named SuratTEDI was developed, featuring letter storage, creation, and submission functionalities. Optical Character Recognition (OCR) technology is employed to overcome letter retrieval difficulties and enhance the storage feature. This research involved developing a digital letter management system that integrates the Laravel framework with Tesseract OCR via a Python-based PyTesseract wrapper. This integration enables the automatic extraction of letter components, facilitating easier digital letter search and management. Accuracy testing of the OCR on 20 documents (Tasks, Statements, Applications, Unclassified) revealed a Character Error Rate (CER) of 5.71% and a Word Error Rate (WER) of 9.59%. These percentages demonstrate the system's capability to accurately convert good-quality documents. With a User Acceptance Testing (UAT) score of 94.29%, SuratTEDI is proven to be accepted and suitable for use by both the Academic Staff and students of DTEDI UGM. It is anticipated that this system will serve as an effective solution, enhancing the administrative efficiency of DTEDI. 

Kata Kunci : Persuratan, OCR, Laravel, Python, PyTesseract

  1. D4-2025-474456-abstract.pdf  
  2. D4-2025-474456-bibliography.pdf  
  3. D4-2025-474456-tableofcontent.pdf  
  4. D4-2025-474456-title.pdf