Laporkan Masalah

DETEKSI TEKS DARI CITRA E-KTP BERBASIS MAXIMALLY STABLE EXTREMAL REGIONS

ANGGA MAULANA PURBA, Drs. Agus Harjoko, M.Sc, Ph.D;Moh Edi Wibowo, Ph.D.

2018 | Tesis | MAGISTER ILMU KOMPUTER

Citra hasil scan atau foto E-KTP seringkali dikumpulkan oleh instansi pemerintah atau swasta sebagai alat verifikasi. Informasi pada foto tersebut dapat dibaca menggunakan software OCR. Variasi dalam pengambilan foto E-KTP menyebabkan orientasi yang beragam, selain itu juga muncul gambar background sehingga berpengaruh pada akurasi OCR. Oleh karena itu segmentasi daerah teks perlu dilakukan secara akurat. Namun sayangnya metode berbasis proyeksi piksel pada penelitian sebelumnya belum dapat memisahkan daerah teks secara akurat. Selain itu, perbaikan orientasi dengan metode garis acuan berbasis Hough Transform memerlukan komputasi yang tinggi dan sering memprediksi garis acuan dari noise. Pendekatan yang diajukan penelitian ini adalah menggunakan Progressive Probabilistic Hough Transform sebagai pengganti Hough Transform untuk perbaikan orientasi. Kemudian deteksi daerah teks dengan metode Maximally Stable Extremal Regions. Hasil perbaikan orientasi mencapai rata-rata selisih error 0.377o dan deteksi teks memperoleh akurasi 84.49% pada kondisi terbaik.

Most of Indonesian organizations either it is government or non government sometime required their member to provide their identity card (E-KTP) as legal document collection in their database. This collection of image usually being used as manual verification method. These document images acquired by each person with their own device, there are variations of angles they are used to acquire the image. This situation created problems in text recognition by OCR softwares especially in text detection part, orientation and noise will affect their accuracy. These cases making the text detection more complex and cannot be solved by simple vertical projection profile of black pixels. This research proposed a method to improve text detection in identity document by fixing the orientation first, then using MSER regions to form text region. We fix the orientation using the line that made by Progressive Probabilistic Hough Transform. Then we used MSER to obtain all candidate regions. The orientation fixing strategy reach average of margin error 0.377o (in 360o system) and the text detection method reach 84.49% accuracy in best condition.

Kata Kunci : MSER, Hough Transform, Progressive Probabilistic Hough Transform, RLSA, text detection

  1. S2-2018-403663-abstract.pdf  
  2. S2-2018-403663-bibliography.pdf  
  3. S2-2018-403663-tableofcontent.pdf  
  4. S2-2018-403663-title.pdf