Comparison of K-Nearest Neighbor, Naive Bayes and Support Vector Machine for Character Recognition in Mobile Application

Penulis

Christina C L

Pembimbing: MHD. Reza M.I. Pulungan, S.Si., M.Sc., Dr.Ing.


ABSTRACT: Due to its variations of techniques and applications, optical character recognition is still the most popular research in digital image processing. As the increasing number of mobile devices and it becomes the future operating system, this application is built on mobile based. With this application, user can easily recognized the characters by capturing image using mobile phone camera. Open Computer Vision library is used to build the application as this library is the most popular one. Besides, machine learning algorithms are used for the recognition process in the application. There are k-nearest neighbor, naive Bayes classifier and support vector machine algorithms which are used in this research. The performances of these three algorithms are calculated including recognition accuracy, memory usage and time consumed. From testing process, k-nearest neighbor show the best performance. It has the highest character recognition accuracy at 94% and the least average memory usage and time consumed in the training and prediction process. The result shows that it consumed average memory of 650300.7 KB in training and 650409.1 KB in the prediction and consumed average time of 128.5 microseconds in training and 520.6 microseconds in prediction.

INTISARI: Dikarenakan adanya variasi teknik dan aplikasi, pengenalan karakter optis masih menjadi topik penelitian yang populer dalam bidang pengolahan citra digital. Dengan bertambahnya jumlah piranti bergerak yang menjadi sistem operasi masa depan, aplikasi ini dibuat berbasis piranti bergerak tersebut. Dengan adanya aplikasi ini, pengguna dapat dengan mudah mengenali karakter hanya dengan mengambil gambar melalui kamera telepon seluler. Open Computer Vision Library digunakan dalam membangun aplikasi ini karena library ini merupakan yang terpopuler. Selain itu, algoritma machine learning juga digunakan dalam aplikasi ini pada proses pengenalan karaker. Beberapa algoritma machine learning yang digunakan dalam penelitian ini antara lain, k-nearest neighbor, naïve Bayes classifier dan support vector machine. Performa dari ketiga algoritma ini yang terdiri dari akurasi pengenalan karakter, memori yang digunakan dan waktu yang digunakan akan dibandingkan. Dalam proses pengujian, algoritma k-nearest neighbor menunjukkan performa terbaik. Algoritma ini memiliki akurasi pengenalan karakter paling tinggi sebesar 94% dan menggunakan memori dan waktu paling sedikit dalam proses pelatihan dan proses prediksi. Hasil pengujian menunjukkan memori rata-rata yang digunakan sebesar 650300.7 KB pada proses pelatihan dan 650409.1 KB pada proses prediksi dan waktu rata â rata yang digunakan sebesar 128.5 mikrodetik pada proses pelatihan dan 520.6 mikrodetik pada proses prediksi.

Kata kunci mobile application, character recognition, OpenCV library, machine learning, svm, nbc, knn
Program Studi S1 ILMU KOMPUTER UGM
No Inventaris
Deskripsi
Bahasa Indonesia
Jenis Skripsi
Penerbit [Yogyakarta] : Universitas Gadjah Mada, 2016
Lokasi Perpustakaan Pusat UGM
File Tulisan Lengkap dapat Dibaca di Ruang Tesis/Disertasi
  • Anda dapat mengecek ketersediaan versi cetak dari penelitian ini melalui petugas kami dengan mencatat nomor inventaris di atas (apabila ada)
  • Ketentuan Layanan:
    1. Pemustaka diperkenankan mengkopi cover, abstrak, daftar isi, bab pendahuluan, bab penutup/ kesimpulan, daftar pusatak
    2. Tidak diperbolehkan mengkopi Bab Tinjauan Pustaka, Bab Pembahasan dan Lampiran (data perusahaan/ lembaga tempat penelitian)
    3. Mengisi surat pernyataan, menyertakakan FC kartu identitas yang berlaku

<< kembali