Laporkan Masalah

PART OF SPEECH TAGGING TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE HIDDEN MARKOV MODEL DAN RULE BASED

Kathryn Widhiyanti, S.Kom, Drs.Agus Harjoko.M.Sc, Ph.D.,

2012 | Tesis | S2 Ilmu Komputer

Penelitian ini melakukan sebuah proses Part of Speech Tagging (POS-Tangging) untuk teks berbahasa Indonesia yang mendukung proses lain dalam digitalisasi bahasa alami misalnya parsing (pengurai) teks bahasa Indonesia. Part of Speech Tagging (POS-Tagging) adalah suatu proses memberikan label kelas kata secara otomatis pada suatu kata dalam kalimat (Jurafsky dan Martin, 2000). Masalah yang muncul adalah bagaimana cara mendapatkan pelabelan kelas kata yang tepat dalam konteks kalimat. Pada penelitian ini penulis mencoba suatu metode yaitu menggabungkan antara Hidden Markov Model dan Rule Based dengan harapan bisa menghasilkan pelabelan dengan tingkat akurasi yang lebih baik dari pelabelan kelas kata yang hanya menggunakan metode Hidden Markov Model saja. Hasil pelabelan yang diperoleh dari proses Hidden Markov Model akan diperhalus hasilnya dengan melakukan pengecekan dengan rule yang sudah disususn secara otomatis dari corpus yang digunakan. dari uji coba yang dilakukan terhadap beberapa dokumen POS-Tangging dengan metode Hidden Markov Model bisa memberikan tingkat keakuratan tertinggi 100% untuk teks yang sama persis dengan teks yang ada di corpus. Pada uji coba terhadap teks yang tidak sama dengan teks yang ada di corpus acuan tetapi kata-kata yang digunakan terdapat di dalam corpus, sistem ini memiliki tingkat keakuratan tertinggi sebesar 92,2%.

-

Kata Kunci : Part of Speech Tagging, Hidden Markov Model, Rule Based, NLP


    Tidak tersedia file untuk ditampilkan ke publik.