PENGEMBANGAN RULE BASED POS TAGGER SYSTEM UNTUK BAHASA INDONESIA; DEVELOPMENT OF RULE BASED POS TAGGER SYSTEM FOR INDONESIAN LANGUAGE
RINA MARYANI, Sigit Priyanta
2011 | Skripsi | PROGRAM STUDI ILMU KOMPUTERBahasa Indonesia memiliki tata bahasa sebagai acuannya dan struktur kalimat yang terdiri dari lima kelas kata: kata benda (NN), kata kerja (VB), kata sifat (Adj), kata keterangan (Adv), dan beberapa jenis kata tugas. Dalam mendapatkan keterangan jenis kelas kata diperlukan masukan berupa kalimat/paragraf/dokumen yang diakses oleh sistem lalu menghasilkan penandaan kata atau dalam bahasa asing Part Of Speech (POS) Tagger. Masih sedikitnya pengembangan aplikasi POS Tagger untuk bahasa Indonesia yang sesuai dengan aturan tata bahasa, oleh karena itu perlu dibuat rule based POS tagger system untuk bahasa Indonesia. Pengembangan Rule Based POS Tagger System untuk bahasa Indonesia menggunakan metode unsupervised namun untuk identifikasi kata dasar sesuai kamus/lexicon. Sistem yang akan dibuat menggunakan bahasa pemograman PHP dan database MySQL. Penandaan kelas kata mengacu pada jenis kelas kata sesuai dengan tata bahasa baku bahasa Indonesia. Dari data-data yang diperoleh selanjutnya dilakukan analisis, perancangan, implementasi, dan pengujian sistem. Hasil dari penelitian ini adalah sebuah aplikasi Rule Based POS Tagger System untuk bahasa Indonesia yang memberikan penandaan kata dan kelas kata dari masukan berupa kalimat/paragraf/dokumen, sistem juga menyediakan penjelasan kata jika ditemukan kata ambigu dan proses pencarian kata dasar dari kata berimbuhan. Sistem ini telah diujikan untuk teks bahasa Indonesia pada sebuah dokumen, 3 paragraf, dan 20 kalimat yang terdiri dari: 10 pengujian kata berimbuhan, 5 pengujian kata ulang, dan 5 pengujian kata ambigu dengan tingkat prosentase akurasinya mencapai 93%.
Kata Kunci : Rule Based POS Tagger, Unsupervised, Stemming, Tata Bahasa Baku Bahasa Indonesia