PENERAPAN BOTTOM-UP PARSER, STEMMER, DAN PENDETEKSI AMBIGUITAS KELAS KATA DALAM SISTEM PENGANALISIS TATA BAHASA BAKU DALAM KALIMAT BAHASA INDONESIA; IMPLEMENTATION OF BOTTOM-UP PARSER, STEMMER, AND PART OF SPEECH AMBIGUITY DETECTOR FOR FORMAL GRAMMAR ANALYZER SYSTEM FOR INDONESIAN SENTENCES
Habib Malik, Sigit
2015 | Skripsi | PROGRAM STUDI ILMU KOMPUTERBahasa Indonesia merupakan bahasa resmi negara Indonesia yang penggunaannya telah diatur dalam Undang-Undang Nomor 24 tahun 2009. Bahasa Indonesia wajib dipakai untuk, antara lain, penulisan karya ilmiah serta publikasi informasi melalui media. Namun, kesalahan penggunaan tata bahasa Indonesia masih banyak ditemukan dalam berbagai penulisan resmi. Penelitian ini akan menggunakan tiga teknik NLP untuk membangun sebuah sistem penganalisis tata bahasa. Teknik tersebut adalah stemming, pendeteksi ambiguitas kelas kata (sintaksis), dan parsing. Teknik stemming dan pendeteksi ambiguitas akan digunakan untuk membangun sistem POS-Tagging (penentuan kelas kata) berbasis aturan dan kamus, sedangkan teknik parsing digunakan untuk menguji keakuratan sintaksis dari suatu kalimat setelah kelaskelas katanya diketahui. Setelah itu, keakuratan sistem akan diuji untuk menganalisis ketepatan data teks dari media berita daring dan abstrak penelitian ilmiah. Dari hasil pengujian, akurasi sistem secara keseluruhan mencapai 96,17%, dengan ketepatan pendeteksian kesalahan sebesar 98,38% dan ketepatan pendeteksian kalimat tepat sebesar 93,61%. Keyword: NLP, tata bahasa baku bahasa Indonesia
Kata Kunci : NLP, tata bahasa baku bahasa Indonesia, bottom-up parsing, stemming, pendeteksi ambiguitas.