Laporkan Masalah

Penerapan Bottom-Up Parser, Stemmer, dan Pendeteksi Ambiguitas dalam Sistem Penganalisis Tata Bahasa dalam Kalimat Bahasa Indonesia

HABIB MALIK, Sigit Priyanta S.Si., M.Kom.

2015 | Skripsi | S1 ILMU KOMPUTER

Bahasa Indonesia merupakan bahasa resmi negara Indonesia yang penggunaannya telah diatur dalam Undang-Undang Nomor 24 tahun 2009. Bahasa Indonesia wajib dipakai untuk, antara lain, penulisan karya ilmiah serta publikasi informasi melalui media. Namun, kesalahan penggunaan tata bahasa Indonesia masih banyak ditemukan dalam berbagai penulisan resmi. Penelitian ini akan menggunakan tiga teknik NLP untuk membangun sebuah sistem penganalisis tata bahasa. Teknik tersebut adalah stemming, pendeteksi ambiguitas kelas kata (sintaksis), dan parsing. Teknik stemming dan pendeteksi ambiguitas akan digunakan untuk membangun sistem POS-Tagging (penentuan kelas kata) berbasis aturan dan kamus, sedangkan teknik parsing digunakan untuk menguji keakuratan sintaksis dari suatu kalimat setelah kelaskelas katanya diketahui. Setelah itu, keakuratan sistem akan diuji untuk menganalisis ketepatan data teks dari media berita daring dan abstrak penelitian ilmiah. Dari hasil pengujian, akurasi sistem secara keseluruhan mencapai 96,17%, dengan ketepatan pendeteksian kesalahan sebesar 98,38% dan ketepatan pendeteksian kalimat tepat sebesar 93,61%

Indonesian is the official language of Indonesia, whose utilization has been regulated by the Law No.24 of 2009. The Indonesian Language must be utilized for, among others, scientific papers and media publication. However, grammatical mistakes are still often seen in various formal writings. This research will employ three NLP techniques to develop a grammar analyzer system. The techniques are stemming, part of speech ambiguity detection, and parsing. Stemming and ambiguity detection will be employed to develop a dictionary- and rule-based POS-Tagging system, while parsing technique will be employed to determine syntactic accuracy of the sentences after the parts of speeches have been known. Subsequently, the system's accuracy will be tested by analyzing the correctness of text data from online news media and scientific paper abstracts. Based on the test result, the system, which was developed by combining parsing, stemming, and ambiguity detection techniques, could achieve an overall accuracy of 96.17%; specifically, it could detect grammatical mistakes in sentences with an accuracy of 98.38% and parse correct sentences with an accuracy of 93.61%.

Kata Kunci : NLP, Indonesian grammar, parsing, stemming, ambiguity detection

  1. S1-2015-297422-abstract.pdf  
  2. S1-2015-297422-bibliography.pdf  
  3. S1-2015-297422-tableofcontent.pdf  
  4. S1-2015-297422-title.pdf