IMPLEMENTASI PART-OF-SPEECH TAGGER DENGAN PENDEKATAN SUPERVISED UNTUK BAHASA INDONESIA; IMPLEMENTATION OF PART-OF-SPEECH TAGGER USING SUPERVISED MODEL FOR INDONESIAN LANGUAGE
DYAH EKOWATI INDRIYANI, Sigit Priyanta
2011 | Skripsi | PROGRAM STUDI S1 ILMU KOMPUTERBahasa Indonesia adalah bahasa yang memiliki tata bahasa baku sebagai acuan. Penggunaan bahasa baku dalam kalimat Bahasa Indonesia sering kali digunakan pada tulisan yang bersifat formal, seperti artikel, karya tulis ilmiah, dll. Selain itu struktur kalimat sangat diperlukan untuk pengembangan pemrosesan sistem bahasa alami khususnya untuk bahasa Indonesia dan tata bahasa baku pada Bahasa Indonesia. Oleh karena itu, penelitian ini dibuat dengan tujuan untuk menganalisis struktur kalimat Bahasa Indonesia menggunakan part of speech tagger. Sistem dilengkapi dengan analisis kelas kata, analisis frasa dan analisis struktur kalimat. Sistem ini dibuat menggunakan implementasi part of speech tagger dengan pendekatan supervised yang menggunakan leksikon sebagai dasar penentuan kelas kata pada kata dasar. Sedangkan penentuan kelas kata imbuhan dilakukan menggunakan proses stemming dengan dasar struktur imbuhan menggunakan metode dengan urutan langkah memisahkan prefix-sufix-prefix dan jika belum ketemu dilanjutkan dengan suffix-prefix, dan menggunakan pola sebagai dasar untuk menentukan frasa dan fungsi gramatikal. Penelitian dilakukan berdasarkan aturan-aturan sintaks atau fungsi gramatikal dan dasar pola yang terdapat dalam tata bahasa baku Bahasa Indonesia. Uji coba dilakukan dengan dua cara yaitu pengujian terhadap 17 file dokumen yang bersumber dari media internet kompas.com dan beberapa kata atau kalimat yang digunakan sesuai dengan kebutuhan pengujian pada setiap proses analisis. Hasil uji coba keseluruhan terhadap 17 dokumen mendapatkan hasil vi persentase keberhasilan yang cukup baik. Pada penentuan kelas kata dengan persentase keberhasilan 99,01%, sedangkan pada penentuan frasa sebanyak 89.47% dan penentuan fungsi gramatikal sebanyak 65,00%.
Kata Kunci : Part-Of-Speech Tagger ; Supervised ; Stemming; Tata Bahasa Baku Bahasa Indonesia