EKSTRAKSI KATA KUNCI BERDASAR FREKUENSI DAN LOKASI DENGAN PERLUASAN N-GRAM PADA DOKUMEN TUNGGAL
DZIKRI RAHADIAN FUDHOLI, Drs. Sri Mulyana, M.Kom
2014 | Skripsi | S1 ILMU KOMPUTERMemahami suatu isi teks diperlukan secara cepat dan tepat dimana keberadaan kata kunci berperan sebagai perwakilan makna dari teks yang panjang. Mendapatkan kata kunci cukup membutuhkan waktu dan bersifat subyektif jika dilakukan manusia, namun jika dilakukan dengan komputer maka akan cepat dan obyektif. Untuk melakukan ekstraksi kata kunci, sebuah komputer memerlukan metode yang bisa diaplikasikan secara umum ke seluruh macam teks. Metode frekuensi dan lokasi adalah satu dari sekian banyak metode yang memiliki pengaruh besar untuk ekstraksi kata kunci. Kata kunci itu sendiri seharusnya tidak hanya terdiri dari 1 kata dimana metode yang sering digunakan hanya mendapatkan kata kunci dengan 1 kata. Perluasan kata kunci dengan n- gram memberikan kesempatan untuk kata kunci dengan 2 kata atau lebih bisa terpilih menjadi kata kunci. Dengan menggunakan metode frekuensi dan lokasi serta perluasan n-gram yang diaplikasikan ke dokumen tunggal ini bisa mendapatkan kata kunci yang mewakili isi teks. Dari pengujian diperoleh hasil bahwa metode frekuensi dan lokasi mendapatkan kata kunci dari teks tunggal dengan akurasi 5.5%. Ketika ditambahkan perluasan n-gram akurasi meningkat 10% menjadi 15.5%.
Understanding a text need to be fast and precise where keywords helps to represent the meaning of a long text. Obtaining keywords needs a lot of time and subjective if done by human, however if it done by computer it could be fast and objective. Computer needs methods to do keyword extraction so it could apply to many kind of document. The frequency and location method is one from many that giving the most influence in extracting keywords. The keywords itself should not be only 1 word but also contain 2 words or more. Therefore n-gram expansion gives the 2 words or more the chance to be choosen as a keyword. Moreover, a method using frequency and location with n-gram expansion will obtains keywords that represent the text from a single document. The test result shows that frequency and location method successfully extracts keywords from single document with 5.5% accuracy. In addition of n- gram expansion the accuracy rises by 10% to 15.5%.
Kata Kunci : ekstraksi, kata kunci, frekuensi, lokasi, perluasan n-gram