Laporkan Masalah

Proses Kategorisasi Abstrak Tesis Jurusan Teknik Elektro dan Teknologi Informasi UGM

RIZKA SAFITRI LUTFIYANI, Teguh Bharata Adji, S.T., M.T., M.Eng., Ph.D.; Widyawan, S.T., M. Sc., Ph.D.

2015 | Tesis | S2 Teknik Elektro

Research abstract retrieving in library of is research reports encountered many constraints. The constraints caused research reports not organized and categorized by their knowledge. As a result, abstracts of research reports are difficult to find when their needed. Though abstract is one of text data so abstract difficult to processed with algorithms. Therefore automation research abstract categorization is expected to help solve these problems. This study concentrated to use a text mining statistic, classification, and clustering methods. In this study, the algorithm statistic used is Naive Bayes. In this study, the algorithm's classification used is SVM and MLP whereas the algorithm's clustering used is EM. This research result is Naive Bayes algorithm have higher accuracy than Algorithms MLP, SVM and EM. That indicated from correct rate's Naive Bayes by 90 % and 86,6667 %. MLP, SVM, and EM Algorithm showed lower performance than Naive Bayes Algorithm. MLP acquire correct rate by 80 % and 78,3333% and SVM by 81,6667 % and 76.6667%. While EM Algorithm received incorrect rate of 56,6667 % dan 63,3333 %

Pencarian abstrak laporan penelitian di perpustakaan sering kali menemui banyak kendala. Kendala tersebut terjadi akibat penyimpanan laporan penelitian yang tidak terorganisasi dan dikategorikan berdasarkan kategori bidang ilmu. Akibatnya, abstrak laporan penelitian tersebut sulit ditemukan saat dibutuhkan. Padahal abstrak penelitian merupakan salah satu data teks yang sulit diolah secara algoritme. Oleh karena itu otomatisasi kategorisasi abstrak penelitian diharapkan dapat membantu memecahkan persoalan tersebut. Penelitian ini menekankan pada kategorisasi abstrak penelitian menggunakan metode statistika, klasifikasi, dan kluster. Pada metode statistika, algoritme yang digunakan pada penelitian ini adalah Naive Bayes. Pada metode klasifikasi menggunakan SVM (Support Vector Machine) dan MLP (Multilayer Perceptron) sedangkan pada kluster, algoritme yang digunakan adalah EM (Expectation Maximization). Hasil penelitian ini ialah Algoritme Naive Bayes memiliki akurasi yang lebih tinggi daripada algoritme MLP, SVM, dan EM. Hal ini ditunjukkan correct rate Algoritme Naive Bayes sebesar 90 % dan 86,6667 %. Algoritme MLP, SVM, dan EM menunjukkan akurasi yang lebih rendah dibanding Naive Bayes. MLP memperoleh correct rate sebesar 80 % dan 78,3333 % dan SVM memperoleh 81,6667 % dan 76,6667 %. Sedangkan EM memperoleh incorrect rate sebesar 56.666 % dan 63,3333 % .

Kata Kunci : teks mining, abstrak penelitian, kategorisasi, klasifikasi, clustering

  1. S2-2015-326092-abstract.pdf  
  2. S2-2015-326092-bibliography.pdf  
  3. S2-2015-326092-tableofcontent.pdf  
  4. S2-2015-326092-title.pdf