PENDEKATAN DETEKSI PLAGIARISME BERBASIS KUTIPAN DAN ALGORITME KANG UNTUK TEKS BERBAHASA INDONESIA
UMAR TAUFIQ, Khabib Mustofa, S.Si., M.Kom., Dr. techn.
2015 | Tesis | S2 Ilmu KomputerPlagiarisme merupakan salah satu masalah yang harus ditanggulangi dalam dunia akademik. Tindakan plagiat dapat mencemarkan integritas akademik karena plagiarisme di dunia pendidikan sangat erat kaitannya dengan integritas civitas akademika. Oleh karena itu, perlu dikembangkan mekanisme untuk membantu mendeteksi plagiarisme pada karya ilmiah. Pada umumnya, sistem deteksi plagiarisme yang ada saat ini menggunakan perbandingan teks antar dokumen dan mengabaikan data kutipan pada dokumen tersebut. Sistem Deteksi Plagiarisme Berbasis Kutipan (Citation-based Plagiarism Detection) merupakan pendekatan baru dalam sistem deteksi plagiarisme. pendekatan ini menganalisis kutipan sehingga memungkinkan duplikat dan plagiat terdeteksi bahkan seandainya dokumen telah diparafrasekan atau diterjemahkan, karena posisi kutipan relatif tetap sama. Algoritme Kang merupakan salah satu metode untuk membantu mendeteksi dugaan plagiarisme berbasis perbandingan teks. Metode ini memiliki kemampuan untuk mendeteksi prosentase kemiripan suatu dokumen beserta tipe plagiarisme yang mungkin dilakukan dengan jalan mengecek kalimat per kalimat suatu dokumen dibandingkan dengan kalimat per kalimat dokumen yang lain. Pendekatan antara konsep Citation-based Plagiarism Detection (CbPD) dan algoritme Kang dapat menjadi salah satu solusi untuk meningkatkan efisiensi dalam sistem deteksi plagiarisme tanpa mengorbankan akurasi. Untuk melakukan pendekatan konsep CbPD dan algoritme Kang (CbPD-Kang), diperlukan penyesuaian-penyesuaian dalam penerapannya di dalam sistem deteksi plagiarisme. Beberapa mekanisme yang diperlukan dalam pendekatan tersebut adalah deteksi kesamaan daftar pustaka yang ditulis dalam format yang berbeda dan penentuan pola kutipan dokumen. Kata kunci: plagiarisme, sistem deteksi plagiarisme berbasis kutipan, algoritme Kang.
Plagiarism is one of the issues that must be addressed in the academic world. Plagiarism can pollute the academic integrity because of plagiarism in education is closely related to the integrity of the academic community. Therefore, it is necessary to develop mechanisms to help detect plagiarism in scientific work. In general, plagiarism detection system available today using text comparison between documents and ignore the citation data in the document. Citation-based Plagiarism Detection is a new approach in plagiarism detection system. This approach thus allows duplicate analyzes citations and plagiarism is detected even if the document has been paraphrased or translated, because the relative position remains the same quote. Kang algorithm is one method to help detect plagiarism allegations text-based comparison. This method has the ability to detect the percentage of similarity of a document along with the type of plagiarism that may be done by way of checking a document sentence by sentence sentence by sentence compared with other documents. Approach between concepts Citation-based Plagiarism Detection (CbPD) and Kang algorithms can be one solution to increase efficiency in plagiarism detection system without sacrificing accuracy. To approach concepts and algorithms CbPD Kang (CbPD-Kang), the necessary adjustments in its application in plagiarism detection system. Some mechanism is needed in the approach is the detection of similarity bibliography written in different formats and determining the pattern of citations document. Keywords: plagiarism, citation based plagiarism detection, Kang algorithm.
Kata Kunci : plagiarism, citation based plagiarism detection, Kang algorithm.