Implementasi Algoritma TF-IDF dan Cosine Similarity untuk Pengecekan Kemiripan Jawaban Ujian pada Layanan Web
MUHAMMAD NOOR FARHAN MAULANA, Lukito Edi Nugroho, Ir., M.Sc., Ph.D
2021 | Skripsi | S1 TEKNOLOGI INFORMASIUjian adalah salah satu kegiatan atau agenda yang digunakan untuk mengevaluasi tingkat kompetensi atau pemahaman dari siswa atau mahasiswa pada suatu subjek tertentu. Salah satu bentuk dari ujian tersebut adalah ujian berbentuk esai. Dengan terjadinya kejadian akhir-akhir ini, yang menyebabkan proses pembelajaran berlangsung secara daring, akan relative lebih sulit untuk melakukan pengawasan terhadap pelaksanaan ujian tersebut, akibatnya risiko untuk terjadinya penjiplakan atau mencontek relatif besar. Saat ini sudah banyak algortima yang telah dikembangkan untuk dapat menyelesaikan permasalahan tersebut, namun diperlukan juga sebuah lingkungan atau sistem yang dapat mendukung algoritma-algoritma tersebut untuk dapat menyelesaikan permasalahan ini. Sistem ini mengimplementasikan beberapa algoritma untuk melakukan pengecekan terhadap kemiripan antar jawaban ujian tersebut sehingga dapat diketahui mana jawaban yang didapat dari hasil mencontek dan mana yang benar-benar unik. Karena sistem harus dapat memproses dokumen dengan jumlah yang cukup banyak dalam waktu yang relatif pendek, maka diperlukan performa yang tinggi juga. Selain itu, hasil yang didapat dari sistem juga harus mudah dibaca atau diidentifikasi oleh pengguna.
An Exam is one of the core agenda used to evaluate the competence or understanding from students of certain subject. One form of an exam is essay. Due to the recent events, which makes the teaching and learning process have to be done online, it will be relatively difficult to supervise exams. As a result the risk of cheating is far greater than ever. Right now there are many algorithms that have been developed to solve such problem, however an environment or a system is also needed to support those algorithms to solve the problem This system implements several algorithms to check the similarity between exam answers so that it is easier to distinguish which answers are the result of cheating and which ones are unique. Because the system needs to be able to process bulks of documents at once, its performance needs to be fast. The result given by the system also needs to be comprehensible for the users to read or identify as well.
Kata Kunci : Cek Kemiripan, Plagiarisme, Cosine Similarity, TF-IDF