Laporkan Masalah

Author Obfuscation terhadap Artikel Opini Menggunakan Algoritma Genetika

RAYHAN NAUFAL RAMADHAN, Aina Musdholifah, S.Kom., M.Kom. Ph.D.; Yunita Sari, S.Kom., M.Sc., Ph.D.

2021 | Skripsi | S1 ILMU KOMPUTER

Authorship attribution adalah metode untuk mengidentifikasi penulis suatu teks dari sekelompok penulis potensial. Model tersebut dapat digunakan untuk memecahkan anonimitas penulis yang tidak diketahui. Hal tersebut mengancam kebebasan berpendapat dan privasi seseorang, terutama orang yang ingin menulis secara anonim. Untuk melawan ancaman tersebut, metode author obfuscation diusulkan untuk memodifikasi suatu teks supaya penulisnya sulit diidentifikasi tanpa mengaburkan topik utamanya. Pada penelitian ini, model author obfuscation berbasis algoritma genetika dibuat untuk memodifikasi artikel opini berbahasa Indonesia supaya penulisnya tidak teridentifikasi oleh model authorship attribution dengan tetap menjaga semantik artikel yang dimodifikasi sama dengan aslinya. Model tersebut awalnya membuat kumpulan artikel kandidat yang akan menggantikan artikel asli. Kemudian, kumpulan artikel tersebut secara iteratif diseleksi untuk diubah beberapa kata di dalamnya menggunakan teknik crossover dan mutasi yang dipandu oleh fungsi fitness yang melibatkan probabilitas identifikasi dan kemiripan dengan artikel asli. Proses seleksi hingga mutasi terus dilakukan sampai ada artikel kandidat yang penulisnya tidak teridentifikasi oleh model authorship attribution atau jumlah maksimal iterasi telah tercapai. Model tersebut dievaluasi berdasarkan parameter safety, soundness, dan sensibleness. Model tersebut memiliki safety yang baik karena dapat menurunkan akurasi model authorship attribution yang diberikan sebesar 0,3694, tetapi turun menjadi 0,1097 ketika diuji pada model yang berbeda dari yang dilibatkan pada fungsi fitness. Soundness model tersebut juga cukup baik karena kemiripan artikel yang dimodifikasi dengan aslinya mencapai 0,9601. Sensibleness model dievaluasi secara manual dan diperoleh skor 2,164 dari skala 0 sampai 4 yang menunjukkan bahwa tata bahasa sebagian artikel dapat diterima, tetapi tak sedikit juga yang tidak masuk akal.

Authorship attribution is a method for identifying the author of a text from a group of potential authors and can solve the anonymity of unknown authors. Such method threatens privacy, especially for those who wish to write anonymously. To address this issue, author obfuscation is proposed to modify a text so that its author is hard to be identified. In this research, a genetic algorithm-based author obfuscation model was created to modify Indonesian opinion articles to avoid identification from authorship attribution while keeping the semantics of the modified articles the same as their originals. The model initially generates a collection of candidate articles that will replace the original articles. Then, the candidates are iteratively selected to convert some of the words in it using a crossover and mutation technique guided by a fitness function that involves the probability of identification and similarity to the original article. The selection until mutation proccess continues until there is a candidate article whose authors are not identified by the authorship attribution model or the maximum number of iterations has been reached. The model is evaluated based on safety, soundness, and sensibleness parameter. The model has good safety since it can reduce the given authorship attribution model's accuracy by 0,3694 but drops to 0,1079 when tested on different models. Its soundness is quite good since the similarity of the modified to the original articles reaches 0,9601. The model obtained a score of 2,164 on a scale of 0 to 4 in terms of sensibleness which indicates that some articles are acceptable in terms of grammar, but there are some other articles that make no sense.

Kata Kunci : author obfuscation, authorship attribution, algoritma genetika

  1. S1-2021-412651-abstract.pdf  
  2. S1-2021-412651-bibliography.pdf  
  3. S1-2021-412651-tableofcontent.pdf  
  4. S1-2021-412651-title.pdf