IMPLEMENTASI ALGORITMA WINNOWING UNTUK DETEKSI KEMIRIPAN TEXT

ABSTRAK: Praktek dokumen plagiarisme sering diterapkan oleh akademisi di tingkat sekolah dan universitas yang tidak mencerminkan sikap seorang yang sangat kreatif dan dididik sebagai intelektual. Kadang-kadang tindakan plagiarisme telah dimodifikasi dengan mengganti kata-kata yang mengandung sinonim, dengan maksud agar terlihat berbeda dari artikel asli.
Sistem deteksi duplikasi menggunakan algoritma menampi yang outputnya berupa seperangkat nilai-nilai hash sebagai fingerprinting dokumen yang diperoleh melalui metode k-gram. Masukan dari proses dokumen fingerprinting adalah file teks. Kemudian outputnya akan menjadi satu set nilai hash, yang disebut sidik jari. Fingerprint inilah yang akan menjadi dasar perbandingan antara file teks yang telah dimasukkan. Adanya pengakuan konsep sinonim dimaksudkan untuk dapat mengenali kata-kata yang mengandung sinonim sebagai tindakan plagiarisme. Mendeteksi duplikat menggunakan sinonim mendapatkan persentase lebih tinggi dibandingkan tanpa menggunakan sinonim.
Kata Kunci: Plagiat, dokumen, fingerprinting, Algoritma winnowing, k-grams, persamaan kata
Penulis: Agus Rizki Syahputra
Kode Jurnal: jptinformatikadd150422

Artikel Terkait :