Eksperimen pada Sistem Klasifikasi Berita Hoax Berbahasa Indonesia Berbasis Pembelajaran Mesin
ABSTRAK: Klasifikasi berita
hoax atau berita
dengan informasi yang tidak
benar merupakan salah
satu aplikasi kategorisasi
teks. Seperti aplikasi kategorisasi teks berbasis pembelajaran mesin pada umumnya,
sistem ini terdiri
atas praproses, ekstraksi fitur, seleksi fitur dan
pengeksekusian model klasifikasi. Pada penelitian ini,
eksperimen dilakukan untuk
memilih teknik terbaik pada
setiap sub proses
dengan menggunakan 220 artikel
berbahasa Indonesia dalam
22 topik (89
artikel hoax dan 131
artikel bukan hoax).
Untuk praproses, hasil eksperimen terbaik dicapai oleh
praproses tanpa stemming dan dengan
penghapusan stop word.
Untuk ekstraksi fitur,
fitur unigram memiliki akurasi
terbaik dibandingkan dengan bigram
dan unigram+bigram. Untuk
seleksi fitur, teknik terbaik adalah
penggunaan operasi union
pada mutual information dan
information gain. Sedangkan untuk algoritma klasifikasi, dengan
berbagai kombinasi di
atas, algoritma naïve bayes
menunjukkan hasil akurasi
yang terbaik dibandingkan dengan
SVM dan C4.5
dengan nilai akurasi 91.36%.
Penulis: Errissya Rasywir, Ayu
Purwarianti
Kode Jurnal: jptinformatikadd150560