Eksperimen pada Sistem Klasifikasi Berita Hoax Berbahasa Indonesia Berbasis Pembelajaran Mesin

ABSTRAK: Klasifikasi  berita  hoax  atau  berita  dengan  informasi  yang tidak  benar  merupakan  salah  satu  aplikasi  kategorisasi  teks. Seperti aplikasi kategorisasi teks berbasis pembelajaran mesin pada  umumnya,  sistem  ini  terdiri  atas  praproses,  ekstraksi fitur, seleksi fitur dan pengeksekusian model klasifikasi. Pada penelitian  ini,  eksperimen  dilakukan  untuk  memilih  teknik terbaik  pada  setiap  sub  proses  dengan  menggunakan  220 artikel  berbahasa  Indonesia  dalam  22  topik  (89  artikel  hoax dan  131  artikel  bukan  hoax).  Untuk  praproses,  hasil eksperimen terbaik dicapai oleh praproses tanpa stemming dan dengan  penghapusan  stop  word.  Untuk  ekstraksi  fitur,  fitur unigram  memiliki  akurasi  terbaik  dibandingkan  dengan bigram  dan  unigram+bigram.  Untuk  seleksi  fitur,  teknik terbaik  adalah  penggunaan  operasi  union  pada  mutual information dan information gain. Sedangkan untuk algoritma klasifikasi,  dengan  berbagai  kombinasi  di  atas,  algoritma naïve  bayes  menunjukkan  hasil  akurasi  yang  terbaik dibandingkan  dengan  SVM  dan  C4.5  dengan  nilai  akurasi 91.36%. 
Kata Kunci: Artikel hoax, ekstraksi fitur, klasifikasi dokumen, seleksi fitur
Penulis: Errissya Rasywir, Ayu Purwarianti
Kode Jurnal: jptinformatikadd150560

Artikel Terkait :