PENGKLASTERAN DATA KATEGORIS DENGAN ALGORITMA SHARED NEAREST NEIGHBOR
Abstrak: Pengklasteran objek
data merupakan salah satu cara untuk mempermudah dalam membaca data, terutama
data berdimensi tinggi. Obyek-obyek data berada dalam satu klaster jika
mempunyai kesamaan yang tinggi, dan sebaliknya, berada pada klaster berbeda
jika menunjukkan ketidaksamaan. Data kategoris merupakan jenis data yang sering
digunakan pada database/dataset. Data teks merupakan salah satu data kategoris.
Pengklasteran dengan algoritma shared nearest neighbor (SNN) didasarkan pada
anggapan bahwa titik-titik akan berada dalam klaster yang sama jika jumlah
shared nearest neighbor melebihi ambang batas yang ditentukan. Algoritma SNN
mampu memberikan hasil pengklasteran data teks dengan baik, dimana teks dengan
tingkat kesamaan yang ditentukan, akan berada pada klaster yang sama.
Penulis: Alvida Mustikarukmi
Kode Jurnal: jpmatematikadd090092