PENGKLASTERAN DATA KATEGORIS DENGAN ALGORITMA SHARED NEAREST NEIGHBOR

Abstrak: Pengklasteran objek data merupakan salah satu cara untuk mempermudah dalam membaca data, terutama data berdimensi tinggi. Obyek-obyek data berada dalam satu klaster jika mempunyai kesamaan yang tinggi, dan sebaliknya, berada pada klaster berbeda jika menunjukkan ketidaksamaan. Data kategoris merupakan jenis data yang sering digunakan pada database/dataset. Data teks merupakan salah satu data kategoris. Pengklasteran dengan algoritma shared nearest neighbor (SNN) didasarkan pada anggapan bahwa titik-titik akan berada dalam klaster yang sama jika jumlah shared nearest neighbor melebihi ambang batas yang ditentukan. Algoritma SNN mampu memberikan hasil pengklasteran data teks dengan baik, dimana teks dengan tingkat kesamaan yang ditentukan, akan berada pada klaster yang sama.
Kata kunci: shared nearest neighbor, pengklasteran, data teks
Penulis: Alvida Mustikarukmi
Kode Jurnal: jpmatematikadd090092

Artikel Terkait :