Integrasi Algoritma K-Means Dengan Bahasa SQL Untuk Klasterisasi IPK Mahasiswa (Studi Kasus: Fakultas Ilmu Komputer Universitas Brawijaya)
Abstrak: Secara umum, aplikasi
klasterisasi diimplementasikan di luar DBMS dengan mengambil data terlebih
dahulu dari basisdata untuk disimpan sementara dalam variabel program (misal
dalam sebuah array), kemudian baru dilakukan proses klasterisasi. Permasalahan
waktu dan keamanan dalam pengambilan data dari DBMS dan besarnya data yang akan
diklasterisasi mendorong metode lain dimana proses klasterisasi bisa langsung
dilakukan di DBMS. Klasterisasi dilakukan dengan mengintegrasikan algoritma
klasterisasi pada DBMS menggunakan bahasa SQL. Pada penelitian ini difokuskan
pada perancangan dan pengimplementasian integrasi algoritma klasterisasi
K-means pada Relational DBMS dengan menggunakan bahasa SQL. Proses klasterisasi
dilakukan dengan studi kasus data akademik mahasiswa di Fakultas Ilmu Komputer
universitas Brawijaya dengan fitur IPK, sks tempuh, sks lulus dan semester.
Berdasarkan hasil uji coba dataset akademik dengan variasi jumlah dimensi,
jumlah klaster dan metode perhitungan jarak yang berbeda, telah didapatkan
hasil pengklasteran data dengan benar. Berdasarkan hasil perhitungan
kompleksitas waktu untuk tiap tahap implementasi K-means menggunakan SQL dan
tanpa SQL, menunjukkan hasil kompleksitas waktu asimptotik yang sama dimana
tahap menghitung euclidean distance membutuhkan kompleksitas waktu yang paling
tinggi.
Penulis: Issa Arwani
Kode Jurnal: jptinformatikadd150398