SEMANTIC CLUSTERING DAN PEMILIHAN KALIMAT REPRESENTATIF UNTUK PERINGKASAN MULTI DOKUMEN
Abstrak: Coverage dan saliency
merupakan masalah utama dalam peringkasan multi dokumen. Hasil ringkasan yang
baik harus mampu mampu mencakup (coverage) sebanyak mungkin konsep penting
(salient) yang ada pada dokumen sumber. Penelitian ini bertujuan untuk
mengembangkan metode baru peringkasan multi dokumen dengan teknik semantic clustering
dan pemilihan kalimat
representatif cluster. Metode
yang diusulkan berdasarkan
prinsip kerja Latent Semantic
Indexing (LSI) dan
Similarity Based Histogram
Clustering (SHC) untuk
pembentukan cluster kalimat secara semantik, serta mengkombinasikan
fitur Sentence Information Density (SID) dan Sentence Cluster Keyword
(SCK) untuk pemilihan
kalimat representatif cluster.
Pengujian dilakukan pada
dataset Document
Understanding Conference (DUC)
2004 Task 2
dan hasilnya diukur
menggunakan Recall-Oriented Understudy for
Gisting Evaluation (ROUGE).
Hasil pengujian menunjukkan
bahwa metode yang
diusulkan mampu mencapai nilai ROUGE-1 rata-rata sebesar 0,395 dan nilai
ROUGE-2 rata-rata sebesar 0,106.
Kata kunci:
peringkasan multi dokumen,
latent semantic indexing,
similarity based histogram
clustering, sentence information density, sentence cluster keyword
Penulis: Pasnur, Putu Praba
Santika,Gus Nanang Syaifuddin
Kode Jurnal: jptinformatikadd140142

Artikel Terkait :
Jp Teknik Informatika dd 2014
- Identifikasi Anemia Thalasemia Betha (β) Mayor Berdasarkan Morfologi Sel Darah Merah
- Implementasi Sistem Informasi Geografis Daerah Pariwisata Kabupaten Temanggung Berbasis Android dengan Global Positioning System (GPS)
- Peningkatan Akurasi Estimasi Ukuran Perangkat Lunak dengan Menerapkan Logika Samar Metode Mamdani
- Wireless Sensor Networks For Volcano Activity Monitoring: A Survey
- Identifikasi Kualitas Beras dengan Citra Digital
- Model Perangkingan Proyek Kontruksi Pada Asosiasi Kontraktor Menggunakan Fuzzy AHP
- Analisis Hubungan Proses Pembelajaran Dengan Kepuasan Mahasiswa Menggunakan Logika Fuzzy
- Internalisasi Karakter Konservasi Lingkungan melalui Media Game Deservasi (Kader Konservasi)
- Analisis Efektivitas Iklan Jejaring Sosial sebagai Media Promosi Menggunakan EPIC Model
- Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan
- Implementasi Network Attached Storage (NAS) Menggunakan NAS4Free untuk Media Backup File
- Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis
- Analisis Kinerja Pengenalan Telapak Tangan Menggunakan Ekstraksi Ciri Principal Component Analysis (PCA) dan Overlapping Block
- Pengaruh Kekuatan Media Sosial dalam Pengembangan Kesenjangan Digital
- Sistem Penetapan Angka Kredit untuk Kenaikan Pangkat Guru di Lingkungan Pemerintah Kota Magelang Berbasis Web
- Alat Ukur Parameter Tanah dan Lingkungan Berbasis Smartphone Android
- Implementasi Logika Fuzzy Mamdani untuk Mendeteksi Kerentanan Daerah Banjir di Semarang Utara
- Aplikasi Game Edukasi Pasang Pageh Aksara Bali Berbasis Android
- Akurasi Pembacaan GPS pada Android untuk Location Based Service (Studi Kasus: Informasi Lokasi SMA di Palembang)
- Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik Morfologi dan Tingkah Laku
- Jaringan Saraf Radial Basis Probabilistic untuk Identifikasi Morfologi Benih Padi Rawa Kalimantan Selatan
- Estimasi Spektrum Reflectance Citra Daun Jati Belanda Menggunakan Transformasi Wavelet
- Pemanfaatan Layanan Web Keanekaragaman untuk Pengelolaan Informasi Tumbuhan Obat Indonesia
- Pemodelan Dimensi Fraktal Multiskala untuk Mengenali Bentuk Daun
- Optimasi Aturan Asosiasi Multidimensi Menggunakan Algoritme Genetika untuk Klasifikasi Kemunculan Titik Panas