PENDEKATAN POSITIONAL TEXT GRAPH UNTUK PEMILIHAN KALIMAT REPRESENTATIF CLUSTER PADA PERINGKASAN MULTI-DOKUMEN
ABSTRAK: Coverage dan
saliency adalah masalah
utama dalam peringkasan teks
otomatis. Pendekatan clustering kalimat merupakan
metode yang mampu
memberikan cakupan yang
baik (good coverage)
terhadap semua topik, namun
yang perlu diperhatikan
adalah pemilihan kalimat
penting (salient setence)
yang mampu merepresentasikan topik
cluster. Kalimat-kalimat penting
yang terpilih menjadi
penyusun ringkasan akhir harus
memiliki kepadatan informasi
sehingga mampu menyampaikan
informasi penting yang
terkandung di dalam cluster. Kepadatan informasi dari kalimat dapat digali
dengan mengekstraksi fitur sentence information density (SID) yang dibangun
dari pendekatan positional text graph setiap kalimat di dalam cluster. Pada
paper ini diajukan sebuah
strategi pemilihan kalimat
representatif cluster menggunakan pendekatan positional text graph
pada peringkasan multi-dokumen. Terdapat
tiga konsep yang
digunakan pada paper
ini yaitu: (1) clustering kalimat
dengan similarity based
histogram clustering, (2)
pengurutan cluster berdasarkan
cluster importance dan (3)
pemilihan kalimat representatif
berdasarkan skor fitur sentence
information density. Kalimat yang
menjadi kalimat kandidat ringkasan adalah kalimat yang memiliki skor fitur
sentence information density
terbesar dari suatu
cluster. Uji coba
dilakukan terhadap dataset
task 2 DUC
2004. Pengukuran ROUGE-1 digunakan
sebagai pengukuran performa
untuk membandingkan penggunaan
fitur SID dengan metode
lain yaitu local
importance dan global
importance (LIGI). Dari
hasil ujicoba didapatkan
bahwa penggunaan fitur SID
berhasil mengungguli metode LIGI berdasarkan nilai ROUGE-1 dimana nilai rata-rataROUGE-1 terbesar yang
mampu diraih fitur SID 0.3915.
Kata kunci: peringkasan
multi-dokumen, clustering kalimat, Similarity based Histogram Clustering, sentence information density, positional
text graph
Penulis: I Putu Gede Hendra
Suputra, Agus Zainal Arifin, Anny Yuniarti
Kode Jurnal: jptkomputerdd130122