PENDEKATAN POSITIONAL TEXT GRAPH UNTUK PEMILIHAN KALIMAT REPRESENTATIF CLUSTER PADA PERINGKASAN MULTI-DOKUMEN

ABSTRAK: Coverage  dan  saliency  adalah  masalah  utama dalam  peringkasan  teks  otomatis.  Pendekatan  clustering kalimat  merupakan  metode  yang  mampu  memberikan  cakupan  yang  baik  (good  coverage)  terhadap  semua topik,  namun  yang  perlu  diperhatikan  adalah  pemilihan  kalimat  penting  (salient  setence)  yang  mampu merepresentasikan  topik  cluster.  Kalimat-kalimat  penting  yang  terpilih  menjadi  penyusun  ringkasan  akhir harus  memiliki  kepadatan  informasi  sehingga  mampu  menyampaikan  informasi  penting  yang  terkandung  di dalam cluster.  Kepadatan informasi dari kalimat dapat digali dengan mengekstraksi fitur sentence information density (SID) yang dibangun dari pendekatan positional text graph setiap kalimat di dalam cluster. Pada paper ini  diajukan  sebuah  strategi  pemilihan  kalimat  representatif  cluster  menggunakan pendekatan positional  text graph  pada  peringkasan  multi-dokumen.  Terdapat  tiga  konsep  yang  digunakan  pada  paper  ini  yaitu:  (1) clustering  kalimat  dengan  similarity  based  histogram  clustering,  (2)  pengurutan  cluster  berdasarkan  cluster importance  dan  (3)  pemilihan  kalimat  representatif  berdasarkan  skor  fitur  sentence  information  density. Kalimat yang menjadi kalimat kandidat ringkasan adalah kalimat yang memiliki skor fitur sentence information density  terbesar  dari  suatu  cluster.  Uji  coba  dilakukan  terhadap  dataset  task  2  DUC  2004.  Pengukuran ROUGE-1  digunakan  sebagai  pengukuran  performa  untuk  membandingkan  penggunaan  fitur  SID  dengan metode  lain  yaitu  local  importance  dan  global  importance  (LIGI).  Dari  hasil  ujicoba  didapatkan  bahwa penggunaan fitur  SID berhasil mengungguli metode LIGI berdasarkan nilai ROUGE-1  dimana nilai rata-rataROUGE-1 terbesar yang mampu diraih fitur SID 0.3915.
Kata kunci: peringkasan multi-dokumen, clustering kalimat, Similarity based Histogram  Clustering, sentence information density, positional text graph
Penulis: I Putu Gede Hendra Suputra, Agus Zainal Arifin, Anny Yuniarti
Kode Jurnal: jptkomputerdd130122

Artikel Terkait :