首页> 外文会议>Asia Information Retrieval Societies Conference >Exploring Clustering for Multi-document Arabic Summarisation
【24h】

Exploring Clustering for Multi-document Arabic Summarisation

机译:探索多文件阿拉伯语汇总的聚类

获取原文

摘要

In this paper we explore clustering for multi-document Arabic summarisation. For our evaluation we use an Arabic version of the DUC-2002 dataset that we previously generated using Google Translate. We explore how clustering (at the sentence level) can be applied to multi-document summarisation as well as for redundancy elimination within this process. We use different parameter settings including the cluster size and the selection model applied in the extractive summarisation process. The automatically generated summaries are evaluated using the ROUGE metric, as well as precision and recall. The results we achieve are compared with the top five systems in the DUC-2002 mull i-document summarisation task.
机译:在本文中,我们探讨了多文件阿拉伯语汇总的聚类。对于我们的评估,我们使用先前使用谷歌翻译的Duc-2002数据集的阿拉伯语版本。我们探讨集群(在句子级​​别)如何应用于多文件汇总以及在此过程中的冗余消除。我们使用不同的参数设置,包括集群大小和在提取汇总过程中应用的选择模型。使用Rouge公制以及精度和召回来评估自动生成的摘要。我们实现的结果与DUC-2002 MPLI I-DIMICT汇总任务的前五个系统进行了比较。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号