首页> 中文期刊> 《情报工程 》 >大规模多粒度中文复述语料库

大规模多粒度中文复述语料库

             

摘要

[目的/意义]复述是相同语义的不同表达,集中反映了语言的多样性,一直是自然语言处理领域的核心问题。PPDB英文复述数据集在英文自然语言处理的多种任务中得到了应用,推动了英文自然语言处理领域的发展。缺少大规模多粒度中文复述数据集阻碍了复述技术在中文自然语言处理中的应用,是亟待解决的问题。[方法/过程]本文实现了一个针对多源数据的复述抽取系统,并抽取构建了一个大规模中文复述数据集,该数据集具有规模大、质量高的特点,且包含复述短语、复述模板和复述句三种粒度的复述文本。[结果/结论]自动评估和人工评估的结果表明,我们抽取的中文复述数据具有较高的文本多样性和语义一致性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号