首页> 中文期刊>软件学报 >篇章视角的汉语零指代语料库构建

篇章视角的汉语零指代语料库构建

     

摘要

零指代是汉语中普遍存在的一个现象,在汉英机器翻译、文本摘要以及阅读理解等众多自然语言处理任务中都起着重要作用,目前已成为自然语言处理领域的一个研究热点.提出了篇章视角的汉语零指代表示体系,从服务于篇章分析的角度出发,首先以基本篇章单元为考察对象,判别其是否包含零元素;再根据零元素在基本篇章单元中承担的角色将零元素划分成主干类和修饰类两类;接着以段落对应的篇章修辞结构树为考察指代关系的基本单元,依据先行词与零元素间的位置关系将指代关系分成基本篇章单元内和基本篇章单元间两种,并针对基本篇章单元间的指代关系,根据零元素对应的先行词的状况将指代关系分成实体类、事件类、组合类和其他等4类;最后,基于篇章视角的汉语零指代表示体系,选取汉语树库CTB、连接词驱动的汉语篇章树库CDTB和OntoNotes语料中重叠的325篇文本进行了汉语零指代的标注,构建了服务于篇章分析的汉语零指代语料库.一方面,借助系统检测来说明所提出的表示体系合理有效,构造的语料库质量上乘;另一方面构建了完整的汉语零指代消解基准平台,从可计算的角度验证了所构建的汉语零指代语料库能够为篇章视角的汉语零指代研究提供必要的支撑.

著录项

  • 来源
    《软件学报》|2021年第12期|3782-3801|共20页
  • 作者

    孔芳; 葛海柱; 周国栋;

  • 作者单位

    苏州大学 计算机科学与技术学院 自然语言处理实验室 江苏 苏州 215006;

    江苏省计算机信息处理技术重点实验室 江苏 苏州 215006;

    苏州大学 计算机科学与技术学院 自然语言处理实验室 江苏 苏州 215006;

    苏州大学 计算机科学与技术学院 自然语言处理实验室 江苏 苏州 215006;

    江苏省计算机信息处理技术重点实验室 江苏 苏州 215006;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 人工智能理论;
  • 关键词

    零指代; 语料库构建; 篇章分析; 基本篇章单元; 零元素;

  • 入库时间 2023-07-25 13:18:38

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号