首页> 中文期刊>中文信息学报 >汉英篇章结构平行语料库的对齐标注评估

汉英篇章结构平行语料库的对齐标注评估

     

摘要

Chinese-English discourse treebank (CEDT) is a parallel corpus annotated with alignment discourse structure information for Chinese and English.Its core task is alignment annotation supervised by the principle of structure and relation alignment.With the corresponding annotation platform,we manually annotate the corpus,propose the evaluation methods for the alignment annotation and give the evaluation analysis,including segmentation,structure,relation,connective,relation role and center alignment.Experimental results show that the alignment annotation strategy is a feasible and efficient method of building CEDT.%汉英篇章结构平行语料库是为汉英翻译文本标注对齐篇章结构信息的语料库,对齐标注是其核心工作,基本原则是“结构对齐、关系对齐”.该文基于所开发的对齐标注平台,进行人工对齐标注实验,提出切分对齐、结构对齐、关系对齐、连接词对齐、关系角色与中心对齐等对齐标注任务的评估方法,并给出评估分析.实验表明,对齐标注是构建汉英篇章结构平行语料库的合理、有效工作方式.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号