首页> 中文会议>第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 >基于成分共享的英汉小句对齐语料库标注体系研究

基于成分共享的英汉小句对齐语料库标注体系研究

摘要

英汉小句对齐语料库服务于英语和汉语小句的语法结构对应关系研究和应用,对于语言理论和语言翻译(包括人的翻译和机器翻译)有重要意义.前人的语法理论和相关语料库的工作对于小句复合体和小句的界定缺乏充分研究,在理论上有缺陷,难以支持自然语言处理的应用.本文首先为英汉小句对齐语料库的建设做理论准备.从近年提出的汉语小句复合体的理论出发,本文界定了成分共享的概念,基于话头共享和引语共享来界定英语的小句和小句复合体,使小句和小句复合体具有功能的完整性和单一性.在此基础上,本文设计了英汉小句对齐的标注体系,包括英语NT小句标注和汉语译文生成及组合.语料库的标注表明,在小句复合体层面上英汉翻译涉及到的结构变换,其部件可以限制为英语小句和话头、话体,无需涉及话头和话体内部的结构.基于这些工作的英汉小句对齐语料库为语言本体研究和英汉语言对比、英汉机器翻译等应用提供了结构化的标注样本.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号