一种改进词语对齐的新方法

摘要

词语对齐是目前主流的统计机器翻译系统的基本模块,GIZA++是词语对齐最常用的工具,但是GIZA++的对齐结果仍然存在不足。本文从约束双语命名实体之间的对齐的角度出发,提出了一种改进词语对齐结果的方法:首先,识别双语命名实体;其次,用标记替换双语命名实体;再次,用GIZA++重新进行词语对齐;最后,将标记还原为原始的命名实体。实验表明,针对基于短语的机器翻译系统,该方法提高了NIST值,并且该方法还有改进空间。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号