首页> 中文会议>第十一届全国计算语言学学术会议 >基于关联度的汉藏多词单元等价对抽取方法

基于关联度的汉藏多词单元等价对抽取方法

摘要

针对为汉藏辅助翻译系统建立汉藏多词单元翻译词典这一任务,本文提出了CMWEPM模型.该模型首先依据关联度和结合度来确定汉语语料中多词单元的边界,然后根据词对齐信息分别抽取严格和约束汉藏多词单元等价对.CMWPM模型根据不同长度和频次对多词单元进行分类,并为不同类型设定不同阈值,最终提高了汉藏多词单元等价对的召回率,从而能够间接地提高汉藏辅助翻译系统的翻译质量.由于藏文形态变化丰富,并且汉语、藏语两种语言差异很大,下一步的工作将考虑加入形态学信息来优化词对齐的准确率,抽取出更为合理的汉藏多词单元等价对。为已经获取的等价对计算翻译概率,应用这些等价对进行翻译解码也是论文下一步工作之一。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号