首页> 中文期刊>中文信息学报 >基于CNN-CorrNet网络的汉缅平行句对抽取方法

基于CNN-CorrNet网络的汉缅平行句对抽取方法

     

摘要

构建双语平行语料库是提升低资源语言机器翻译质量的一种有效方法.该文提出了基于CNN-CorrNet网络的汉缅平行句对抽取方法.具体而言,该文首先利用BERT得到汉语、缅语词向量表征,并将汉语、缅语两种语言句子用卷积神经网络进行句子表征,以捕捉句子重要特征信息;然后为了保证两种语言跨语言表征的最大相关性,利用已有的汉缅平行句对作为约束条件,使用CorrNet(相关神经网络)将汉缅的句子表征投影到公共语义空间;最后计算公共语义空间中汉语、缅语句子距离,并根据距离判断汉—缅双语句子是否为平行句子.实验结果表明,相比最大熵模型、孪生网络模型,该文提出的方法F1值分别提升了13.3%、5.1%.

著录项

  • 来源
    《中文信息学报》|2020年第11期|60-66|共7页
  • 作者单位

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    汉缅双语; 平行句对; 卷积神经网络; 相关神经网络; 公共语义空间;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号