首页> 中文期刊>计算机仿真 >面向汉藏机器翻译后处理的藏文虚词纠错模型

面向汉藏机器翻译后处理的藏文虚词纠错模型

     

摘要

机器翻译是自然语言处理的主要分支之一,在促进政治、经济、文化交流等方面起着重要作用.目前汉藏机器翻译质量还有待提高,汉文到藏文的译文中容易出现语法错误,尤其普遍存在藏文虚词的翻译错误.分析汉藏机器翻译译文中的藏文虚词错误类型,并究其自动纠错方法是提高汉藏机器翻译性能最有效的方法.在分析汉藏机器翻译译文中虚词错误类型的基础上,利用大规模藏文文本对Bert进行预训练.然后面向汉藏机器翻译译文中的虚词错误类型,针对性的对Bert预训练模型进行微调,以完成一种面向汉藏机器翻译后处理的Bert藏文虚词纠错模型的训练.经实验,模型的纠错准确率、召回率和F1值分别达95.64%,93.27%,94.44%,表明上述模型的藏文虚词纠错性能较好.

著录项

  • 来源
    《计算机仿真》|2021年第12期|391-396|共6页
  • 作者单位

    青海师范大学计算机学院 青海 西宁810016;

    青海省藏文信息处理与机器翻译重点实验室 青海 西宁810008;

    青海省藏文信息处理工程技术研究中心 青海 西宁810008;

    藏语智能信息处理及应用国家重点实验室 青海 西宁810008;

    青海师范大学计算机学院 青海 西宁810016;

    青海省藏文信息处理与机器翻译重点实验室 青海 西宁810008;

    青海省藏文信息处理工程技术研究中心 青海 西宁810008;

    藏语智能信息处理及应用国家重点实验室 青海 西宁810008;

    青海师范大学计算机学院 青海 西宁810016;

    青海省藏文信息处理与机器翻译重点实验室 青海 西宁810008;

    青海省藏文信息处理工程技术研究中心 青海 西宁810008;

    藏语智能信息处理及应用国家重点实验室 青海 西宁810008;

    青海师范大学计算机学院 青海 西宁810016;

    青海省藏文信息处理与机器翻译重点实验室 青海 西宁810008;

    青海省藏文信息处理工程技术研究中心 青海 西宁810008;

    藏语智能信息处理及应用国家重点实验室 青海 西宁810008;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    机器翻译; 掩码语言模型; 预训练; 微调; 藏文虚词纠错;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号