首页> 中国专利> 低资源多语言的语音识别模型、语音识别方法

低资源多语言的语音识别模型、语音识别方法

摘要

本发明属于语音识别领域,具体涉及一种低资源多语言的语音识别模型、语音识别方法,旨在为了解决多语言混用状态下小语种语言识别准确度低的问题。本发明语音识别模型为端到端的语音识别模型,该模型中子词词表为多语言子词词表,所述多语言子词词表为设定低资源语种的标注文本与设定高资源语种的标注文本合并起来采用BPE算法共同生成多语言的符号词表;所述语音识别模型的训练数据为设定低资源语种的伪标注训练数据和设定高资源语种的训练数据的合并数据。本发明提高了包含小语种的多语种语音信息识别的准确度。

著录项

  • 公开/公告号CN110428818B

    专利类型发明专利

  • 公开/公告日2021-09-28

    原文格式PDF

  • 申请/专利权人 中国科学院自动化研究所;

    申请/专利号CN201910732557.7

  • 发明设计人 周世玉;徐波;

    申请日2019-08-09

  • 分类号G10L15/06(20130101);G10L15/02(20060101);G10L15/08(20060101);G10L15/14(20060101);

  • 代理机构11576 北京市恒有知识产权代理事务所(普通合伙);

  • 代理人郭文浩;尹文会

  • 地址 100190 北京市海淀区中关村东路95号

  • 入库时间 2022-08-23 12:33:11

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号