首页> 中国专利> 基于双向上下文的非自回归语音识别网络、方法及设备

基于双向上下文的非自回归语音识别网络、方法及设备

摘要

本发明适用于人类语言处理技术领域,提供了一种基于双向上下文的非自回归语音识别网络、方法、设备及存储介质,本发明提供的语音识别网络采用Transformer的编码器‑解码器结构,语音识别网络的编码器用于对输入的语音特征进行初步识别,得到初步识别结果,语音识别网络的解码器用于利用由初步识别结果提供的双向语言信息对初步识别结果进行调整,并输出最终的语音识别结果,其中,解码器通过预设的、应用于解码器的每个多头自注意力层的注意力掩码利用双向语言信息,从而充分了利用了语言信息,提高了语音识别效果,且相较于使用两个单向解码器分别利用单向语言信息的方法,结构更加高效统一。

著录项

  • 公开/公告号CN113516973A

    专利类型发明专利

  • 公开/公告日2021-10-19

    原文格式PDF

  • 申请/专利权人 珠海亿智电子科技有限公司;

    申请/专利号CN202111066812.2

  • 发明设计人 不公告发明人;

    申请日2021-09-13

  • 分类号G10L15/08(20060101);G10L15/06(20130101);G10L15/183(20130101);

  • 代理机构44350 深圳青年人专利商标代理有限公司;

  • 代理人吴桂华

  • 地址 519000 广东省珠海市高新区唐家湾镇港乐路8号大洲科技园B区厂房803室

  • 入库时间 2023-06-19 12:54:37

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号