首页> 中国专利> 基于双向上下文的非自回归语音识别网络、方法及设备

基于双向上下文的非自回归语音识别网络、方法及设备

页面导航

摘要
著录项
相似文献

摘要

本发明适用于人类语言处理技术领域，提供了一种基于双向上下文的非自回归语音识别网络、方法、设备及存储介质，本发明提供的语音识别网络采用Transformer的编码器‑解码器结构，语音识别网络的编码器用于对输入的语音特征进行初步识别，得到初步识别结果，语音识别网络的解码器用于利用由初步识别结果提供的双向语言信息对初步识别结果进行调整，并输出最终的语音识别结果，其中，解码器通过预设的、应用于解码器的每个多头自注意力层的注意力掩码利用双向语言信息，从而充分了利用了语言信息，提高了语音识别效果，且相较于使用两个单向解码器分别利用单向语言信息的方法，结构更加高效统一。

著录项

公开/公告号CN113516973A

专利类型发明专利
公开/公告日2021-10-19

原文格式PDF
申请/专利权人珠海亿智电子科技有限公司;
展开▼

申请/专利号CN202111066812.2
发明设计人不公告发明人;
展开▼

申请日2021-09-13
分类号G10L15/08(20060101);G10L15/06(20130101);G10L15/183(20130101);
代理机构44350 深圳青年人专利商标代理有限公司;
代理人吴桂华
地址 519000 广东省珠海市高新区唐家湾镇港乐路8号大洲科技园B区厂房803室
入库时间 2023-06-19 12:54:37

相似文献

专利
中文文献
外文文献

1. 基于双向上下文的非自回归语音识别网络、方法及设备 [P] . 中国专利： CN113516973B . 2021.11.16
2. 基于双向上下文的非自回归语音识别网络、方法及设备 [P] . 中国专利： CN113516973A . 2021-10-19
3. Method and device for context-based voice recognition using voice recognition model [P] . 美国专利： US9842588B2 . 2017-12-12

机译：使用语音识别模型进行基于上下文的语音识别的方法和设备
4. NEURAL NETWORK BASED ACOUSTIC MODELS FOR SPEECH RECOGNITION BY GROUPING CONTEXT-DEPENDENT TARGETS [P] . 美国专利： US2018039883A1 . 2018-02-08

机译：通过基于上下文的目标分组，基于神经网络的语音识别声学模型
5. context-based arithmetic encoding apparatus, context-based arithmetic encoding method, context-based arithmetic decoding apparatus, context-based arithmetic decoding method, and at least one computer-readable medium. [P] . BRPI1015554A2 . 2020-08-18

机译：基于上下文的算术编码设备，基于上下文的算术编码方法，基于上下文的算术解码设备，基于上下文的算术解码方法和至少一种计算机可读介质。