首页> 中国专利> 一种基于融合神经网络结构的端到端语音识别方法

一种基于融合神经网络结构的端到端语音识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于融合神经网络结构的端到端语音识别方法，其包括获取初始语音信号，进行快速傅里叶变换和梅尔系数提取，将快速傅里叶变换后的功率谱信号和提取的梅尔系数信号相乘，得到梅尔频谱输出信号；基于SpecAugment数据增强算法进行数据增强；建立声学模型块，并基于声学模型块建立声学模型；将数据增强后的梅尔谱语音信号输入声学模型，得到预测的拼音序列；计算预测的拼音序列的条件概率，基于马尔科夫链的二元统计语言模型，将预测的拼音序列转换成文字，完成语音识别。本发明提升系统识别准确率和模型泛化性；对建立的声学模型进行微调，使模型得到更优的效果；本发明声学模型减少了计算量和语音识别错误率。

著录项

公开/公告号CN114187898A

专利类型发明专利
公开/公告日2022-03-15

原文格式PDF
申请/专利权人电子科技大学;
展开▼

申请/专利号CN202111671160.5
发明设计人阎波;郭伦壹;束峥宇;雷治宇;
展开▼

申请日2021-12-31
分类号G10L15/02(20060101);G10L15/08(20060101);G10L15/20(20060101);G10L17/04(20130101);
代理机构11870 北京正华智诚专利代理事务所(普通合伙);
代理人代维凡
地址 611731 四川省成都市高新区(西区)西源大道2006号
入库时间 2023-06-19 14:31:20

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-15

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种基于全卷积神经网络结构的端到端撞击坑检测与识别方法 [P] . 中国专利： CN108734219B . 2022.02.01
2. 一种基于全卷积神经网络结构的端到端撞击坑检测与识别方法 [P] . 中国专利： CN108734219A . 2018-11-02
3. 携帯情報端末、この携帯情報端末用の保持部材、及び携帯情報端末を備えたユーザー管理システム [P] . 日本专利： JP2019033832A . 2019-03-07

机译：一种用户管理系统，其配备有移动信息终端，该移动信息终端的保持构件和移动信息终端。
4. 移動端末試験装置および移動端末試験方法 [P] . 日本专利： JP2019036920A . 2019-03-07

机译：移动终端测试设备及移动终端测试方法
5. 光加入者線終端装置、光加入者線終端装置の制御方法及び制御プログラム [P] . 日本专利： JP2019047157A . 2019-03-22

机译：光用户线终端设备，控制方法和控制程序用于光用户线终端设备