基于深度优化残差卷积神经网络的端到端语音识别

徐冬冬; 蒋志翔

首页> 中文期刊>计算机应用研究 >基于深度优化残差卷积神经网络的端到端语音识别

基于深度优化残差卷积神经网络的端到端语音识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为增强语音识别声学模型中特征提取的鲁棒性和深层网络模型训练的有效性,提出一种采用残差结构优化深层卷积神经网络的端到端语音识别模型。该方法使用连接时序分类(connectionist temporal classification,CTC)作为目标损失函数,通过在卷积神经网络层之间添加残差跳转连接,将前层中输入直接传输到后层,构建一组残差卷积层,深化了声学模型中卷积层层数。然后在残差结构内外分别添加Swish和maxout函数,改善网络存在的退化问题和梯度消失问题,进而提升了语音识别的性能。在中文数据集AISHELL-1上进行语音识别实验。研究结果表明,与传统识别模型相比,基于深度优化残差卷积神经网络的CTC模型在语音识别任务上具有更好的性能。

著录项

来源
《计算机应用研究》|2020年第S02期|139-141|共3页
作者
徐冬冬; 蒋志翔;
展开▼
作者单位

中国航天科工集团第二研究院研究生院,北京100854;

北京计算机技术及应用研究所,北京100854;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;人工神经网络与计算;
关键词
残差结构; 连接时序分类; Swish激活; maxout激活; 深层卷积神经网络;
入库时间 2022-08-20 13:14:44

相似文献

中文文献
外文文献
专利

1. 端到端的深度卷积神经网络语音识别 [J] . 刘娟宏 ,胡彧 ,黄鹤宇 . 计算机应用与软件 . 2020,第004期
2. 基于多尺度残差深度卷积神经网络的语音识别 [J] . 刘虹 ,袁三男 . 计算机应用与软件 . 2020,第011期
3. 基于残差连接的场景文本识别端到端网络结构优化 [J] . 黄金星 ,潘翔 ,郑河荣 . 计算机科学 . 2020,第008期
4. 基于深度LSTM的端到端的语音识别 [J] . 张瑞珍 ,韩跃平 ,张晓通 . 中北大学学报（自然科学版） . 2020,第003期
5. 一种基于端对端深度卷积神经网络的验证码识别方法 [J] . 崔新 ,白培瑞 ,张策 . 山东科技大学学报（自然科学版） . 2020,第002期
6. 基于有限元法的大深度耐压壳体端盖优化设计 [C] . XU Xiaorong ,许晓蓉 . 第十四届中国CAE工程分析技术年会 . -1
7. 基于卷积神经网络的端到端语音识别研究 [A] . 张玉凯 . 2021

基于深度优化残差卷积神经网络的端到端语音识别

摘要

著录项

相似文献

相关主题

期刊订阅