改进卷积输入的端到端普通话语音识别

王彦哲; 张立民; 张兵强; 李振宇

首页> 中文期刊> 《计算机工程与应用》 >改进卷积输入的端到端普通话语音识别

改进卷积输入的端到端普通话语音识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:主流神经网络训练的交叉熵准则是对声学数据的每个帧进行分类优化,而连续语音识别是以序列级转录准确性为性能度量。针对这个不同,构建基于序列级转录的端到端语音识别系统。针对低资源语料条件下系统性能不佳的问题,其中模型使用卷积神经网络对输入特征进行处理,选取最佳的网络结构,在时域和频域进行二维卷积,从而改善输入空间中因不同环境和说话人产生的小扰动影响。同时神经网络使用批量归一化技术来减少泛化误差,加速训练。基于大型的语言模型,优化解码过程中的超参数,提高模型建模效果。实验结果表明系统性能提升约24%,优于主流语音识别系统。

著录项

来源
《计算机工程与应用》 |2019年第17期|143-149|共7页
作者
王彦哲; 张立民; 张兵强; 李振宇;
展开▼
作者单位

海军航空大学信息融合研究所山东烟台 264000;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
序列级; 低资源; 端到端; 卷积神经网络; 批量归一化;

相似文献

中文文献
外文文献
专利

1. 基于改进混合CTC/attention架构的端到端普通话语音识别 [J] . 杨鸿武 ,周刚 . 西北师范大学学报（自然科学版） . 2019,第003期
2. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
3. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
4. 端到端的深度卷积神经网络语音识别 [J] . 刘娟宏 ,胡彧 ,黄鹤宇 . 计算机应用与软件 . 2020,第004期
5. 基于门控卷积网络与CTC的端到端语音识别 [J] . 杨德举 ,马良荔 ,谭琳珊 . 计算机工程与设计 . 2020,第009期
6. 一个端到端计算平台的改进 [C] . 汤铭 ,王从明 ,李晓芳 . 第三届江苏计算机大会 . 2008
7. 基于改进的端到端卷积神经网络的目标检测算法研究 [A] . 周方禹 . 2020

改进卷积输入的端到端普通话语音识别

摘要

著录项

相似文献

相关主题

期刊订阅