鲁棒语音识别中的模型自适应算法研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音识别在实验室环境中识别性能很高，但是走向实用化的过程中，由于语音本身的变异性以及外部噪声的影响，导致在环境变化时，语音识别系统的性能严重下降。因此，研究能够适应不同环境的鲁棒性语音识别技术具有极其重要的意义。
　　本文主要研究了鲁棒语音识别中的模型自适应算法，重点研究了基于最大似然线性回归(MLLR: Maximum Likelihood Linear Regression)的模型自适应算法以及基于矢量泰勒级数(VTS: Vector Taylor Series)的模型自适应算法。主要工作内容总结如下:
　　首先研究了基于MLLR的模型自适应算法，在线性假设的基础上，分别给出了均值变换矩阵与方差变换矩阵的估计方法。并且进行了基于MATLAB的仿真实验，采用实验室录制的中文语音库，在不同噪声环境下，通过改变信噪比以及自适应数据个数，测试不同条件下系统的误识率。实验结果表明，MLLR算法依赖于自适应数据的数量，且在低信噪比条件下效果较好。
　　接着研究了基于VTS的模型自适应算法，首先推导出了模型参数的矢量泰勒级数关系式，然后分别给出了噪声环境下模型参数的均值与方差的估计方法。将VTS算法与MLLR算法的实验结果进行对比可以发现，VTS算法不依赖于自适应数据的数量，且在低信噪比条件下，识别性能优于MLLR算法，但是MLLR算法相比VTS算法，具有计算量小、复杂度低、易于实现等优点，两种算法各有优缺点。
　　最后，本文用C语言实现了鲁棒语音识别系统，为了尽可能提高系统的识别性能，采用了基于VTS的模型自适应算法。系统可以实现非特定人孤立词语音识别，在信噪比为15dB时，识别率达到90％，在信噪比为0dB时，识别率达到65％，模型更新完成后识别时间在0.3s以内，系统运行时间和识别率都达到了预期要求。

著录项

作者
陈丽萍;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科信息与通信工程
授予学位硕士
导师姓名吴镇扬;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
鲁棒语音识别; 模型自适应算法; 最大似然线性回归; 矢量泰勒级数; 仿真实验;

相似文献

中文文献
外文文献
专利

1. 自适应并行模型组合的鲁棒语音身份识别算法 [J] . 李聪 ,葛洪伟 . 信号处理 . 2018,第007期
2. 基于稀疏鲁棒M-投资选择模型的鲁棒Half算法 [J] . 张亚飞 ,张成毅 ,罗双华 . 西安工程大学学报 . 2017,第001期
3. 基于双耳语音分离和丢失数据技术的鲁棒语音识别算法 [J] . 周琳 ,赵一良 ,朱竑谕 . 声学技术 . 2019,第5期
4. 基于发音特征的声效相关鲁棒语音识别算法 [J] . 晁浩 ,宋成 ,彭维平 . 计算机应用 . 2015,第001期
5. 基于独立感知理论的鲁棒语音识别算法 [J] . 孙暐 ,吴镇扬 . 东南大学学报（自然科学版） . 2005,第004期
6. 鲁棒自适应广义预测控制——自适应算法 [C] . 周德云 . 控制理论及其应用年会 . 1991
7. 鲁棒语音识别中的特征补偿与模型自适应算法研究 [A] . 吕勇 . 2010

鲁棒语音识别中的模型自适应算法研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅