语音识别系统中的VTS特征补偿算法优化

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在实际环境中，由于环境噪声的干扰，语音识别系统的识别性能并不理想。矢量泰勒级数(VTS: Vector Taylor Series)特征补偿是一种基于模型的特征补偿算法，具有很强的鲁棒性，能够有效解决训练环境与测试环境失配导致的识别性能下降问题。
　　针对VTS计算量大、在低信噪比环境下性能急剧下降的问题，论文将对基于VTS的孤立词识别系统进行优化，主要包括基于双层高斯混合模型(GMM: Gaussian MixtureModel)结构的VTS特征补偿优化，以及针对多环境模型的噪声参数估计的初始值优化，通过优化提高系统的识别速度和识别率，增强语音识别系统的实用性。主要工作如下:
　　(1)鲁棒语音识别系统结构分析。重点分析鲁棒语音识别中的关键技术，包括基于加权子带谱熵的端点检测算法，VTS特征补偿算法，以及声学模型。声学模型包括用于特征补偿的GMM模型和模式识别的隐马尔可夫模型(HMM: Hidden Markov Model)。
　　(2)基于双层GMM模型的VTS补偿算法优化。针对VTS特征补偿计算量大的问题，本文提出了双层GMM的VTS算法结构，将特征补偿中的噪声参数估计过程和特征映射过程分开进行。在训练阶段，分别得到高斯单元混合数个数较少的GMM1模型和混合高斯个数较多的GMM2模型。特征补偿过程中，先用GMM1模型估计测试语音中噪声的均值和方差，再利用GMM2模型基于最小均方误差准则，将测试语音的含噪特征参数映射成纯净的语音特征参数。算法优化大幅降低了计算量，同时保持了识别性能。
　　(3)基于多环境模型VTS算法的噪声参数估计初始值优化。基于多环境模型VTS语音识别从基本环境模型集中选出与当前环境最匹配的声学模型，用于特征补偿，能够有效降低训练环境与测试环境之间的失配性。根据最优GMM模型设置噪声参数的初始值，在噪声参数迭代求解过程中可以有效的避免最大期望(EM: Expectation-maximization)算法陷入局部收敛，使得EM算法能够以更少的迭代次数收敛到更为准确的估计值，从而提高语音识别性能。
　　(4)实现了基于MATLAB的离线仿真测试和基于C平台的实时测试。在MATLAB平台和C平台进行大量实验，验证本文所提出优化算法的有效性。实验证明，本文所提出的双层GMM结构优化算法在中文语音库下识别速度提升38％左右，噪声参数估计EM迭代初始值优化算法能够更加准确的估计出噪声参数，从而使系统误识率下降，特别是在低信噪比环境下效果更加明显。

著录项

作者
李海静;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科信息与通信工程
授予学位硕士
导师姓名周琳;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
语音识别; 矢量泰勒级数; 特征补偿; 算法优化; 信噪比;

相似文献

中文文献
外文文献
专利

1. PM2.5测量系统中改进神经网络控制算法优化补偿 [J] . 邹孔雨 ,佟国香 . 电子科技 . 2015,第011期
2. 基于信息增益的特征选择算法在语音识别系统中的应用 [J] . 孙赢 . 科技通报 . 2012,第12期
3. 语音识别系统中的特征参数提取过程研究 [J] . 孟祥斌 ,尹常永 ,包妍 . 沈阳工程学院学报（自然科学版） . 2009,第004期
4. 语音识别系统中多种特征参数组合的抗噪性 [J] . 徐永华 ,孙炯宁 . 金陵科技学院学报 . 2006,第001期
5. 关于“见Vt”结构中“见”的语法、语义特征问题 [J] . 孙良明 . 古汉语研究 . 2007,第2期
6. 基于语音包络特征的语音识别系统研究 [C] . 陈成 ,余宁梅 . 第十六届全国半导体集成电路硅材料学术会议 . 2009
7. 基于ARM A8和矢量泰勒级数特征补偿的语音识别系统实现与优化 [A] . 周峰 . 2015

语音识别系统中的VTS特征补偿算法优化

目录

摘要

著录项

相似文献

相关主题

期刊订阅