首页> 中文学位 >鲁棒语音识别中的模型自适应算法研究与实现
【6h】

鲁棒语音识别中的模型自适应算法研究与实现

代理获取

目录

声明

摘要

第一章 绪论

1.1 语音识别的研究背景

1.2 语音识别的发展历史及现状

1.3 鲁棒性语音识别技术的难点及主要研究方向

1.3.1 鲁棒性语音识别技术的难点

1.3.2 鲁棒性语音识别技术的主要研究方向

1.4 论文的主要内容及安排

第二章 鲁棒性语音识别概述

2.1 鲁棒语音识别的基本方法

2.1.1 基于信号空间的方法

2.1.2 基于特征空间的方法

2.1.3 基于模型空间的方法

2.2 鲁棒语音识别系统中的关键技术

2.2.1 特征提取

2.2.2 声学模型

2.3 小结

第三章 基于最大似然线性回归的模型自适应算法研究

3.1 基于MLLR的模型自适应算法

3.1.1 线性假设

3.1.2 估计均值变换矩阵

3.1.2 估计方差变换矩阵

3.2 基于MATLAB的仿真实验

3.2.1 实验条件

3.2.2 实验结果及分析

3.3 小结

第四章 基于矢量泰勒级数的模型自适应算法研究

4.1 基于VTS的模型自适应算法

4.1.1 模型描述

4.1.2 模型参数的VTS关系式

4.1.3 均值估计

4.1.4 方差估计

4.2 基于MATLAB的仿真实验

4.2.1 实验条件

4.2.2 实验结果及分析

4.3 小结

第5章 基于矢量泰勒级数的鲁棒语音识别系统实现

5.1 系统的软件设计

5.2 预处理模块

5.2.1 语音采集

5.2.2 预加重

5.2.3 分帧加窗

5.2.4 端点检测

5.3 特征提取模块

5.4 训练模块

5.5 识别模块

5.5.1 模型自适应

5.5.2 含噪语音识别

5.6 实验结果与分析

5.6.1 实验设备与仪器介绍

5.6.2 数据库介绍

5.6.3 实时测试方案

5.6.4 结果与分析

5.7 小结

第六章 总结与下一步工作

6.1 全文总结

6.2 下一步工作

致谢

参考文献

攻读硕士学位期间参加的科研项目和完成的论文

展开▼

摘要

语音识别在实验室环境中识别性能很高,但是走向实用化的过程中,由于语音本身的变异性以及外部噪声的影响,导致在环境变化时,语音识别系统的性能严重下降。因此,研究能够适应不同环境的鲁棒性语音识别技术具有极其重要的意义。
  本文主要研究了鲁棒语音识别中的模型自适应算法,重点研究了基于最大似然线性回归(MLLR: Maximum Likelihood Linear Regression)的模型自适应算法以及基于矢量泰勒级数(VTS: Vector Taylor Series)的模型自适应算法。主要工作内容总结如下:
  首先研究了基于MLLR的模型自适应算法,在线性假设的基础上,分别给出了均值变换矩阵与方差变换矩阵的估计方法。并且进行了基于MATLAB的仿真实验,采用实验室录制的中文语音库,在不同噪声环境下,通过改变信噪比以及自适应数据个数,测试不同条件下系统的误识率。实验结果表明,MLLR算法依赖于自适应数据的数量,且在低信噪比条件下效果较好。
  接着研究了基于VTS的模型自适应算法,首先推导出了模型参数的矢量泰勒级数关系式,然后分别给出了噪声环境下模型参数的均值与方差的估计方法。将VTS算法与MLLR算法的实验结果进行对比可以发现,VTS算法不依赖于自适应数据的数量,且在低信噪比条件下,识别性能优于MLLR算法,但是MLLR算法相比VTS算法,具有计算量小、复杂度低、易于实现等优点,两种算法各有优缺点。
  最后,本文用C语言实现了鲁棒语音识别系统,为了尽可能提高系统的识别性能,采用了基于VTS的模型自适应算法。系统可以实现非特定人孤立词语音识别,在信噪比为15dB时,识别率达到90%,在信噪比为0dB时,识别率达到65%,模型更新完成后识别时间在0.3s以内,系统运行时间和识别率都达到了预期要求。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号