首页> 中文学位 >基于HMM与ANN混合模型语音识别系统的研究与实现
【6h】

基于HMM与ANN混合模型语音识别系统的研究与实现

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状及分析

1.3 论文主要工作及结构安排

第二章 基于倒谱距离的语音端点检测研究

2.1 语音信号预处理

2.1.1 采样及量化

2.1.2 预加重

2.1.3 分帧

2.1.4 加窗

2.2 基于时域特征的端点检测算法

2.2.1 短时能量

2.2.2 短时过零率

2.2.3 短时能量和过零率双门限检测算法

2.3 基于频域特征的端点检测算法

2.3.1 基于LPC欧式距离测度的端点检测

2.3.2 基于谱熵的端点检测

2.4 基于倒谱距离的语音端点检测方法

2.4.1 倒谱距离

2.4.2 Mel频率倒谱系数

2.4.3 传统语音端点检测方法

2.4.3 自适应倒谱距离语音端点检测方法

2.4.4 实验结果及分析

2.5 小结

第三章 改进的谱减法语音增强技术算法的研究

3.1 语音增强基础理论

3.1.1 语音特性

3.1.2 人耳感知特性

3.1.3 噪声特性

3.2 语音增强短时谱估计算法研究

3.2.1 维纳滤波法

3.2.2 最小均方误差法

3.2.3 最小均方自适应滤波法

3.3 改进的谱减法语音增强技术研究

3.3.1 幅度谱减法

3.3.2 功率谱减法

3.3.3 改进的功率谱减法研究

3.3.4 实验结果及分析

3.4 小结

第四章 HMM与BP神经网络混合结构模型研究

4.1 隐马尔可夫模型

4.1.1 HMM模型定义

4.1.2 HMM模型三个问题求解

4.1.3 HMM基本算法

4.1.4 HMM算法实现中的问题

4.2 人工神经网络

4.2.1 神经网络的结构

4.2.2 BP神经网络的训练方法

4.2.3 BP网络设计原则

4.2.4 BP网络的优点和不足

4.2.5 改进型BP神经网络

4.3 改进型HMM/ANN混合模型的研究

4.3.1 HMM/ANN模型结构

4.3.2 HMM/ANN混合模型训练

4.3.3 HMM/ANN混合模型识别

4.4 实验结果及分析

4.4.1 语音样本库的建立

4.4.2 语音预处理

4.4.3 HMM/BP网络结构

4.4.4 实验数据及分析

4.4.5 实验结论

4.5 小结

第五章 混合模型语音识别系统

5.1 语音识别系统

5.1.1 系统框架

5.1.2 系统功能

5.2 语音识别实验

5.2.1 系统识别率实验

5.2.2 系统抗噪性能试验

5.3 实验数据及分析

5.3.1 系统识别性能分析

5.3.2 系统抗噪性能分析

5.4 小结

第六章 总结与展望

6.1 结论

6.2 展望

参考文献

致谢

攻读硕士学位期间学术成果

展开▼

摘要

随着人工智能技术的蓬勃发展,作为人机交互接口的语音识别技术也受到国际各界学者的广泛重视。目前商用的语音识别系统在室内高信噪比环境下已经取得了较高的识别率,但对于室外的环境,系统的识别率则表现不佳。本文通过探寻语音识别系统对噪声的自适应性以及引入马尔科夫和人工神经网络混合模型的方法,初步建立了一个较为完善的语音识别自适应模型,能够提高复杂环境下的语音识别率,增强语音识别系统的稳健性及自适应性。
  本文主要做了如下工作:
  1.针对倒谱距离语音端点检测算法存在的问题,通过计算每帧语音信号的短时信噪比,确立信噪比与门限阈值的关系,建立了一种自适应判决门限的双参数判决准则,能够精准的检测出语音端点信号,改进后的算法具有一定的自适应性,语音信号端点检测准确率有所提升。
  2.针对谱减法语音增强技术容易产生音乐噪声的问题,引入了SNR与谱减因子关系模型,通过关系模型动态调整谱减因子及语音增益系数,在最大限度抑制音乐噪声产生的前提下,提升语音信噪比,增强系统的抗干扰能力和鲁棒性。
  3.分析了马尔科夫模型和人工神经网络模型的优缺点,通过调整神经网络的连接权值、缩放系数和位移参数,提升了网络模型的收敛速率。
  4.结合马尔科夫模型强大的时序建模能力和人工神经网络模型的分类功能,建立了一个马尔科夫模型与人工神经网络模型混合结构的语音识别系统,在低信噪比环境下,该系统依旧能够保持较高的语音识别率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号