首页> 中文学位 >基于分段模型的帧间相关性建模研究
【6h】

基于分段模型的帧间相关性建模研究

代理获取

目录

文摘

英文文摘

第一章序言

1.1语音识别系统概述

1.2声学模型研究的现状分析

1.3当前语音识别领域的主要问题

1.4本文的研究意义和研究目标

1.5本文的内容安排

第二章语音信号的特征提取

2.1语音信号的产生

2.2语音信号的预处理

2.3语音信号的时域特征

2.4语音信号的频域特征

2.4.1基于线性预测倒谱系数(LPCC)

2.4.2基于Mel频率的倒谱系数(MFCC)

2.5基频提取

2.6小结

第三章隐马尔可夫模型

3.1隐马尔可夫模型概述

3.2隐马尔可夫模型的参数

3.3训练算法

3.4识别算法

3.5模型的优缺点

3.6小结

第四章随机分段模型

4.1随机分段模型概述

4.1.1时间归整

4.1.2概率模型

4.2识别算法

4.3训练算法

4.4隐马尔可夫模型与随机分段模型比较

4.5线性动态系统声学模型

4.6小结

第五章线性动态系统辨识

5.1最大似然估计

5.2 EM算法

5.3线性动态系统模型

5.4系统辨识EM算法

5.5 EM算法的初值问题

5.6系统辨识仿真

5.7小结

第六章线性动态系统语音识别算法

6.1识别算法

6.2轨迹平滑

6.3上下文建模

6.4实验结果

6.5小结

第七章总结

7.1论文主要贡献

7.2进一步的研究工作

参考文献

致谢

展开▼

摘要

该文在随机分段模型的框架之下,对语音识别中的帧间相关性建模方法进行了深入的研究.主要工作包括:(1)分析了随机分段模型的建模思想,重点研究了基于分段的线性动态系统声学模型.随机分段模型在建模阶段能够充分利用特征之间的动态特性,其对语音信号的数学描述比起HMM来也更显精确.另外,通过大量的实验研究发现,语音帧间的依赖关系可以用线性模型来描述.基于这两方面考虑,线性动态系统分段声学模型可以更好地描述语音信号.(2)实现了线性系统辨识EM算法,提出了一种基于统计分析的算法初始化方法.EM算法是一种很有效的最大似然估计方法.但是,它最大的不足就是收敛速度太慢.加快收敛速度的最直接的方法就是解决算法的初值问题.该文提出的算法初始化方法加快了算法收敛速度,且能保证算法数值稳定.(3)提出了在分段时间归整后再进行轨迹平滑和根据上下文信息用多个模型为一个音节构建两个思想.轨迹平滑体现了线性动态系统的轨迹建模思想.通过考虑音节的上下文信息可以为音节建立更精确的数学模型.实验结果表明,将这两种思想在系统中实现,都可以使识别率有所提高.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号