首页> 中文学位 >隐马尔可夫模型在说话人识别中的应用与研究
【6h】

隐马尔可夫模型在说话人识别中的应用与研究

代理获取

目录

文摘

英文文摘

独创性声明及学位论文版权使用授权书

1绪论

1.1语音识别概述

1.2说话人识别概述

1.3说话人识别的方法

2语音信号分析和特征提取

2.1语音信号的产生

2.2语音分析

2.3语音的特征提取

3HMM的基本理论

3.1 HMM基本思想

3.2 HMM的三个基本问题及其基本算法

4HMM算法实现中出现的问题与本文对算法的改进

4.1 αt(i)和βt(i)的下溢(underflow)问题

4.2 VQ算法的编码

4.3初始模型的选取

5HMM在说话人识别系统中的实现

5.1语音分析

5.2训练

5.3实验

5.4数据分析及实验结论

6说话人识别的应用及其发展方向

致谢

参考文献

附录 攻读硕士期间公开发表论文

展开▼

摘要

本文是隐马尔可夫模型在说话人识别中的应用与研究,论文在概述了语音识别的发展和现状的基础上,介绍了说话人识别的声学原理,其中包括语音信号的生成过程及其分析方法,着重阐述了语音信号的倒谱分析方法和LPC倒谱参数。接着详尽介绍了HMM的基本原理以及HMM的三个基本问题——评估问题、训练问题和识别问题,及其相应的基本算法(即前—后向算法、Baum-Welch算法和Viterbi算法)。  在利用HMM进行说话人识别的研究过程中,发现前—后向算法中的αt(i)和βt(i)出现了下溢(underflow)问题,VQ算法分类阈值的不同、码本大小的不同以及初始模型的选取对系统训练模型的建立和识别率的高低都起着至关重要的作用。经过反复实验和详细比对,提出了相应的解决方法,并得出如下结论:(1)前后向算法中αt(i)和βt(i)的下溢,采取增加比例因子的方法可以对其修正;(2)模型λ=(π,A,B)中初值π和A的选取对系统影响不大,而B有较大影响,为了避免初始模型的选择不当,可以采用反复迭代直至收敛的方法,一般只需4~8次迭代即可达到预期效果;(3)VQ算法中分类阈值可以基于霍特林的“主分量分析”方法对LPC倒谱降维后选定。  根据实验过程中出现的问题,运用相应的改进方法对程序进行修正,最后给出了一个文本相关的小样本说话人识别系统,可以取得预期的识别效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号