首页> 中文学位 >基于VQ/HMM的说话人识别方法研究
【6h】

基于VQ/HMM的说话人识别方法研究

代理获取

目录

文摘

英文文摘

引 言

1 语音识别技术

1.1 语音识别的重要意义和目的

1.2 语音识别的发展历史

1.3 说话人识别的方法

1.4 本文的主要工作内容

2 样本收集与预处理

2.1 与文本相关的汉语语音小样本库设计

2.2 语音信号的预处理

2.2.1 预加重

2.2.2 分帧和加窗

2.2.3 语音分割

3 语音信号的特征分析

3.1 语音信号的短时时域处理

3.1.1 短时能量分析

3.1.2 短时平均过零率

3.1.3 短时自相关函数

3.1.4 短时平均幅度差函数

3.2 语音信号的频域处理

3.2.1 短时傅里叶变换

3.2.2 基于听觉特性的Mel频率倒谱系数MFCC

本章小结

4 矢量量化技术(VQ)

4.1 码本设计

4.2 失真测度

4.2.1 欧几里得距离测度和平方差误差测度

4.2.2 加权平方误差测度

4.2.3 倒谱失真测度

5 基于隐马尔可夫模型(HMM)的识别技术

5.1 马尔可夫链

5.2 隐马尔可夫模型(HMM)

5.3 HMM基本算法及模型

5.3.1 前向—后向算法

5.3.2 Baum—Welch算法

5.3.3 viterbi算法

6 语音特征提取过程

6.1 改进的Mel频率倒谱系数特征

6.2 元音的特征提取流程

6.2.1 语音信号的短时能量分析

6.2.2 短时平均过零率分析

6.3 语音信号的频域分析

6.3.1 短时傅理叶频率变换

6.3.2 短时傅里叶频谱分析

6.3.3 Mel频率倒谱系数MFCC

6.4 小样本库的语音信号特征提取过程

本章小结

7 基于VQ和HMM的说话人识别系统

7.1 基于VQ的说话人识系统设计

7.1.1 识别任务

7.1.2 VQ模型的训练过程

7.1.3 识别过程

7.1.4 实验结果与分析

7.2 基于HMM的识别系统设计

7.2.1 识别任务

7.2.2 识别过程

7.2.3 HMM说话人识别系统的模型选择

7.2.4 改进的MFC系数对HMM模型的参数的简化

7.2.5 实验结果与分析

7.3 基于VQ/HMM模型的两级说话人识别实验

7.3.1 识别任务

7.3.2 实验结果

本章小结

8 总结与展望

攻读硕士学位期间学术论文及科研情况

致 谢

参考文献

展开▼

摘要

说话人识别是指通过说话人的语音来自动识别说话人的身份,作为生物证认技术的一种,它在许多领域里有着良好的应用前景和巨大的市场潜力。本文通过分析说话人识别的原理与系统结构,和参考现有的语音识别的技术,研究了语音特征提取过程和识别方法,对语音特征提取进行了改进,并取得了很好的实验结果。
   本文针对汉语语音中的单韵母元音,分割并提取出有声段,再对每个元音按短时能量从低往高提取出一组短时信号,然后再对组信号计算出MFCC。在模式识别中,采用矢量量化和隐马尔可夫模型分别对每一个元音建模,将匹配的结果按设定的逻辑进行判决。
   本文研究了矢量量化和隐马尔可夫模型在语音识别中的原理和方法,主要研究工作如下:
   (1)分析主要的语音特征的特点,研究了基于VQ和HMM模型的语音识别的的特征参数提取方法。
   (2)探讨基于VQ和HMM模型的识别方法的原理,分析了识别的过程,寻找能够简化识别模型和提高识别率的方法。
   (3)通过研究和实践,基于对元音信号分别建模的方法,对MFCC的提取过程进行了改进,并应用到语音识别当中。
   最后对实验结果分析和总结。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号