首页> 中文学位 >基于Mel倒谱技术的声纹识别
【6h】

基于Mel倒谱技术的声纹识别

代理获取

目录

摘要

第一章引言

1.1声纹识别的发展趋势

1.2声纹识别的意义

第二章声纹识别

2.1声纹及声纹识别的概念

2.1.1声纹

2.1.2声纹识别的概念

2.2声纹识别的分类

2.3声纹识别与语音识别

2.4声纹识别的性能评价

2.5国内外在声纹识别领域的研究现状

第三章声纹识别的原理

3.1语音产生模型

3.1.1语音的产生过程

3.1.2语音感知

3.1.3语音信号的数字模型

3.2语音信号的预处理

3.2.1语音信号的采样与量化

3.2.2预加重

3.2.3加窗

3.2.4端点检测

3.3说话人的特征提取

3.3.1 MFCC

3.3.2 MFCC计算

3.3.3标准MFCC改进

3.4说话人模型

3.4.1 Markov链

3.4.2隐马尔可夫模型

3.4.3 HMM的三个基本问题及其求解算法

3.4.4隐马尔可夫模型的类型

3.4.5 HMM算法实现中的问题

第四章实验和结论

4.1实验条件

4.2实验步骤

4.2.1语音录制

4.2.2预处理

4.2.3特征提取

4.2.3声纹识别模型

4.3实验结果

4.3.1高斯混合度对识别率的影响

4.3.2待识别语音的长短对识别率的影响

4.3.3说话人个数对识别率的影响

第五章总结和展望

致谢

参考文献

附录

原创性声明及关于学位论文使用授权的声明

展开▼

摘要

随着信息技术的发展,人们的交互手段越来越多样化,对身份鉴别的要求随之越来越高。生物认证技术基于人们自身的生理和行为特征进行身份鉴别,以其独特的优势,日益显示出它的价值。声纹识别技术被认为是最自然的生物认证技术,它是一项根据语音中反映的说话人生理和行为特征的语音参数,自动识别说话人身份的技术。近年来,声纹识别技术己成为研究领域的一大热点。与此同时,这一技术也存在着许多问题,集中于怎样从语音信号中提取尽量多与身份相关且比较稳定的特征信息,以及怎样进行改进特征提取的方法,使其针对现有的特征能得到更好的识别结果。  本文所要介绍的工作是文本无关的声纹识别,声纹识别的第一步就是对语音信号进行特征参数的提取与分析,因此提取的特征参数的好坏,直接影响到识别结果。本文从语音中提取MFCC和△MFCC,并采用HMM模型的方法建立模板库进行声纹识别。  从人耳的掩蔽效应出发,人们提出了临界频带的概念和人耳的等效滤波器组。用等效滤波器组来改进倒谱系数的提取方法,就得到了MFCC。MFCC采用了一种非线性的频率单位,以模拟人的听觉系统。  MFCC是一种代表频谱的静态参数,而频谱的动态特征也被认为能够影响人的听觉感受。从MFCC对时间的一阶导数,我们得到了△MFCC。MFCC以及从MFCC推演得到的△MFCC是一种非常优越的特征参量。它们之间的权重关系我们也做了相应地讨论。本文提出了一种MFCC的改进方法,通过加权,以突出说话人特征。  隐马尔可夫模型在声纹识别中广泛使用的识别方法,关于它的研究还很多,本文采用了此模型,并通过实验表明,该模型具有较好的识别性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号