首页> 中文学位 >基于小波变换的声纹参数提取方法与实现
【6h】

基于小波变换的声纹参数提取方法与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题研究的目的及意义

1.2 国内外研究现状及发展趋势

1.3 本论文的内容安排

第2章 常用的声纹参数提取方法研究

2.1 声纹识别的特征参数简介

2.2 线性预测参数提取方法

2.3 线谱对参数提取方法

2.4 线性预测倒谱参数

2.5 Mel频率倒谱系数

2.6 本章小结

第3章 小波变换在语音识别中的应用

3.1 小波分析简介

3.2 小波变换在滤波方面的应用

3.3 小波去噪在语音识别中的应用

3.4 基于小波变换的端点检测

3.5 小波变换在声纹参数提取中的应用

3.6 本章总结

第4章 基于小波变换的声纹参数提取新方法

4.1 小波包分解原理

4.2 MFCC参数

4.3 基于小波变换的WPT参数提取

4.4 本章小结

第5章 改进算法的仿真实验及性能分析

5.1 基于矢量量化的说话人识别

5.2 实验系统及算法实现

5.3 实验结果及算法分析

5.4 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

在声纹识别系统中,能否提取到精准的声纹参数至关重要,因为它直接影响整个系统的识别率。而传统的最为广泛应用的MFCC参数虽然是模仿人耳的听觉特性提出来的,但它却忽略了语音信号的动态特性。而小波变换因其不会受到短时平稳假设的约束,以及良好的动态特性,所以更符合人耳的听觉特性。因而可以被应用到对语音信号的处理方面,因此本文提出了一种基于小波变换的声纹参数提取方法(WPT参数法)。
  对于文本无关的声纹识别系统,为了更突出说话人的声纹特征,克服说话内容不同对提取声纹参数的影响,在分帧阶段采用帧长为2560点,增长有效语音段。并通过仿真对比一帧语音信号的WPT参数与MFCC参数,得出16个MFCC参数中,只有前面约七、八个值比较明显外,后面的值都非常小,趋于零,不利于刻画说话人的特征。相反,16个WPT参数变化比较大,更有利于描述不同说话人的特征。可见相比于MFCC参数,MFCC参数更好地表征了语音特征参数随时间的动态变化特性,从而有利于提高识别率。为了更进一步验证性能,再分别进行16维MFCC参数和WPT参数前10帧仿真实验。明显地发现,通过与MFCC参数仿真图对比,各帧之间WPT参数的形状更相似,即表示的特征更接近。因此,WPT参数用于说话人识别时要优于MFCC参数。
  在MATLAB平台上,用基于矢量量化(VQ)的声纹识别系统进行实验来分别验证所提取到的参数的识别率,并通过比较常用的db3、db4、db6、coif3小波函数选取最优基。实验证明,相对于常用的256点帧长,帧长为2560点的识别率较高且提高了运算速率。coif3小波函数为声纹参数提取的最优基。新的WPT参数的识别率优于传统的MFCC参数。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号