首页> 中文学位 >基于小波包变换的说话人识别特征参数提取算法研究
【6h】

基于小波包变换的说话人识别特征参数提取算法研究

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究的现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 本文主要工作

1.4 本文的组织结构

第2章 说话人识别技术的研究

2.1 说话人识别基本介绍

2.1.1 说话人识别的概念

2.1.2 说话人识别的原理

2.1.3 说话人识别的性能评估

2.2 说话人识别的特征提取

2.2.1 说话人识别的特征提取准则

2.2.2 常用的特征参数

2.2.3 特征参数的评价方法

2.2.4 语音信号的分析方法

2.2.5 LPCC特征参数提取

2.2.6 MFCC特征参数的提取

2.3 说话人识别模型

2.3.1 说话人识别模型匹配方法

2.3.2 高斯混合模型

2.3.3 最大似然估计

2.3.4 基于GMM的说话人识别系统

2.4 小结

第3章 小波分析和小波包变换

3.1 小波分析

3.1.1 小波分析概述

3.1.2 母小波

3.1.3 连续小波变换

3.1.4 离散小波变换

3.2 多分辨率分析

3.3 小波包变换

3.4 常用小波函数

3.5 小结

第4章 基于小波包变换的特征提取算法

4.1 MFCC的缺点

4.2 小波包变换

4.3 改进的特征参数newMFCC提取过程

4.4 频谱重心

4.5 newMFCC和频谱重心的提取过程

4.6 仿真实验

4.6.1 实验设置

4.6.2 实验一结果

4.6.3 实验二结果

4.6.4 实验三结果

4.6.5 实验结果分析

4.7 小结

第5章 基于Teager能量算子的特征提取算法

5.1 噪音的处理方式

5.2 小波去噪

5.3 Teager能量算子

5.4 改进的特征参数newMFCC2的提取过程

5.5 仿真实验

5.5.1 实验设置

5.5.2 实验一结果

5.5.3 实验二结果

5.5.4 实验三结果

5.5.5 实验结果分析

5.6 小结

结论

参考文献

附录A 攻读学位期间发表的论文

致谢

展开▼

摘要

随着互联网技术的发展,语音特征已经成为计算机处理的一种重要资源。传统的文字、图像等信息处理虽然在某些领域有很大的市场,但是在某些领域文字、图像等信息的处理却不能反映个体的特征,对个体的认证也有局限性。说话人识别是一种通过对人的语音信号进行提取、分析,然后判断说话人是谁的技术。说话人识别技术在某些领域能通过对不同信号的差异性进行分析来达到区分人与人之间这种差异性,从而实现个体的认证。随着技术发展,其应用场景将进入通信、互联网、医疗、消费电子等各种领域。因此,对说话人识别进行研究有很大的意义。
  本文以MFCC特征参数提取过程为基础,将小波包变换技术和Teager能量算子运用到特征参数提取过程中,重点研究基于小波包变换的说话人识别过程,以及基于小波包变换与能量算子的说话人识别过程。论文主要工作如下:
  首先对说话人识别技术进行介绍,然后对常用的几种说话人识别技术进行阐述,并对一种传统的基于MFCC的计算方法分析优点与缺点。此外,对小波包变换的理论、原理进行了分析和介绍。
  提出了一种基于小波包变换的特征参数提取算法。详细分析了MFCC的优缺点,将小波包变换应用到MFCC提取过程中去,用小波包变换替代快速傅里叶变换和Mel滤波器组,从而能很好的反映信号非平稳、持续短、时域和频域局部化等特征,同时又解决了Mel滤波器组高频部分精度不高的问题,最后得到新特征参数newMFCC,与频谱重心结合得到组合特征参数,并且用差分参数作为特征参数作为比对,并通过仿真实验证明改进算法有更好的识别效果。
  提出了一种小波包变换与Teager能量算子结合的特征参数提取算法。分析了噪音环境下MFCC的不足,同时结合Teager能量算子在语音增强下的表现,将Teager能量算子运用到之前的小波包变换的特征提取算法中。构建了新的提取算法过程,得到了新特征参数newMFCC2,最后仿真实验证明了在噪音环境下该算法有更好的识别结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号