首页> 中文学位 >基于非线性方法的语音信号前端处理研究
【6h】

基于非线性方法的语音信号前端处理研究

代理获取

目录

封面

声明

声明

中文摘要

目录

第一章 绪论

1.1课题研究背景及意义

1.2两种非线性方法

1.3本文主要内容及结构安排

第二章 语音信号的特征分析基础

2.1短时分析技术

2.2语音信号时域分析

2.3语音信号频域分析

2.4小结

第三章 语音的混沌特征

3.1混沌与奇异吸引子

3.2汉语语音的混沌特征

3.3小结

第四章 基于混沌方法的语音信号VAD

4.1伪最近邻点比例

4.2基于混沌方法的VAD算法

4.3仿真结果与讨论

4.4小结

第五章 小波去噪研究

5.1小波变换基础理论

5.2多分辨率分析与Mallat算法

5.3一维小波去噪基本原理

5.4小结

第六章 改进前端处理算法

6.1基于混沌VAD和小波去噪的前端处理改进算法

6.2细节处理

6.3仿真结果与讨论

6.4小结

第七章 总结与展望

7.1研究工作总结

7.2研究工作展望

参考文献

致谢

攻读硕士期间发表的论文

展开▼

摘要

语音交流是最方便简单的通讯手段,但现实中的语音却会不可避免地受到环境噪声的影响。语音信号前端处理就是针对染噪语音信号所进行的包括端点检测和语音增强等有效手段。它的目的是尽可能地从输入染噪信号中提取有声语音段并改善其质量和可懂度,使人类易于接受。传统的技术多是基于线性系统理论,也取得了一定的效果,但对被强白噪声污染的语音信号的处理并不十分理想。近年来有研究表明语音信号是非线性过程,因此使用混沌方法会更加接近其物理本质;另外,发展很活跃的小波理论也将会在语音信号处理中占有越来越重要的地位。
  本文将混沌与小波这两种非线性处理工具相结合,对加性白噪声下的语音信号前端处理做了较为仔细的讨论,包括两个主要内容:基于混沌方法的端点检测和基于小波变换的增强,其中前者是后者的基础。
  (1)本文前半部分首先探讨了基于短时能频积的端点检测和基于短时傅里叶变换的谱减法去噪的不足;接着深入研究了语音信号的非线性特征,通过重构相空间,从关联维数和最大李亚普诺夫指数两个角度同时定量说明了语音信号是具有混沌性质的时间序列,因而可以用混沌手段对其进行处理;然后通过仿真发现语音信号和白噪声的伪最近邻点比例具有一定的差异,从而提出一种逐帧计算伪最近邻点比例并设定阈值进而判断有声段起止点的端点检测方法。
  (2)本文后半部分针对语音信号自身的特点对传统一维小波去噪进行了适当地改进,并讨论了不同小波基函数和分解层数的选取对去噪结果的影响。使用混沌端点检测方法区分出有声段和无声段之后,选择Coiflet5小波基函数把语音信号进行5层小波分解,得到各层小波系数;把无声段的小波系数全部置为0,接着对有声段进行清浊音分割,根据它们不同的性质,对清音和浊音分别采取不同的阈值方案进行软阈值去噪;最后再把新的小波系数进行逆变换,重构得到增强后的语音信号。
  结果表明,此前端处理方法能有效提高输出信噪比,改善了听觉效果,并且彻底克服了音乐噪声。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号