首页> 中文学位 >基于麦克风阵列的非线性滤波语音端点检测算法研究
【6h】

基于麦克风阵列的非线性滤波语音端点检测算法研究

代理获取

目录

声明

摘要

符号、缩写与专有名词含义清单

第一章 绪论

1.1 语音端点检测研究的背景及意义

1.2 语音端点检测技术的发展和研究现状

1.3 语音增强算法的发展及研究现状

1.4 本文的主要工作及安排

第二章 语音信号端点检测知识及算法

2.1 语音信号的数字化与预处理

2.1.1 语音信号的产生和传播过程

2.1.2 语音信号的预滤波

2.1.3 语音信号的采样与量化

2.1.4 语音信号的预加重

2.1.5 短时分帧加窗处理

2.2 语音信号处理中常用的音频特征

2.2.1 短时能量分析

2.2.2 短时平均过零率分析

2.2.3 短时信息熵分析

2.2.4 语谱图分析

2.3 影响语音信号端点检测的因素以及噪音分类

2.3.1 影响语音信号端点检测的因素

2.3.2 噪声的分类

2.3.3 人耳的感知特性

2.4 本章小结

第三章 基于Legendre非线性拓展的自适应滤波

3.1 自适应滤波系统

3.1.1 滤波器

3.1.2 滤波算法

3.2 自适应滤波系统改进

3.2.1 经典麦克风阵列语音增强方法

3.2.2 固定波束形成方法

3.2.3 基于非纷}生函数扩展的神经网络

3.2.4 基于麦克风阵列的非线性自适应滤波

3.2.5 滤波算法的改进

3.3 实验仿真结果与分析

3.4 语音质量的评价标准

3.4.1 主观评价方法

3.4.2 客观评价方法

3.5 本章小结

第四章 基于自适应非线性滤波的语音端点检测方法

4.1 传统语音端点检测流程

4.2 基于短时能量和短时过零率的双门限改进端点检测方法

4.2.1 传统双门限法

4.2.2 语音信号的平滑处理

4.2.3 传统线性滤波语音端点检测

4.3 实验数据采集及其分析

4.3.1 数据采集环境概述

4.3.2 数据采集器材

4.3.3 数据分析

4.4 本章小结

第五章 基于非线性滤波的Teager能零比端点检测算法

5.1 EMD的基本概念

5.1.1 瞬时频率

5.1.2 基本模式分量

5.2 EMD的基本原理

5.3 Teager能零比语音端点检测算法

5.4 基于改进非线性滤波的Teager能零比算法

5.5 本章小结

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士学位期间主要科研成果

展开▼

摘要

随着人们生活水平的提高和科学技术的发展,“人工智能”这一概念被越来越多的人所知晓。语音识别是人工智能中非常重要的技术环节,只有机器能够更好地读懂人的语音,才能显得更加“智能”。
  在语音识别中,语音端点检测技术越来越受到人们的重视,因为端点检测正确与否直接影响到后端语音识别的效率和正确率。在语音信号端点检测中,传统的检测方法在低信噪比环境下识别率会下降。为提高识别率和检测方法的性能,本文着重研究了基于麦克风阵列自适应非线性滤波语音端点检测方法,主要研究包括:
  (1)针对传统端点检测算法在语音信号信噪比较低情况下识别率就大幅下降的问题,研究了基于麦克风阵列的线性滤波语音端点检测结构。通过基于麦克风阵列的语音增强改进算法,实现了对语音的初步去噪,这使得整个端点检测的正确率提高了近10%。
  (2)针对语音对话环境中,背景噪音很多是短时稳定或者非稳定的情况,研究了将Legendre非线性拓展函数应用于滤波器结构中,这样能使得语音增强算法能更好地去除背景噪音中的非线性成分,从而加强端点检测算法的自适应性能和鲁棒性。
  (3)针对在背景非相干噪声影响下短时过零率和短时能量值对端点检测准确率造成误判或者漏检的情况,研究了基于EMD分解后Teager能量值和短时过零率参数融合的语音端点检测算法,并通过比较不同背景噪音环境下的端点检测准确率,验证了所提出的算法比传统算法具有更好的鲁棒性和抗噪性能。
  (4)通过在南京信息工程大学消音室中录制的人声语音,并且与NOISEX-92噪声库中的背景噪音结合,模拟了实际环境,对算法的自适应性进行了验证,同时通过主观评价PESQ得分和客观评价SNR来更好地对所提出的算法性能进行了判定。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号