首页> 中文学位 >低信噪比环境下语音端点检测方法的研究
【6h】

低信噪比环境下语音端点检测方法的研究

代理获取

目录

声明

致谢

变量注释表

1 绪论

1.1 课题研究背景及意义

1.2 国内外研究现状

1.2.1 低信噪比环境下特征提取方法的研究现状

1.2.2 低信噪比环境下端点识别方法的研究现状

1.3 本文主要研究内容与章节安排

2 语音端点检测的基本理论

2.1.1 预滤波和采样

2.1.2 预加重

2.1.3 分帧与加窗

2.2 传统的语音特征提取方法

2.2.1 时域特征参数的提取

2.2.2 频域特征参数的提取

2.2.3 时频域特征参数的提取

2.3 语音端点识别方法

2.3.1 双门限法

2.3.2 人工神经网络法

2.4 本章小结

3 低SNR环境下基于谱熵梅尔积的语音特征提取

3.1 引言

3.2 基于谱熵的语音特征提取

3.2.1 谱熵的定义

3.2.2 谱熵特征提取

3.2.3 谱熵的缺点及原因探究

3.3 基于梅尔频率倒谱系数的语音特征提取

3.3.1 MFCC特征提取

3.3.2 MFCC缺点及原因探究

3.4 低 SNR环境下基于 PSEM 的语音特征提取

3.4.1 PSEM的提出

3.4.2 PSEM特征分析

3.5 本章小结

4 低SNR环境下基于Teager能量信息熵的语音特征提取

4.1 引言

4.2 基于 EMD-TEO 的语音特征提取

4.2.1 Teager能量算子

4.2.2 EMD分解

4.2.3 EMD-TEO特征提取

4.3 低 SNR 环境下基于 TEE 的语音特征提取

4.3.1 TEE的提出

4.3.2 TEE特征提取与分析

4.4 本章小结

5 低SNR环境下基于加权排列熵的语音特征提取

5.1 引言

5.2 基于排列熵的语音特征提取

5.2.1 排列熵的定义

5.2.2 排列熵特征提取

5.2.3 排列熵的缺点及原因

5.3 低 SNR 环境下基于 WPE 的语音特征提取

5.3.1 WPE的引入

5.3.2 WPE特征提取与分析

5.4 本章小结

6 基于FCMC和BIC的双门限法与实验验证

6.1 引言

6.2 基于 FCMC 和 BIC 的双门限法

6.2.1 模糊C均值聚类算法

6.2.2 贝叶斯信息准则

6.2.3 门限值估计与端点识别

6.3 语音端点检测实验验证与分析

6.3.1 实验设计

6.3.2 准确率结果与分析

6.4 本章小结

7 总结与展望

7.1 结论

7.2 展望

参考文献

作者简历

学位论文原创性声明

学位论文数据集

展开▼

摘要

国务院下发了《新一代人工智能发展规划的通知》,要求建立新一代人工智能关键共性技术体系,将自然语言处理技术规划在内。语音端点检测作为自然语言处理技术中的关键部分,对其展开研究具有重大意义。针对低信噪比环境下的语音端点检测准确率低的问题,本文提出了三种新的语音端点检测方法,并设计实验验证了其可行性和优越性。 首先介绍了语音信号预处理方法、传统的语音特征提取方法和端点识别方法,为本文的研究提供了理论基础。然后在特征提取部分,提出了三种语音特征提取方法: (1)分析了使用谱熵(SE)和梅尔频率倒谱系数(MFCC)进行语音端点检测效果较差的缺点及原因,并探究了MFCC的第一个分量(MFCC0)对MFCC在语音信号处理中影响,发现MFCC0具有一定程度的语音追踪能力。然后使用MFCC0对SE加权,提出了谱熵梅尔积(PSEM)的概念。最后使用PSEM进行语音信号特征提取,并与SE和MFCC倒谱系数距离对比,证明了PSEM的优越性。 (2)针对基于经验模式分解(EMD)和Teager能量算子(EMD-TEO)的特征提取方法,指出导致其算法耗时长的原因是进行了大量的EMD分解。引入信息熵的概念,并改进概率计算的方式,降低算法复杂度,提高鲁棒性,提出了Teager能量信息熵(TEE)的概念。提取语音信号的TEE特征并与EMD-TEO特征比较,证明了TEE具有较好的实时性和端点检测性能。 (3)探究了传统排列熵(PE)中的概率计算方式对语音端点检测效果的影响,指出PE的概率计算未考虑子序列均值的缺点,使用加权排列熵(WPE)作为语音特征参数提取方法,并通过仿真实验证明了该方法进行语音端点检测的优越性。 在端点识别部分,使用模糊C均值聚类算法(FCMC)和贝叶斯信息准则(BIC)对传统双门限法的高、低门限值自适应估计,使双门限法具有了自适应性。最后,将本文三种特征参数分别与该方法结合,形成三种新的语音端点检测方法。使用TIMIT语音库和NUST603_2014语音库设计对比实验,实验结果证明,在低信噪比环境中,与传统语音端点检测方法相比,本文所提三种方法都具有较高的端点检测准确率。

著录项

  • 作者

    夏令祥;

  • 作者单位

    中国矿业大学;

    中国矿业大学(江苏);

  • 授予单位 中国矿业大学;中国矿业大学(江苏);
  • 学科 控制科学与工程
  • 授予学位 硕士
  • 导师姓名 吴新忠;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 计算技术、计算机技术;
  • 关键词

    低信噪比; 环境; 语音端点;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号