低信噪比环境下语音端点检测方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

国务院下发了《新一代人工智能发展规划的通知》，要求建立新一代人工智能关键共性技术体系，将自然语言处理技术规划在内。语音端点检测作为自然语言处理技术中的关键部分，对其展开研究具有重大意义。针对低信噪比环境下的语音端点检测准确率低的问题，本文提出了三种新的语音端点检测方法，并设计实验验证了其可行性和优越性。首先介绍了语音信号预处理方法、传统的语音特征提取方法和端点识别方法，为本文的研究提供了理论基础。然后在特征提取部分，提出了三种语音特征提取方法： (1)分析了使用谱熵(SE)和梅尔频率倒谱系数(MFCC)进行语音端点检测效果较差的缺点及原因，并探究了MFCC的第一个分量(MFCC0)对MFCC在语音信号处理中影响，发现MFCC0具有一定程度的语音追踪能力。然后使用MFCC0对SE加权，提出了谱熵梅尔积(PSEM)的概念。最后使用PSEM进行语音信号特征提取，并与SE和MFCC倒谱系数距离对比，证明了PSEM的优越性。 (2)针对基于经验模式分解(EMD)和Teager能量算子(EMD-TEO)的特征提取方法，指出导致其算法耗时长的原因是进行了大量的EMD分解。引入信息熵的概念，并改进概率计算的方式，降低算法复杂度，提高鲁棒性，提出了Teager能量信息熵(TEE)的概念。提取语音信号的TEE特征并与EMD-TEO特征比较，证明了TEE具有较好的实时性和端点检测性能。 (3)探究了传统排列熵(PE)中的概率计算方式对语音端点检测效果的影响，指出PE的概率计算未考虑子序列均值的缺点，使用加权排列熵(WPE)作为语音特征参数提取方法，并通过仿真实验证明了该方法进行语音端点检测的优越性。在端点识别部分，使用模糊C均值聚类算法(FCMC)和贝叶斯信息准则(BIC)对传统双门限法的高、低门限值自适应估计，使双门限法具有了自适应性。最后，将本文三种特征参数分别与该方法结合，形成三种新的语音端点检测方法。使用TIMIT语音库和NUST603_2014语音库设计对比实验，实验结果证明，在低信噪比环境中，与传统语音端点检测方法相比，本文所提三种方法都具有较高的端点检测准确率。

著录项

作者
夏令祥;
展开▼
作者单位

中国矿业大学;

中国矿业大学(江苏);

展开▼
授予单位中国矿业大学;中国矿业大学(江苏);
学科控制科学与工程
授予学位硕士
导师姓名吴新忠;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;
关键词
低信噪比; 环境; 语音端点;

相似文献

中文文献
外文文献
专利

1. 一种低信噪比环境下的语音端点检测方法研究 [J] . 周晓海 ,王民 ,毛力 . 现代电子技术 . 2009,第010期
2. 低信噪比环境下语音端点检测改进方法 [J] . 王瑶 ,曾庆宁 ,龙超 . 声学技术 . 2018,第5期
3. 低信噪比环境下语音端点检测技术 [J] . 韦莎丽 ,王健 ,曾庆宁 . 计算机工程与设计 . 2020,第009期
4. 低信噪比环境下改进的新能零熵语音端点检测 [J] . 黄镇坤 ,章小兵 ,朱俞清 . 微电子学与计算机 . 2020,第6期
5. 一种低信噪比环境下的语音端点检测算法 [J] . 卜玉婷 ,曾庆宁 ,郑展恒 . 声学技术 . 2020,第5期
6. 一种低信噪比环境下的压缩感知稀疏图像的重建方法 [C] . GUOWei-Jia ,郭伟佳 ,ZHANGChun-Yang . 第九届卫星通信学术年会 . 2013
7. 低信噪比环境下语音端点检测方法研究 [A] . 王纲金 . 2011

低信噪比环境下语音端点检测方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅