基于多观测似然比的语音活动检测研究与系统实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音活动检测是指从一段包含语音的信号中准确地确定语音的起始点和终止点的技术。由于语音活动检测对语音分析、语音合成、语音编码和语音识别等技术具有关键作用,所以本文针对语音活动检测的关键技术进行相关研究工作,并且实现一个语音活动检测系统。
　　由于目前的语音活动检测方法众多,而基于多观测似然比特征的语音活动检测具有模型简单和检测性能好等特点,因此本文使用多观测似然比特征进行语音活动检测。首先对语音信号进行分帧,然后对信号进行噪声估计,根据噪声估计的结果计算每一帧的似然比,并将每帧似然比与之前若干帧的似然比共同组成分析样本。
　　在完成特征提取步骤后,我们利用得到的训练样本训练语音活动检测的决策规则。本文使用线性分类器作为决策规则模型,所以问题的重点是如何训练得到合适的线性分类器权值,以使检测尽可能准确。本文介绍了最小分类错误(Minimum Classification Error,MCE)模型、最大化检测结果的ROC曲线下的面积(Maximum Area Undert he ROC Curve,MaxAUC)模型和支持向量机(Support Vector Machine,SVM)模型,并且提出了扩展的MaxAUC模型。实验表明,扩展的MaxAUC模型和SVM模型具有更好的稳定性和检测性能。
　　为了了解语音活动检测系统的真正需求和模块功能,本文对该系统进行了需求分析和系统设计。在需求分析中,列举了系统应该满足的要求,并且将系统分解为信号导入、特征提取、训练和测试四个模块,为了更清晰地表示各个模块之间的关系,本文用数据流图刻画了系统中数据在各个模块之间的传递和加工的过程,使我们对各个模块之间的关系有了更加清晰的认识。在系统设计中,我们首先表示了系统的整体工作过程,然后对于系统的几个重要模块描述了它们的功能、工作流程、参数和返回值。需求分析和系统设计为后续的系统实现和系统测试打下了基础。
　　最后,本文对系统进行了测试,以验证系统的性能和效果。本文分别对系统的噪声估计和几个决策规则模型进行了测试,结果显示,该系统的检测性能良好。

著录项

作者
杨春旺;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名韩纪庆;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备 ;
关键词
语音活动检测; 多观测似然比; 数据流图; 噪声估计; 决策规则;

相似文献

中文文献
外文文献
专利

1. 基于语音卡的语音信箱系统的设计与实现 [J] . 徐琳茜 ,吴开炎 ,赵建涛 . 华北电力大学学报(自然科学版) . 2006 ,第004期
2. 基于电话语音卡的气象信息电话语音自动应答系统的开发与实现 [J] . 陈俐 . 电气传动自动化 . 2006 ,第005期
3. 基于电话语音卡的电话语音系统的设计与实现 [J] . 牛晓华 ,穆道生 ,赵洪利 . 装备学院学报 . 1998 ,第003期
4. 基于四维超混沌系统观测器的语音通讯保密机制的研究 [J] . 陈鹏飞 ,钱以迅 . 通信电源技术 . 2018 ,第001期
5. 基于介电特性的土壤盐渍化实时检测研究及系统实现 [J] . 池涛 ,曹广溥 ,李丙春 . 沈阳农业大学学报 . 2018 ,第004期
6. 基于藏语语音学知识的语音端点检测研究 [C] . 李洪波 ,于洪志 . 第七届中文信息处理国际会议 . 2007
7. 噪声条件下基于MTF概念的CNN编解码器鲁棒语音活动检测研究 [A] . 李楠 . 2020

基于多观测似然比的语音活动检测研究与系统实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅