单通道语音分离关键技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着智能手机的普及，人机语音交互技术又一次迎来了发展的机会，如何让人机语音交互变得方便高效成为近年来的研究热点。语音分离作为人机语音交互技术中的核心问题，是自动语音识别、语言自动翻译、说话者识别等技术的有力支撑。由于很多人机语音交互的实际应用场景中只有一个语音输入设备，单通道语音分离技术受到许多研究人员的关注。
　　以听觉场景分析理论为基础，研究人员提出了基于计算听觉场景分析的单通道语音分离系统。这种语音分离系统的处理过程与人类听觉系统感知语音信号的过程类似，经过不断的改进，取得了较好的分离效果。
　　本文对计算听觉场景分析的相关理论和算法进行了研究，详细的介绍了目前比较先进的Hu-Wang系统。并在Hu-Wang提出的单通道语音分离系统的基础上，提出了一些改进方法，本文主要的创新点如下：
　　1.本文通过使用数学形态学图像处理技术，对CASA系统进行初步浊音分段得到的二值掩码图进行了改进。传统的CASA系统使用固定的阈值来进行浊音的初步分段，导致得到的二值掩码图中包含了残余的噪声和破损的语音。CASA系统后续的基音检测和组合过程都是以这个二值掩码图为基础的，不准确的二值掩码图会严重的影响CASA系统的语音分离结果。本文利用数学形态学图像处理技术，在二值掩码图的高频区域利用开运算消除噪声，在低频区域利用闭运算修补目标语音。实验表明，该方法能有效的提高初步浊音分段结果中目标语音信号的比例。
　　2.针对Hu-wang串联语音分离系统在控制迭代过程中的不足，本文提出了一种基于语音客观评价算法改进迭代过程的方法。具体的做法是，对每一次迭代的结果，都经过后续的处理过程形成语音文件，将语音文件进行p.563语音质量检测，通过语音质量检测的结果来决定是否需要再次进行迭代。实验证明利用语音客观评价方法控制迭代流程要比传统方式更好。第一，客观语音质量评价算法可以根据每次迭代后目标语音的MOS-LQP评分值来控制迭代过程，让整个语音分离系统能够适用于不同的使用场景和不用的需求。第二，Hu-Wang系统中将数据是否收敛作为终止迭代系统的一个指标，而语音的客观评价标准比这个指标更具有权威性，更适合用来控制迭代流程。

著录项

作者
何求知;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机应用技术
授予学位硕士
导师姓名郝玉洁;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音参数编码;蜂窝式移动通信系统（大哥大、移动电话手机）;
关键词
计算听觉场景; 语音分离系统; 音质客观评价; 基音跟踪; 人机语音交互; 二值掩码图;

相似文献

中文文献
外文文献
专利

1. 基于注意力机制的单通道双人语音分离研究 [J] . 周晓东 ,陈人楷 ,孙华星 . 通信技术 . 2020,第004期
2. 基于非负矩阵分解和长短时记忆网络的单通道语音分离 [J] . 崔建峰 ,邓泽平 ,申飞 . 科学技术与工程 . 2019,第012期
3. 基于深度神经网络的单通道语音分离算法 [J] . 梁尧 ,朱杰 ,马志贤 . 信息技术 . 2018,第007期
4. 基于盲源分离的单通道语音增强算法探究 [J] . 屈赵燕 . 产业与科技论坛 . 2016,第003期
5. 基于奇异谱分析的盲源分离单通道语音增强算法研究 [J] . 葛勇 ,樊雯 ,刘慧龙 . 军械工程学院学报 . 2014,第001期
6. 基于NMF和FCRF的单通道语音分离算法 [C] . Li Xu ,李煦 ,Tu Ming . 第十三届全国人机语音通讯学术会议 . 2015
7. 单通道语音增强和分离 [A] . Rizwan Ullah . 2021

单通道语音分离关键技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅