首页> 中文学位 >基于稀疏表示和深度学习的单通道语音信号分离技术研究
【6h】

基于稀疏表示和深度学习的单通道语音信号分离技术研究

代理获取

目录

第一个书签之前

展开▼

摘要

盲源分离是指在信源特性和混合过程均未知或部分未知的情况下,仅根据源信号的某些先验特性,从观测信号(也被称为混合信号)中恢复出源信号的过程。当观测信号仅有一路时称之为单通道盲源分离。目前,基于稀疏表示的单通道盲源分离算法取得了一定的研究成果,但仍然存在一些不足。基于稀疏表示求解该问题涉及到了冗余字典构造和优化算法的运用,具有极高的理论意义,同时,单通道盲源分离广泛应用于现实生活中,对该问题的研究具有很大的实用价值。 本文深入研究了语音信号稀疏表示理论以及现有的基于稀疏表示的单通道语音信号分离算法。在此基础上,分析了“交叉投影”问题产生的原因,提出了含公共子字典的联合字典构造方法,给出了基于该联合字典的混合语音分离算法。文章尝试了把深度学习技术引入到盲源分离问题当中,实现了基于深度神经网络的异性说话人双输出混合语音分离模型,取得了较好的分离效果。本文的主要研究内容和创新成果包括: (1)介绍了信号的稀疏表示理论,阐述了基于稀疏表示理论的单通道盲源分离算法的基本原理,详述了语音信号预处理的步骤,介绍了了衡量语音信号分离的评价指标。在这个基础上,文章进行了实验仿真,实现了基于稀疏表示的异性说话人混合语音分离。 (2)提出了基于含公共子字典的联合字典的单通道盲源分离方法。文章对传统的基于稀疏表示的单通道盲源分离方法存在的“交叉投影”问题进行了探索性的研究,从理论和实验上验证了由于字典训练集之间存在相似成分,导致联合字典区分性较差,影响了分离效果。基于这一结论,文章提出了含公共子字典的联合字典构造方法,通过引入公共子字典使得源信号中相似的成分投影到公共子字典上,同时减小了字典间的干扰,克服了“交叉投影”问题。文章给出了基于含公共子字典的联合字典求解单通道盲源分离问题的详细算法。最后,进行了实验仿真,验证了这一新方法的有效性,并对实验结果的影响因素进行了分析。 (3)提出了基于深度学习的异性说话人混合信号分离模型。为了进一步提高分离信号的质量,文章使用了当前非常热门的在语音信号处理领域应用很广泛的深度学习技术。系统的介绍了深度神经网络的理论知识,包括深度神经网络结构、网络的训练算法。搭建了基于深度神经网络的异性说话人双输出混合语音分离模型。通过实验验证了这一模型的有效性,并对实验结果影响因素进行了分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号