首页> 中文学位 >基于序贯字典学习的单通道语音分离算法研究
【6h】

基于序贯字典学习的单通道语音分离算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 研究历史与现状

1.3 本文的主要研究内容与基本结构

第二章 基于字典学习的单通道语音分离算法

2.1 基于字典学习的单通道语音分离算法基本原理

2.2 基于非负矩阵分解的单通道语音分离算法

2.3 基于概率潜在成分分析的单通道语音分离算法

2.4 基于区分性字典学习的单通道语音分离算法

2.5 本章小结

第三章 基于序贯字典学习的单通道语音分离算法

3.1 引言

3.2 基于序贯字典学习的单通道语音分离算法

3.2.1 序贯字典结构及训练过程

3.2.2 分离过程

3.3 算法仿真分析

3.3.1 语音分离评价指标及实验条件

3.3.2 分离性能随参数的变化

3.3.3 与传统算法的对比

3.4 本章小结

第四章 语音后处理

4.1 引言

4.2 自适应分离

4.3 基于掩码滤波和谐波重建的语音后处理技术

4.3.1 掩码滤波器

4.3.2 谐波重建

4.4 算法仿真分析

4.5 算法推广

4.6 本章小结

第五章 总结与展望

5.1 本文的主要工作

5.2 进一步的研究方向

参考文献

致谢

攻读硕士学位期间的研究成果

展开▼

摘要

语音分离作为一种可以从混合语音中获得源语音的有效手段,受到越来越多的关注。现有的智能电子终端设备中的麦克风数目往往少于声源数目,极端情况下往往只有一个麦克风。因此单通道语音分离技术变得越来越重要。
  近年来字典学习算法越来越多的被用来解决单通道语音分离问题。基于字典学习的单通道语音分离算法假设不同声源具有其独特的成分,所以不同的声源可以用不同的字典进行稀疏表示。但是语音作为一种短时平稳信号,在处理时需要对其加窗截断,而截断之后的不同声源的语音信号的相关性大大增加,进而导致了不同声源具有了相似的成分。本文以此为出发点,提出了一种基于序贯区分性字典学习的单通道语音分离算法以及用于提高分离之后语音质量的语音后处理框架。本文主要内容与创新点如下:
  1.联合利用不同源语音的独特成分与相似成分,并构造了基于序贯思想的多层具有区分性的字典,在每一层中字典分为区分性子字典以及缓冲子字典。在训练阶段,我们通过构建合理的目标函数来确保各个源语音的独特成分尽可能多的分布在与之对应的区分性子字典中,相似成分则尽可能多的分布在缓冲子字典中。而分布在缓冲子字典中的成分则作为下一层字典的训练样本。在分离阶段,首先分离出当前层各个源语音的独特成分,其相似成分则在下一层中进行分离,直至混合语音得到完全分离。实验结果表明,基于序贯字典学习的单通道语音分离算法能够有效地降低分离之后语音之间的相互混淆。
  2.由于分离之后的语音仍然混杂着其他声源而且存在一定程度的失真,因此我们构建了包含三个子模块的语音后处理框架。这三个子模块分别为:降低训练集与测试集不匹配的自适应分离模块、降低分离之后语音相互干扰的时频掩码滤波模块以及降低语音失真的谐波重建模块。实验结果表明,通过该后处理框架,分离之后的语音质量得到了有效的改善。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号