声明
摘要
图目录
表目录
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.3 本论文主要内容
第二章 基本概念及原理介绍
2.1.1 噪声类型
2.1.2 监督性语音分离
2.1.3 训练目标
2.2 去混晌基本概念及原理
2.3 评价指标
2.3.1 STOI
2.3.2 PESQ
2.4 本章小结
第三章 基于DNN的语音分离与去混晌框架
3.1.1 深度神经网络的发展
3.1.2 深度神经网络的工作机制
3.2 基于深度神经网络的系统框架
3.2.1 时频分解
3.2.2 特征提取
3.2.3 波形合成
3.2.4 神经网络结构设置
3.3 本章小结
第四章 ORM与其他常用训练目标
4.1 优化浮值掩蔽
4.2 其他常用训练目标
4.2.1 傅里叶变换域的理想二值掩蔽(FFT Ideal Binary Mask,IBM_FFT)
4.2.2 傅里叶变换域的理想浮值掩蔽(FFT Ideal Ratio Mask,IRM_FFT)
4.2.3 复数域的理想浮值掩蔽(Complex Ideal Ratio Mask,cIRM)
4.2.4 相敏掩蔽(Phase Sensitive Mask,PSM)
4.3 本章小结
第五章 实验结果及分析
5.1.1 实验数据
5.1.2 实验设置
5.1.3 实验结果与分析
5.2.1 实验数据
5.2.2 实验结果与分析
5.3.1 实验数据
5.3.2 实验结果与分析
5.4 本章小结
第六章 总结与展望
参考文献
致谢
攻读硕士期间录用的学术论文