基于双耳空间信息的语音分离研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音分离技术尤其是基于人耳听觉的语音分离技术，在语音增强、语音识别和助听器等语音信号处理领域具有重要的地位。本文以双耳空间信息为基础，结合语音信号的稀疏性，提出了两种基于双耳定位的语音分离方法:基于时频掩蔽的语音分离和基于压缩感知的语音分离。
　　对于基于空间信息的多声源混合语音分离，论文主要做了以下几方面的工作:
　　(1)分析了双耳定位的语音分离的研究思路。空间听觉是人耳听觉的一个重要特性，多声源环境下，入耳听觉系统首先整合声源的空间信息，经由大脑的中枢神经，进行定位及分离，本文根据该特性，提出了先通过双耳定位算法对多声源进行定位，再根据定位结果进行语音分离的思路。
　　(2)研究了双耳多声源定位算法。通过对耳间时间差和耳间强度差两个声源定位线索进行模型训练，建立方位映射模型，将多声源混合语音进行参数提取，通过耳间时间差与耳间强度差的联合判定，获取多声源定位结果，包括声源个数及其对应的水平面上的角度。实验结果表明，该定位算法对单声源至多声源定位有较高的定位准确度。
　　(3)提出了基于双耳定位结果的时频掩蔽语音分离算法。在多声源环境下，在频域的同一频点，能量最大的声源将掩蔽其它能量较小的声源，最终只有一个信号占主导，本文依据语音信号的频域稀疏性，根据声源定位的结果，将所有时频点都划分为离该时频点距离最近的声源，将每个声源所划分到的时频点进行时域转换，获得该声源的分离信号。基于双耳定位的时频掩蔽语音分离其实验结果要明显优于同类算法。
　　(4)提出了基于双耳定位结果的压缩感知语音分离算法。本文分析了基于双耳的多声源混合模型，其形式与基本的压缩感知模型是相一致的，因此，本文利用双耳定位结果、声源的字典信息和混合语音构建出压缩感知模型，采用正交匹配追踪算法对多声源混合语音进行重构，实验结果表明，语音分离指标SIR、SNR与时频掩蔽方法相比获得有效提高。

著录项

作者
李枭雄;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科信息与通信工程
授予学位硕士
导师姓名周琳;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音信号处理;
关键词
信号处理; 语音分离技术; 时频掩蔽; 压缩感知; 双耳空间信息;

相似文献

中文文献
外文文献
专利

1. 基于深度学习的空间信息保持的双耳语音增强方法 [J] . 孙兴伟 . 网络新媒体技术 . 2019,第006期
2. 基于双耳语音分离和丢失数据技术的鲁棒语音识别算法 [J] . 周琳 ,赵一良 ,朱竑谕 . 声学技术 . 2019,第5期
3. 基于语音个人特征信息分离的语音转换方法研究 [J] . 马振 ,张雄伟 ,杨吉斌 . 信号处理 . 2013,第004期
4. 基于信息极大化的ICA混合语音信号盲分离算法的研究 [J] . 胡津津 . 池州学院学报 . 2011,第003期
5. 基于循环神经网络的双耳助听器语音增强算法 [J] . 朱亚涛 ,陈霏 ,张雨晨 . 传感技术学报 . 2021,第009期
6. 基于深度神经网络的双耳语音增强算法 [C] . FANG Yi ,方义 ,FENG Hai-hong . 中国声学学会2017年全国声学学术会议 . -1
7. 基于深度神经网络的双耳语音分离方法研究 [A] . 林震宇 . 2020

基于双耳空间信息的语音分离研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅