鲁棒的双耳语音分离算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音分离的研究在语音通信、信号增强等领域有着重要意义。语音分离作为语音信号处理的前端模块，其性能的好坏直接决定整个语音系统的性能优劣。基于人的双耳听觉机制，双耳语音分离比单声道语音分离有着更加鲁棒的特性。因此，本文探讨鲁棒的双耳语音分离问题，基于空间线索和时频分析特性，提出了多声源混合语音的双耳语音分离算法。论文提出的算法包括两个方面:基于改进DUET(Degenerate Unmixing Estimation Technique)算法的平滑分离技术、基于计算机听觉场景分析CASA(Computational Auditory Scene Analysis)的子带分离算法。
　　(1)基于DUET算法的平滑技术。传统的DUET分离算法基于语音信号的频域稀疏性，生成不同声源语音的二值掩膜，然而，这种硬编码的方式会产生目标声源频域频点成分丢失的问题。本文提出构建概率形式的掩膜，利用两种思路实现软编码。一种是基于Gammatone滤波器组的子带平滑，利用已有的二值掩膜和子带的频谱函数，计算各个子带的比重系数，推导出每个时频点的软编码值。另一种是基于Sigmoid函数的平滑，Sigmoid函数对于分布概率密度函数呈倒钟形的信号有着优秀的拟合能力，将候选方位的匹配距离转换成分离语音的软编码形式的掩膜。本文采用PES Q(Perceptual Evaluation of Speech Quality)值作为评价指标，仿真实验表明两种平滑技术在多种环境下均能取得了鲁棒的提升。
　　(2)基于计算机听觉场景分析CASA的子带分离算法。混合语音经过子带滤波和分帧加窗，得到时频单元，即T-F(Time-Frequence)单元。双耳语音分离问题演变成T-F单元的归属问题。本文提出两种算法得到T-F单元的掩膜矩阵。其一为基于核密度估计KDE(Kernel Density Estimation)的生成模型。训练阶段，利用核密度估计函数计算得到不同方位角各个子带的特征分布的概率密度函数库，测试阶段，通过比较混合语音的T-F单元的特征矢量在不同角度的概率密度大小，确定T-F单元的归属;其二为基于支持向量机SVM(Support Vector Machine)的判别模型。这里将双耳语音分离问题看成多分类问题，在特征空间，训练一个SVM多分类器，从而计算混合语音的T-F单元对应的特征矢量的归属。两种算法采用的双耳特征均为耳间时间差ITD(Interaural Time Difference)和耳间强度差IID(Interaural Intensity Difference)。本文采用HIT-FA(HIT rate minus False-Alarm rate)和SDR(Source to Distortion Ratio)、SAR(Sources to Artifacts Ratio)、SIR(Source to Interferences Ratio)为评价指标，实验结果显示，两种基于子带的分离算法与实验室已有的算法相比，均有显著提高。

著录项

作者
徐耀;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科信息与通信工程；信号与信息处理
授予学位硕士
导师姓名周琳;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音信号处理;
关键词
语音分离; 双耳语音分离算法; 空间线索; 时频分析特性;

相似文献

中文文献
外文文献
专利

1. 基于双耳语音分离和丢失数据技术的鲁棒语音识别算法 [J] . 周琳 ,赵一良 ,朱竑谕 . 声学技术 . 2019,第5期
2. 基于子带信噪比估计和软判决的鲁棒双耳声源定位算法 [J] . 周琳 ,赵小燕 ,程旭 . 东南大学学报（自然科学版） . 2015,第004期
3. 麦克风自适应算法在鲁棒语音合成中的应用研究 [J] . 李娜 ,李琳琳 ,王永远 . 中国科技信息 . 2013,第011期
4. 鲁棒的数字语音取证算法 [J] . 师春灵 ,钱清 . 计算机工程与设计 . 2021,第009期
5. 基于麦克风阵列的嘈杂环境下的鲁棒语音增强算法 [J] . 李连 ,李铌 . 电子制作 . 2020,第015期
6. 基于双耳相干函数的鲁棒时延差估计与混响抑制算法 [C] . 方义 ,陈友元 ,牟宏宇 . 第十四届全国人机语音通讯学术会议 . 2017
7. 基于双耳声源定位的鲁棒语音分离研究 [A] . 束佳明 . 2016

鲁棒的双耳语音分离算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅