噪声环境下说话人识别的鲁棒性研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别，又称为声纹识别，是一种基于说话人声音中特征信息自动识别或验证说话人身份的技术。说话人识别技术能够让服务系统通过语音来控制用户对受限的服务（如自动银行服务）、信息资源（取决于用户的访问权限）或区域（如政府或研究机构）的访问权限。此外，还可以用于说话人的检测，如音频档案中基于语音的信息检索、识别犯罪者的取证分析及用户设备的个性化。经过多年的研究，目前的说话人识别系统取得了相当令人满意的成绩。但是，系统在实际应用环境下的噪声鲁棒性问题仍亟待解决，这也是说话人识别技术走向日常应用的一大障碍。本文针对该问题做了以下研究：首先，分析了经过主成分分析处理的伽马通频率倒谱系数特征应用到说话人识别中的噪声鲁棒性。在white、babble和destroyerops不同信噪比的噪声环境下，与梅尔频率倒谱系数特征的系统性能做了全面的分析和比较。此外，将主成分分析算法用于伽马通频率倒谱系数的预处理中，并且对处理后的伽马通频率倒谱系数的性能做了实验分析。实验结果表明，主成分分析在一定程度上提高了伽马通频率倒谱系数在低信噪比条件下的系统表现。随后，对目前在各类评测中表现突出的i-vector/PLDA技术框架做了详细的介绍，论述了i-vector的基本原理及提取过程，G-PLDA模型的因子分析理论及基于该模型的i-vector信道或噪声补偿方法的研究。对i-vector信道补偿方法，如线性区分分析变换、长度规整和数据白化等做了详细描述。最后，本文提出了一种将基于深度神经网络特征映射的回归分析模型应用到i-vector/PLDA说话人系统模型中的方法。深度神经网络通过拟合含噪语音和纯净语音i-vector之间的非线性函数关系，得到纯净语音i-vector的近似表征，达到降低噪声对系统性能影响的目的。在TIMIT数据集上的实验验证了该方法的可行性和有效性。

著录项

作者
张洪冉;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科电子与通信工程
授予学位硕士
导师姓名王昕;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类
关键词
噪声环境; 说话人识别;

相似文献

中文文献
外文文献
专利

1. 噪声环境下的鲁棒性说话人识别 [J] . 白俊梅 ,张世磊 ,张树武 . 中文信息学报 . 2006,第001期
2. 噪声环境下稳健的说话人识别特征研究 [J] . 程小伟 ,王健 ,曾庆宁 . 声学技术 . 2017,第5期
3. 噪声环境下的说话人识别研究 [J] . 包悦 ,游欢 ,周思阳 . 法制与社会 . 2012,第034期
4. 基于噪声环境下的说话人识别系统的研究 [J] . 林秀 ,范茂志 . 科技传播 . 2011,第020期
5. 基于PCANN/PDP混合结构的噪声环境下说话人识别方法的研究 [J] . 夏菽兰 . 盐城工学院学报（自然科学版） . 2008,第002期
6. 噪声环境下基于语音增强的说话人识别 [C] . 董大庆 ,窦慧晶 ,吴朝阳 . 第十四届全国信号处理学术年会 . 2009
7. 噪声环境下鲁棒性说话人识别算法研究 [A] . 崔锐 . 2017

噪声环境下说话人识别的鲁棒性研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅