首页> 中文学位 >噪声环境下说话人识别的鲁棒性研究
【6h】

噪声环境下说话人识别的鲁棒性研究

代理获取

目录

第一个书签之前

展开▼

摘要

说话人识别,又称为声纹识别,是一种基于说话人声音中特征信息自动识别或验证说话人身份的技术。说话人识别技术能够让服务系统通过语音来控制用户对受限的服务(如自动银行服务)、信息资源(取决于用户的访问权限)或区域(如政府或研究机构)的访问权限。此外,还可以用于说话人的检测,如音频档案中基于语音的信息检索、识别犯罪者的取证分析及用户设备的个性化。经过多年的研究,目前的说话人识别系统取得了相当令人满意的成绩。但是,系统在实际应用环境下的噪声鲁棒性问题仍亟待解决,这也是说话人识别技术走向日常应用的一大障碍。本文针对该问题做了以下研究: 首先,分析了经过主成分分析处理的伽马通频率倒谱系数特征应用到说话人识别中的噪声鲁棒性。在white、babble和destroyerops不同信噪比的噪声环境下,与梅尔频率倒谱系数特征的系统性能做了全面的分析和比较。此外,将主成分分析算法用于伽马通频率倒谱系数的预处理中,并且对处理后的伽马通频率倒谱系数的性能做了实验分析。实验结果表明,主成分分析在一定程度上提高了伽马通频率倒谱系数在低信噪比条件下的系统表现。 随后,对目前在各类评测中表现突出的i-vector/PLDA技术框架做了详细的介绍,论述了i-vector的基本原理及提取过程,G-PLDA模型的因子分析理论及基于该模型的i-vector信道或噪声补偿方法的研究。对i-vector信道补偿方法,如线性区分分析变换、长度规整和数据白化等做了详细描述。 最后,本文提出了一种将基于深度神经网络特征映射的回归分析模型应用到i-vector/PLDA说话人系统模型中的方法。深度神经网络通过拟合含噪语音和纯净语音i-vector之间的非线性函数关系,得到纯净语音i-vector的近似表征,达到降低噪声对系统性能影响的目的。在TIMIT数据集上的实验验证了该方法的可行性和有效性。

著录项

  • 作者

    张洪冉;

  • 作者单位

    南京邮电大学;

  • 授予单位 南京邮电大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 王昕;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    噪声环境; 说话人识别;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号