首页> 中文学位 >信道鲁棒的文本无关说话人识别及应用
【6h】

信道鲁棒的文本无关说话人识别及应用

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 文本无关说话人识别研究及应用现状

1.3 信道鲁棒技术研究现状

1.4 本文主要工作

1.5 本文结构安排

第二章 信道鲁棒的说话人识别系统概述

2.1 引言

2.2 说话人识别系统的基本结构

2.2.1 分贝归一化

2.2.2 有效语音检测

2.2.3 特征提取

2.2.4 通用背景模型-高斯混合模型的说话人识别系统

2.3 说话人识别中的信道鲁棒算法

2.3.1 特征域上的信道鲁棒算法

2.3.2 模型域上的信道鲁棒算法

2.3.3 得分域上的信道鲁棒算法

2.4 本章小结

第三章 基于迁移学习的说话人识别

3.1 引言

3.2 稀疏表示

3.2.1 稀疏表示理论

3.2.2 基于稀疏表示的说话人识别系统

3.2.3 跨信道算法与稀疏表示

3.3 无监督迁移分量分析

3.3.1 最大均值距离准则

3.3.2 核主成分分析

3.3.3 UTCA降维

3.3.4 跨信道与UTCA

3.4 本章小结

第四章 实验结果与分析

4.1 实验数据

4.2 UBM-GMM

4.3 GMM-SVM

4.4 SR

4.5 UTCA

第五章 说话人识别应用实例

5.1 引言

5.2 110防骚扰电话系统

5.2.1 项目意义

5.2.2 实施方案

5.3 满意度电话调查系统

5.3.1 项目意义

5.3.2 实施方案

第六章 工作总结及展望

参考文献

攻读硕士期间的成果

致谢

展开▼

摘要

由于信息安全问题的不断涌现,在公共安全、金融、商业等领域,基于生物特征认证技术的产品需求逐渐膨胀。说话人识别作为唯一适合远程认证的技术,逐渐被各个领域所接受,并开始得到应用。但实用系统中,各式各样的语音采集设备与传输信道差异,使得训练语音与测试语音之间存在信道失配的情况,导致说话人识别性能急剧下降。这便是说话人识别中的跨信道问题,它也是影响说话人识别性能最重要的因素之一。因此,如何在最大程度上降低跨信道对识别性能的影响,将是本课题的研究重点。
  本文从特征域、模型域及得分域这三个层面,采用一系列行之有效的算法,降低跨信道对说话人识别的影响,并尝试将迁移学习用于说话人识别中,并将其与传统的跨信道算法结合,以进一步提升说话人识别系统的性能。
  1.在特征域上,分别验证有无特征弯折对于各系统的性能影响;在模型域上,将有害因子映射(NAP)与支持向量机(SVM)结合、潜在因子分析(LFA)与UBM-GMM结合来降低跨信道测试对识别的影响;得分域上,采取T-norm后,进一步提高跨信道环境下的说话人识别准确率。
  2.基于迁移学习思想,分别将稀疏表示和无监督迁移分量分析用于说话人识别。稀疏表示利用UBM-GMM构建高斯超向量GSV来构造完备字典并通过L1范式最小化来求解识别结果;无监督迁移分量分析解决目标域数据缺乏而源域数据充足情况下的说话人识别问题,训练使源域与目标域差异最小的子空间,在最大程度上降低跨信道因素。将传统的跨信道算法,如有害因子映射、潜在因子分析,与稀疏表示和无监督迁移分量分析结合,分别验证这些算法在稀疏表示和无监督迁移分量分析框架上的跨信道性能。
  3.在短语音情况下,传统的跨信道算法表现欠佳,因此引入i-vector。介绍了它的主要思想并给出总变化空间T及总变化因子w详细且直观的训练流程。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号