首页> 中文学位 >基于因子分析和支持向量机的耳语说话人识别
【6h】

基于因子分析和支持向量机的耳语说话人识别

代理获取

目录

声明

第一章 绪论

1.1 研究背景

1.2 耳语音研究现状

1.2.1 耳语音的研究

1.2.2 说话人识别的研究

1.2.3 说话人识别的关键问题

1.2.4 耳语说话人识别的研究

1.2.5 本文的数据库

1.3 本课题研究的主要工作

1.4 论文的结构安排

第二章 耳语音的特征参数

2.1 语音信号产生的数学模型

2.2 线性预测系数(LPC)

2.3 美尔倒谱系数(MFCC)的提取

2.4 耳语音特征参数的分析

2.5 MFCC修正参数

2.6 本文采用的特征参数

第三章 基于SVM-FA的说话人识别系统

3.1 支持向量机(SVM)

3.2 传统的说话人识别模型

3.2.1 VQ说话人模型

3.2.2 隐马尔可夫模型

3.2.3 高斯混合模型

3.2.4 通用背景模型

3.3 联合因子分析

3.3.1 GMM均值超向量

3.3.2 联合因子分析简述

3.3.3 简化的因子分析过程

3.4 系统的总体流程

第四章 信道补偿技术在SVM-FA系统中的应用

4.1 类内协方差规整(WCCN)

4.2 线性判别分析(LDA)

4.3 冗余属性投影(NAP)

4.4 差异化补偿的冗余属性投影(VC-NAP)

4.5 实验配置

4.5.1 特征提取

4.5.2 SVM-FA训练集和测试集

4.6 实验结果和分析

第五章 总结与展望

5.1 论文工作总结

5.2 今后研究展望

参考文献

攻读硕士学位期间公开发表的论文

致谢

展开▼

摘要

耳语音说话人识别在公共场合下的通讯,安全场所的身份鉴定以及罪犯识别,电话网络查询与电话银行等领域都有着广泛的实用价值。耳语音的说话人识别技术在日常生活中越来越被重视。
   由于耳语发音方式的特殊性,耳语音说话人识别受说话人的健康状况、心理变化、发音状态和信道环境等因素的影响尤为突出。用正常音建立的说话人识别系统应用到耳语音,识别性能将大为下降。
   联合因子分析(JFA)在不匹配信道环境下耳语说话人识别已经取得了很好的效果,它能够从模型方面分离出说话人和信道信息,从而进行信道补偿。本文只采取了联合因子分析方法中的一部分,只估计说话人空间,并从中提取出所包含的说话人因子,将说话人因子与支持向量机(SVM)结合起来构建一个基于因子分析-支持向量机(FA-SVM)的耳语说话人识别系统。
   本文在该识别系统的基础上增加了类内协方差规整(WCCN),线性判别分析(LDA)和冗余属性投影(NAP)三种信道补偿技术,并将经过信道补偿之后的说话人因子输入到支持向量机系统中进行识别。实验证明采用信道补偿之后的系统获得了比基线系统更好的识别结果。
   因为估计出的说话人因子仍然会包含信道信息的特点,本文对上述三种方法进行了相应的改进。针对类内协方差规整,本文采用平滑的类内规整矩阵取代原来的矩阵以改进识别效果。针对冗余属性投影,本文分析了冗余属性投影和基线系统之间的关联,提出了一种介于两者之间的差异补偿-冗余属性投影(VC-NAP)系统,该系统实现了一种可调的信道补偿,避免了因完全的NAP所带来的补偿误差,实验证明基于VC-NAP的系统比基于NAP的系统的识别效果要好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号