首页> 中文学位 >基于i-vector特征规整的概率线性判别分析说话人确认方法研究
【6h】

基于i-vector特征规整的概率线性判别分析说话人确认方法研究

代理获取

目录

第1章 绪论

1.1课题背景及研究目的和意义

1.2国内外研究现状与分析

1.3本文主要研究内容

1.4本文组织结构

第2章 基于i-vector的PLDA说话人确认

2.1引言

2.2前端特征提取部分

2.3总变化空间估计

2.4 LDA信道补偿

2.5 I-vector长度规整

2.6概率线性判别分析模型

2.7实验平台与数据库

2.8本章小结

第3章 基于KL-DN的i-vector特征规整

3.1引言

3.2 KL-DN模型转化函数

3.3 KL-DN优化函数

3.4 KL-DN模型训练

3.5实验与分析

3.6本章小结

第4章 基于G-RBIG的i-vector特征规整

4.1引言

4.2基于G-RBIG的i-vector高斯规整方法

4.3 G-RBIG收敛性分析

4.4实验与分析

4.5本章小结

结论

参考文献

声明

致谢

展开▼

摘要

说话人确认技术用于判断给定语音是否属于某个说话人,它作为一项关键的语音辅助应用技术,现阶段已经受到广泛的重视,并作为身份认证技术普遍应用于各种相关领域。而在已有的各种说话人确认方法中,基于i-vector的概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)的说话人确认方法因其优秀的识别效果和良好的实时性受到了广泛关注,成为目前最主流的研究方法之一。识别建模的关键之一在于对特征分布的拟合,而 PLDA建模阶段存在着对 i-vector分布的高斯假设,当面对信道畸变、短语音等情况时,这一假设就显得过于苛刻。在基于 i-vector的 PLDA说话人确认方法中,若无法对 i-vector特征进行很好的拟合,会对识别结果的准确率和稳定性产生较大的影响。因而,如何对 i-vector的分布进行合理的高斯规整,是该领域的关键研究问题之一。
  本研究提出了基于KL散度的区分性规整方法(Kullback-Leibler Divergence Divisive Normalization, KL-DN)。该方法不对总变化空间提取的i-vector的初始分布做任何假设,而是通过非参数的方法对 i-vector的分布进行估计。同时,为达到 PLDA模型中的高斯假设,提出利用KL散度作为 i-vector分布与高斯分布间差异性的度量标准,并提出通过一个非线性的转化函数来有效减小这一 KL散度。实验基于NIST2008的核心数据集展开,结果表明,i-vector分布与高斯分布之间的 KL散度与说话人确认的结果间呈负相关,并且通过本文提出的KL-DN方法,可以有效地减小对应KL散度进而提高识别结果。针对KL-DN面对短语音说话人识别存在的缺陷,在遵循KL散度作为特征分布之间差异性的度量标准的基本思想条件下,提出了一种基于旋转的迭代高斯规整方法(General Rotation-based Iterative Gaussianization,G-RBIG)来实现特征的高斯规整。该方法通过联合使用边缘高斯化和空间旋转矩阵,对i-vector的分布进行高斯规整。实验结果表明,在NIST2008短语音测试数据各个相关数据集以及 NIST08的核心数据集上,说话人确认性能均有不同程度的提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号