基于i-vector特征规整的概率线性判别分析说话人确认方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人确认技术用于判断给定语音是否属于某个说话人，它作为一项关键的语音辅助应用技术，现阶段已经受到广泛的重视，并作为身份认证技术普遍应用于各种相关领域。而在已有的各种说话人确认方法中，基于i-vector的概率线性判别分析（Probabilistic Linear Discriminant Analysis，PLDA）的说话人确认方法因其优秀的识别效果和良好的实时性受到了广泛关注，成为目前最主流的研究方法之一。识别建模的关键之一在于对特征分布的拟合，而 PLDA建模阶段存在着对 i-vector分布的高斯假设，当面对信道畸变、短语音等情况时，这一假设就显得过于苛刻。在基于 i-vector的 PLDA说话人确认方法中，若无法对 i-vector特征进行很好的拟合，会对识别结果的准确率和稳定性产生较大的影响。因而，如何对 i-vector的分布进行合理的高斯规整，是该领域的关键研究问题之一。
　　本研究提出了基于KL散度的区分性规整方法（Kullback-Leibler Divergence Divisive Normalization, KL-DN）。该方法不对总变化空间提取的i-vector的初始分布做任何假设，而是通过非参数的方法对 i-vector的分布进行估计。同时，为达到 PLDA模型中的高斯假设，提出利用KL散度作为 i-vector分布与高斯分布间差异性的度量标准，并提出通过一个非线性的转化函数来有效减小这一 KL散度。实验基于NIST2008的核心数据集展开，结果表明，i-vector分布与高斯分布之间的 KL散度与说话人确认的结果间呈负相关，并且通过本文提出的KL-DN方法，可以有效地减小对应KL散度进而提高识别结果。针对KL-DN面对短语音说话人识别存在的缺陷，在遵循KL散度作为特征分布之间差异性的度量标准的基本思想条件下，提出了一种基于旋转的迭代高斯规整方法（General Rotation-based Iterative Gaussianization，G-RBIG）来实现特征的高斯规整。该方法通过联合使用边缘高斯化和空间旋转矩阵，对i-vector的分布进行高斯规整。实验结果表明，在NIST2008短语音测试数据各个相关数据集以及 NIST08的核心数据集上，说话人确认性能均有不同程度的提升。

著录项

作者
潘怡霖;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名郑铁然;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;信号处理;
关键词
语音识别; 说话人确认; 信号处理; 高斯模型;

相似文献

中文文献
外文文献
专利

1. 基于特征规整和评分规整的说话人确认研究 [J] . 郑榕 ,张树武 ,徐波 . 中文信息学报 . 2006,第006期
2. 基于稀疏特征挑选和概率线性判别分析的表情识别研究 [J] . 张瑞 ,蒋晨之 ,苏剑波 . 电子学报 . 2018,第007期
3. 基于听觉模型和极值点概率密度的断齿故障特征提取方法研究 [J] . 吴文寿 ,李允公 ,王波 . 振动与冲击 . 2016,第019期
4. 基于听觉模型和极值点概率密度的断齿故障特征提取方法研究 [J] . 吴文寿 ,李允公 ,王波 . 振动与冲击 . 2016,第020期
5. 基于粗糙集与SVM概率输出的中医舌象特征融合方法研究 [J] . 张新峰 ,沈兰荪 ,刘垚巍 . 世界科学技术-中医药现代化 . 2007,第005期
6. 基于Bottleneck特征和i-vector的说话人年龄分类 [C] . Jie Yan ,闫杰 ,Xiaolian Zhu . 第十四届全国人机语音通讯学术会议 . 2017
7. 基于多特征I-Vector的短语音说话人识别方法研究 [A] . 孙念 . 2019

基于i-vector特征规整的概率线性判别分析说话人确认方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅