Generative Adversarial Networks based X-vector Augmentation for Robust Probabilistic Linear Discriminant Analysis in Speaker Verification

机译：基于生成对抗网络的X向量增强算法，用于说话人验证中的鲁棒概率线性判别分析

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Data augmentation is an effective method to increase the quantity of training data, which improves the model's robustness and generalization ability. In this paper, we propose a generative adversarial network (GAN) based data augmentation approach for probabilistic linear discriminant analysis (PLDA), which is a standard back-end for state-of-the-art x-vector based speaker verification system. Instead of generating new spectral feature samples, a conditional Wasserstein GAN is adopted to directly generate x-vectors. Experiments are carried out on the standard NIST SRE 2016 evaluation dataset. Compared to manually adding noise, the GAN augmented PLDA achieves better performance and this performance can be further boosted when combined with manual augmented data. EER of 11.68% and 4.43% were obtained for Tagalog and Cantonese evaluation condition, respectively.

机译：数据扩充是增加训练数据量的有效方法，可以提高模型的鲁棒性和泛化能力。在本文中，我们为概率线性判别分析（PLDA）提出了一种基于生成对抗网络（GAN）的数据增强方法，该方法是基于x向量的最新说话者验证系统的标准后端。不是生成新的光谱特征样本，而是使用条件Wasserstein GAN直接生成x向量。实验是在标准的NIST SRE 2016评估数据集上进行的。与手动添加噪声相比，GAN增强PLDA具有更好的性能，与手动增强数据结合使用时，可以进一步提高该性能。他加禄语和粤语评估条件的EER分别为11.68％和4.43％。

著录项

来源
《International Symposium on Chinese Spoken Language Processing》|2018年|205-209|共5页
会议地点
作者
Yexin Yang; Shuai Wang; Man Sun; Yanmin Qian; Kai Yu;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Gallium nitride; Generative adversarial networks; Noise measurement; Speech recognition; Generators; Standards; Training data;

机译：氮化镓;对抗性网络;噪声测量;语音识别;发电机;标准;培训数据;

相似文献

外文文献
中文文献
专利

1. Fuzzy Restricted Boltzmann Machine based Probabilistic Linear Discriminant Analysis for Noise-Robust Text-Dependent Speaker Verification on Short Utterances [J] . Sung-Hyun Yoon, Min-Sung Koh, Ha-Jin Yu IAENG Internaitonal journal of computer science . 2020,第3PTa2期

机译：基于模糊的限制Boltzmann Machine基于噪声强制文本依赖扬声器验证的概率线性判别分析
2. Comparison between supervised and unsupervised learning of probabilistic linear discriminant analysis mixture models for speaker verification [J] . Timur Pekhovsky, Aleksandr Sizov Pattern recognition letters . 2013,第11期

机译：说话人验证的概率线性判别分析混合模型的有监督学习与无监督学习的比较
3. A fuzzy-clustering-based hierarchical i-vector/probabilistic inear discriminant analysis system for text-dependent speaker verification [J] . Laskar Mohammad Azharuddin, Laskar Rabul Hussain Expert Systems . 2020,第3期

机译：基于模糊聚类的分层I载体/概率INEAR判别分析分析系统，用于文本依赖扬声器验证
4. Generative Adversarial Networks based X-vector Augmentation for Robust Probabilistic Linear Discriminant Analysis in Speaker Verification [C] . Yexin Yang, Shuai Wang, Man Sun, International Symposium on Chinese Spoken Language Processing . 2018

机译：基于生成的对抗网络的X载体增加扬声器验证中的鲁棒概率线性判别分析
5. Data Augmentation for Supervised Learning with Generative Adversarial Networks [D] . Podduturi, Manaswi. 2018

机译：具有生成对抗网络的监督学习的数据增强
6. Seismic Data Augmentation Based on Conditional Generative Adversarial Networks [O] . Yuanming Li, Bonhwa Ku, Shou Zhang, 2020

机译：基于条件生成对抗网络的地震数据增强
7. Conditional Generative Adversarial Networks for Speech Enhancement and Noise-Robust Speaker Verification [O] . Michelsanti, Daniel, Tan, Zheng-Hua 2017

机译：用于语音增强和语音的条件生成对抗网络噪声稳健的扬声器验证

Generative Adversarial Networks based X-vector Augmentation for Robust Probabilistic Linear Discriminant Analysis in Speaker Verification

摘要

著录项

相似文献

相关主题

期刊订阅