说话人识别中提高GMM性能方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

利用语音信号进行说话人身份识别,是语音研究领域的一个重要方向,具有越来越重要的社会意义和实用价值。根据说话的内容,可以分为文本相关和无关两个方面。由于文本无关具有更加灵活与适用面广的特点而成为主要研究课题。
　　在文本无关说话人识别中,GMM将话者识别问题转换成对话者语音数据分布的估计问题,从而将复杂的语音训练、匹配的问题分解为模型表达形式的选择、模型参数的训练,以及概率的计算等等子问题,解决了话者识别任务中的很多难题。并且由于GMM具有简单、灵活、有效的特点以及较好的鲁棒性,迅速成为当今与文本无关的说话人识别中的主流技术。近年来,在复杂背景环境下,UBM-MAP-GMM表现出更为优异的性能,特别是对失配情况有很高的鲁棒性。
　　然而,GMM对数据有较强的依赖性,在有限训练集下,过多的模型参数将不能保证可靠估计,这就限制了GMM模型的性能。首先,由于特征矢量维数较高,使用全矩阵形式协方差会导致参数巨大而无法可靠估计。其次,虽然使用对角形式的协方差矩阵模型参数较少,但是其隐含的前提假设是参数各维之间不相关,这种假设是不合理的。最后,由于自适应数据有限,使得目前对UBM作自适应得到目标GMM时只能自适应均值,而无法对协方差参数进行自适应。
　　为了进一步提高文本无关说话人识别系统的性能,本文从上述三个方面展开研究,分别提出不同的方法,在有限的训练集的条件下,提高文本无关下的GMM模型性能。
　　首先,针对全协方差矩阵模型参数过多,难以可靠估计的问题。本文提出了一种基于相关系数矩阵共享的协方差矩阵直接估计方法。这种方法既保证了GMM总的模型参数不致过高,可以可靠估计,又使得GMM具有显式描述特征矢量各维之间的相关性能力。
　　其次,虽然可以在特征空间进行线性解相关,使特征矢量各维相关性减弱,使之适合对角协方差假设。然而,由于特征矢量分布形式的复杂性,很难找到一个线性变换矩阵,为空间中所有的特征矢量解相关。因此,本文提出了一种基于模型的分类子空间解相关的方法,利用GMM对特征矢量空间分布的描述,将特征空间分解成多个子空间,在每个子空间中分别进行特征矢量的线性解相关,从而使解相关更为精细。
　　为了有效实现上述两种方法,本文分别提出了两种对GMM中的高斯成分进行分类的算法。基于相关系数矩阵的分类方法，保证了协方差直接估计方法的合理性;而基于相似变换矩阵的分类方法，可使模型子空间解相关方法能有效实现。
　　最后，针对目前对UBM作自适应只能自适应均值的问题，本文提出了一种基于相关系数矩阵共享的MAP方法，通过共享降低了对自适应数据的要求，保证协方差参数自适应的可靠性，进一步提高了UBM-MAP-GMM的性能。
　　以上各方法的实验都取得了良好的效果，证明了方法的有效性。最后，本章对基于超音段特征参数的系统采用了相关系数矩阵共享的UBM-MAP-GMM框架，也较大得提高了基于超音段特征参数的辅助系统的性能。

著录项

作者
姚志强;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科信号与信息处理
授予学位博士
导师姓名戴蓓蒨;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;信号声学;
关键词
语音识别; 说话人识别; GMM模型; 参数估计; 特征矢量; MAP方法;

相似文献

中文文献
外文文献
专利

1. 基于聚类优化GMM提高说话人识别性能的研究 [J] . 吴庆棋 ,林江云 . 计算机技术与发展 . 2009,第004期
2. 说话人识别中基于粒子群优化的GMM训练方法 [J] . 薛丽萍1 ,姚应龙1 ,王志强1 . 软件工程与应用 . 2013,第001期
3. 融合AP和GMM的说话人识别方法研究 [J] . 王波 ,钟映春 ,陈俊彬 . 广东工业大学学报 . 2015,第004期
4. 基于说话人特有特征集的GMM和i-矢量方法的说话人识别 [J] . 沈思秋 ,吕勇 ,杨芸 . 电子设计工程 . 2014,第023期
5. 基于SVM-GMM的开集说话人识别方法 [J] . 陈黎 ,徐东平 . 计算机工程 . 2011,第014期
6. 基于时间规整网络的GMM说话人识别模型的初始化方法 [C] . 沈忱 ,章明 ,赵力 . 2005年津、鲁、浙、苏声学学术会议暨全国物理声学学术会议 . 2005
7. 融合AP和GMM的说话人识别方法研究 [A] . 王波 . 2015

说话人识别中提高GMM性能方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅