基于本征音子说话人子空间的说话人自适应算法

屈丹; 张文林

首页> 中文期刊>电子与信息学报 >基于本征音子说话人子空间的说话人自适应算法

基于本征音子说话人子空间的说话人自适应算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

The eigenphone speaker adaptation method performs well when the amount of adaptation data is sufficient. However, it suffers from severe over-fitting when insufficient amount of adaptation data is provided. A speaker adaptation method based on eigenphone speaker subspace is proposed to overcome this problem. Firstly, a brief overview of the eigenphone speaker adaptation method is presented in case of Hidden Markov Model-Gaussian Mixture Model (HMM-GMM) based speech recognition system. Secondly, speaker subspace is introduced to model the inter-speaker correlation information among different speakers' eigenphones. Thirdly, a new speaker adaptation method based on eigenphone speaker subspace is derived from estimation of a speaker dependent coordinate vector for each speaker. Finally, a comparison between the new method and traditional speaker subspace based method is discussed in detail. Experimental results on a Mandarin Chinese continuous speech recognition task show that compared with original eigenphone speaker adaptation method, the performance of the eigenphone speaker subspace method can be improved significantly when insufficient amount of adaptation data is provided. Compared with eigenvoice method, eigenphone speaker subspace method can save a great amount of storage space only at the expense of minor performance degradation.%本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象.为此该文提出一种基于本征音子说话人子空间的说话人自适应算法来克服这一问题.首先给出基于隐马尔可夫模型-高斯混合模型(HMM-GMM)的语音识别系统中本征音子说话人自适应的基本原理.其次通过引入说话人子空间对不同说话人的本征音子矩阵间的相关性信息进行建模;然后通过估计说话人相关坐标矢量得到一种新的本征音子说话人子空间自适应算法.最后将本征音子说话人子空间自适应算法与传统说话人子空间自适应算法进行了对比.基于微软语料库的汉语连续语音识别实验表明,与本征音子说话人自适应算法相比,该算法在自适应数据量极少时能大幅提升性能,较好地克服过拟合现象.与本征音自适应算法相比,该算法以较小的性能牺牲代价获得了更低的空间复杂度而更具实用性.

著录项

来源
《电子与信息学报》|2015年第6期|1350-1356|共7页
作者
屈丹; 张文林;
展开▼
作者单位

信息工程大学信息系统工程学院郑州 450000;

信息工程大学信息系统工程学院郑州 450000;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
语音信号处理; 说话人自适应; 本征音子; 本征音子说话人子空间; 低秩约束; 本征音;

相似文献

中文文献
外文文献
专利

1. 基于稀疏组LASSO约束的本征音子说话人自适应 [J] . 屈丹 ,张文林 . 通信学报 . 2015,第009期
2. 语音识别中基于低秩约束的本征音子说话人自适应方法 [J] . 张文林 ,张连海 ,陈琦 . 电子与信息学报 . 2014,第004期
3. 干扰空间投影在本征音说话人自适应中的应用 [J] . 刘建航 ,杨喜鹏 ,李世宝 . 计算机应用与软件 . 2017,第011期
4. 特征空间本征音说话人自适应 [J] . 屈丹 ,杨绪魁 ,张文林 . 自动化学报 . 2015,第007期
5. 基于正则化的本征音说话人自适应方法 [J] . 张文林 ,张连海 ,牛铜 . 自动化学报 . 2012,第012期
6. 说话人聚类与模型自适应结合的说话人自适应方法 [C] . 何磊 ,方棣棠 ,吴文虎 . 第六届全国人机语音通讯学术会议 . 2001
7. 基于特征子空间量化与深度置信网络的说话人年龄识别 [A] . 杜先娜 . 2017

基于本征音子说话人子空间的说话人自适应算法

摘要

著录项

相似文献

相关主题

期刊订阅