首页> 中文学位 >噪声环境下的基于GMM/SVM说话人识别算法
【6h】

噪声环境下的基于GMM/SVM说话人识别算法

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1研究动机

1.2说话人识别技术的研究与发展

1.3噪声的分类及影响

1.4说话人识别的应用领域与前景

1.5论文研究内容与论文结构

第2章语音特征提取方法

2.1说话人识别系统的前端处理

2.1.1基于谱熵的端点检测

2.1.2阈值的设定

2.2线性预测倒谱系数(LPCC)的提取方法

2.3美尔频率倒谱系数(MFCC)的提取方法

2.4子带能量倒谱参数(SUBNC)的提取方法

2.4.1子带倒谱的提取方法

2.4.2 Teager-Kaiser能量测度

2.4.3 Teager-Kaiser能量的噪声鲁棒性

2.4.4基于Teager能量的子带倒谱参数的提取方法

2.5语音信号的过渡倒谱系数提取

2.6其它语音特征

2.7本章小结

第3章说话人识别方法

3.1说话人识别方法介绍

3.1.1非参数模型方法

3.1.2参数模型方法

3.1.3神经网络方法

3.2高斯混合模型(GMM)

3.2.1 AdaBoost算法

3.2.2 GMM的训练

3.2.3 GMM的识别

3.3支持向量机(SVM)

3.3.1基于风险最小的机器学习方法

3.3.2线性可分问题的原理

3.3.3非线性支持向量机

3.3.4 SVM-AdaBoost组合

3.3.4背景说话人的选取

3.4其它识别算法

3.5本章小结

第4章多子带SVM/GMM系统

4.1多子带MFCC的鲁棒性

4.2子带划分

4.3系统实现

4.3.1模型训练

4.3.2识别过程

4.4本章小结

第5章试验结果及分析

5.1语音数据库的构成

5.2实验平台、环境及过程

5.3语音特征性能分析

5.4混合分量个数对识别的影响

5.5本文系统的识别性能

5.6开集说话人辨识结果

5.7本章小结

结 论

参考文献

致谢

展开▼

摘要

语言是人类最重要的交流工具,语音信号作为语言载体在不同的层面包含了大量的信息。其中与说话人相关的信息可以辨认说话人是谁或者确认此说话人是否为某特定的人。如今自动说话人识别技术在低噪声、低失真环境下的识别率已经相当的高,但实际环境中无处不在的噪声导致了训练模型和测试语音之间的失配,这使得噪声环境中说话人识别系统的识别率急剧下降。因此提高噪声环境下说话人识别系统的性能是说话人识别系统从实验室走向实用的关键,也是当前的研究热点。 说话人识别技术主要包括特征提取和模式识别两大模块,本文分别从人的发音器官和听觉器官研究了特征参数的提取和抗噪性能,并对当今主流分类器做了深入的研究。所有工作主要针对噪声环境下文本无关的开集说话人辨识展开。 在预处理阶段,考虑到广泛应用于编码理论的信息熵代表信源的平均不定性能导致语音的熵和噪声的熵存在较大差异,本文采用了基于熵函数的语音端点检测方法,试验表明谱熵法在信噪比较低和非平稳噪声下具有良好的性能,进而提出了一种动态阈值的方法检测语音端点。 考虑到噪声频带一般不覆盖整个语音范围,因此,本文采用多子带特征提取,并在每个频带内使用基于Teager能量的子倒谱特征。本文还设计了一种用AdaBoost算法优化的支持向量机与高斯混合模型相结合的系统。首先用优化的支持向量机对每个子带分别决策,筛选出训练集之外的说话者,然后对集内人用判别结果进行特征加权以突出对识别结果影响较大的子带特征,从而降低了噪声对对识别结果的影响,最后用优化的高斯混合模型进行识别。试验结果表明,本文系统在低信噪比环境下具有较好的识别性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号