文摘
英文文摘
声明
第1章绪论
1.1研究动机
1.2说话人识别技术的研究与发展
1.3噪声的分类及影响
1.4说话人识别的应用领域与前景
1.5论文研究内容与论文结构
第2章语音特征提取方法
2.1说话人识别系统的前端处理
2.1.1基于谱熵的端点检测
2.1.2阈值的设定
2.2线性预测倒谱系数(LPCC)的提取方法
2.3美尔频率倒谱系数(MFCC)的提取方法
2.4子带能量倒谱参数(SUBNC)的提取方法
2.4.1子带倒谱的提取方法
2.4.2 Teager-Kaiser能量测度
2.4.3 Teager-Kaiser能量的噪声鲁棒性
2.4.4基于Teager能量的子带倒谱参数的提取方法
2.5语音信号的过渡倒谱系数提取
2.6其它语音特征
2.7本章小结
第3章说话人识别方法
3.1说话人识别方法介绍
3.1.1非参数模型方法
3.1.2参数模型方法
3.1.3神经网络方法
3.2高斯混合模型(GMM)
3.2.1 AdaBoost算法
3.2.2 GMM的训练
3.2.3 GMM的识别
3.3支持向量机(SVM)
3.3.1基于风险最小的机器学习方法
3.3.2线性可分问题的原理
3.3.3非线性支持向量机
3.3.4 SVM-AdaBoost组合
3.3.4背景说话人的选取
3.4其它识别算法
3.5本章小结
第4章多子带SVM/GMM系统
4.1多子带MFCC的鲁棒性
4.2子带划分
4.3系统实现
4.3.1模型训练
4.3.2识别过程
4.4本章小结
第5章试验结果及分析
5.1语音数据库的构成
5.2实验平台、环境及过程
5.3语音特征性能分析
5.4混合分量个数对识别的影响
5.5本文系统的识别性能
5.6开集说话人辨识结果
5.7本章小结
结 论
参考文献
致谢