声明
摘要
1 绪论
1.1 说话人识别概述
1.1.1 说话人识别的研究意义与典型应用
1.1.2 说话人识别的发展与现状
1.2 说话人识别的分类
1.3 说话人识别系统结构
1.3.1 说话人识别系统结构
1.3.2 说话人辨认系统结构
1.4 说话人识别系统性能评价
1.4.1 说话人识别系统的性能评价
1.4.2 说话人辨认系统的性能评价
1.5 说话人识别的特征提取
1.5.1 说话人识别理想特征提取
1.5.2 说话人识别特征分类
1.6 说话人识别的主要模型
1.6.1 模板模型
1.6.2 统计模型
1.6.3 人工神经网络
1.6.4 支持向量机
1.7 本文研究工作概述
1.8 本文的结构安排
2 含噪短语音说话人识别解决方案
2.1 引言
2.2 噪声的类型以及噪声的影响
2.3 短语音说话人识别研究
2.4 短语音说话人识别研究面临的困难
2.5 含噪短语音说话人识别综合性解决方案
2.5.1 语音的预处理
2.5.2 噪声的去除
2.5.3 语音帧的分类
2.5.4 多种特征的提取
2.5.5 识别模型的改进
2.6 本章小结
3 基于多特征融合的含噪短语音说话人识别研究
3.1 引言
3.2 语音净化算法
3.2.1 噪声分离算法
3.2.2 差异检测与剔除算法
3.3 实验结果与分析—语音净化算法研究
3.3.1 实验语音库
3.3.2 语音预处理
3.3.3 初步噪声分离算法有效性研究
3.3.4 差异检测与剔除算法有效性研究
3.4 MFCC特征、ICAf特征、IMFCC特征及其组合的研究
3.4.1 提取MFCC特征、ICAf特征和IMFCC特征
3.4.2 特征组合模型训练
3.4.3 特征组合模型决策
3.5 实验结果与分析—MFCC特征、ICAf特征、IMFCC特征及其组合研究
3.6 提取WOCOR特征和特征组合MFCC_D_LPCC
3.6.1 WOCOR特征
3.6.2 特征组合MFCC_D_LPCC
3.6.3 实验结果与分析—单一特征参数研究
3.6.4 实验结果与分析—特征参数组合研究
3.6.5 WOCOR特征和特征组合MFCC_D_LPCC相结合的说话人识别系统
3.7 特征组合中单一特征的融合系数优化
3.7.1 种群初始化
3.7.2 变异操作
3.7.3 交叉操作
3.7.4 选择操作
3.8 GMM模型和GMM-UBM模型
3.9 综合实验结果与分析
3.9.1 语音净化算法与单一特征及其组合的研究
3.9.2 识别模型与单一特征及其组合的研究
3.9.3 特征组合中单一特征的融合系数优化研究
3.9.4 测试人数对含噪短语音说话人识别率影响的研究
3.10 本章小结
4 含噪短语音噪声分离算法和语音帧质量判别算法
4.1 引言
4.2 基于受限NMF的噪声分离算法CNMF
4.3 语音帧质量判别算法—ISNRDA
4.3.1 混合语音谱特征提取
4.3.2 改进信噪比判别算法
4.4 语音帧质量判别算法—差异检测与判别算法(DDADA)
4.5 基于受限NMF的信噪比判别算法(NMF-SNRDA)
4.6 基于GMM-UBM两阶段分类模型
4.7 实验结果与分析
4.7.1 实验语音库
4.7.2 噪声分离方法对识别率的影响
4.7.3 语音帧质量判别算法ISNRDA对识别率的影响
4.7.4 语音帧质量判别算法DDADA对识别率的影响
4.7.5 语音帧质量判别算法NMF-SNRDA对识别率的影响
4.7.6 四种语音帧质量判别算法的比较
4.8 本章小结
5 双重信息质量判别算法和三阶段分类模型
5.1 双重信息质量判别算法
5.2 双重判别算法实验结果与分析
5.3 GMM-UBM三阶段分类模型
5.4 GMM-UBM三阶段分类模型实验结果与分析
5.5 局部模糊PCA降维
5.5.1 模糊K均值聚类算法
5.5.2 初始化聚类中心及其改进
5.5.3 PCA降维
5.6 基于模糊PCA的GMM
5.7 判决策略
5.8 实验结果与分析
5.8.1 模糊PCA降维实验
5.8.2 不同GMM参数初始化方法对识别率的影响
5.9 本章小结
6 总结与展望
6.1 总结
6.2 研究展望
致谢
参考文献
攻读博士学位期间发表的论文和出版著作情况
攻读博士学位期间参加的科学研究情况
攻读博士学位期间学术成果获奖情况