文摘
英文文摘
论文说明:图表目录
声明
第1章绪论
1.1概述
1.2 NIST说话人评测
1.3文本无关的说话人确认
1.3.1 DET曲线
1.3.2等误识率
1.3.3检测代价函数
1.4本文的研究背景与关键问题
1.4.1研究背景
1.4.2关键问题
1.5本文的主要研究内容
第2章基于GMM-UBM的文本无关的说话人识别原理
2.1概述
2.2统计模型-GMM
2.2.1高斯混合模型(GMM)
2.2.2 GMM模型的参数估计
2.2.3 GMM概率输出
2.3基于GMM的说话人确认
2.3.1基于GMM-UBM的说话人确认
2.3.2 GMM-UBM-MAP结构的说话人识别模型
2.4实验与结论
2.4.1实验数据库
2.4.2混合度对系统性能的影响
2.4.3两种模型结构的比较
2.4.4数据量对GMM-UBM-MAP结构系统性能的影响
2.5本章小结
第3章基于短时特征参数的说话人识别
3.1引言
3.2语音信号的产生机理
3.3声道参数及其在说话人中的应用
3.3.1倒谱分析及MFCC参数的提取
3.3.2基于MFCC的说话人识别
3.4短时音源参数
3.4.1基音周期的提取
3.4.2短时音源参数
3.4.3短时音源参数辅助提高说话人识别性能
3.5木章小结
第4章基于音源超音段韵律信息的说话人识别
4.1概述
4.2超音段基频韵律特征提取
4.2.1基于分段线性模型的提取方法
4.2.2超帧韵律特征
4.2.3基于小波分析的提取方法
4.3超音段韵律特征用于文本无关说话人确认
4.3.1数据库介绍及参数提取
4.3.2不同阶次小波分析韵律特征的比较
4.3.3韵律特征与短时特征的比较
4.3.4概貌韵律特征与细节韵律特征的比较
4.3.5超音段韵律特征组合参数PFO
4.3.6训练语音数量对超音段韵律特征的影响
4.3.7超音段韵律特征与短时特征的互补性
4.4本章小结
第5章声道超音段韵律特征
5.1引言
5.2声道超音段韵律特征
5.2.1声道韵律
5.2.2超音段声道韵律特征PMFCC
5.2.3 PMFCC用于说话人确识
5.3音源和声道的超音段韵律组合参数PMFCCFO
5.3.1不同尺度的PMFCCFO
5.3.2训练集大小对确认性能的影响
5.3.3 PMFCCFO参数的噪声鲁棒性
5.4输出评分线性融合
5.4.1线性加权系统融合
5.4.2 PMFCCFO与MFCC系统的线性融合
5.5 NIST长语音说话人评测
5.5.1数据库
5.5.2多子系统融合的说话人确认
5.5.3评测结果分析
5.6本章小结
第6章基于特征映射网络的发声器官位置信息特征
6.1概述
6.2语音的发声特点
6.2.1语音发声特点
6.2.2汉语声母发声特点
6.3普通话声母发声位置参数
6.3.1 AF参数的提取
6.3.2 AF参数的噪声鲁棒性
6.3.3 MFCC-AF组合参数
6.4本章小结
第7章总结与展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果