声明
1 绪论
1.1 背景
1.2 说话人识别
1.2.1 说话人识别的分类
1.2.2说话人识别的模型的分类
1.3说话人识别的系统性能评价标准
1.3.1 ROC曲线
1.3.2 FA-FR曲线和等误识率
1.3.3 检查代价函数
1.3.4 DET曲线
1.4 复杂环境下的说话人识别
1.4.1 基于信号特征的噪音鲁棒算法
1.4.2 基于模型的噪音鲁棒算法
1.5 本文使用到的语料库
1.5.1 TIMIT语音库
1.5.2 NOISEX-92数据库
1.6 论文的安排
2 说话人特征参数提取
2.1 语音信号的预处理
2.1.1 预加重(Pre-emphasis)
2.1.2加窗处理(Frame Blocking)
2.2 语音信号的特征参数的分类
2.2.1时域特征
2.2.2 线性预测编码参数
2.2.3 频域及倒谱特征
2.2.4 基于听觉特征的参数
2.3 LPCC
2.4 MFCC特征
2.4.1 MFCC参数的具体计算过程
2.4.2 临界带宽
2.5 PLP参数
2.5.1 PLP特征提取的过程
2.6 小结
3 说话人识别中特征提取的鲁棒性
3.1 Delta参数
3.2 PCA
3.2.1 随机向量的k1展开
3.2.2 k1降维的实现
3.3 谱减法与非线性谱减法
3.3.1 噪声谱的估计
3.4 倒谱均值相减法(CMS)
3.5 倒谱均值与方差归一化法(CMVN)
3.6 RASTA
3.6.1 特征提取的RASTA-PLP 技术
3.7特征弯折(Feature Warping)
3.8 本章小结
4 基于GMM-UBM说话人识别模型
4.1 GMM模型
4.1.1 GMM的参数估计
4.2 一种新的抗噪特征参数用于GMM模型的说话人识别
4.2.1 参数的提取
4.2.2 实验结果
4.3 基于高斯混合模型-通用背景模型(GMM-UBM)的说话人确认
4.3.1 基于UBM-GMM说话人确认的的训练过程
4.3.2 基于UBM-GMM说话人确认的确认过程
4.4 GMM与GMM—UBM的性能比较
4.5 本章小结
5 GMM和SVM的混合模型
5.1 SVM模型
5.1.1研究意义
5.1.2 基于风险最小的机器学习方法
5.1.3 分类间隔最大
5.1.4线性判决边界
5.1.5 非线性判决边界
5.2 SVM在说话人确认中的应用
5.3 GMM-SVM系统
5.3.1 SVM的概率输出
5.4基于GMM super vector线性核函数的SVM用于说话人确认系统
5.5 本章总结
6 总结与展望
6.1 工作总结
6.2 工作展望
致谢
参考文献
附录
武汉纺织大学;