文摘
英文文摘
声明
第1章 绪论
1.1 引言
1.2 说话人识别技术导引
1.2.1 说话人识别的研究背景和意义
1.2.2 说话人识别技术的发展简史
1.2.3 说话人识别技术的应用领域和前景
1.3 论文的组织结构
第2章 说话人识别概论
2.1 说话人识别的概念
2.2 说话人识别的分类
2.3 说话人识别的原理和结构
2.4 说话人识别的常用方法
2.5 说话人识别技术的性能评价标准
2.6 说话人识别的难点
2.7 本章小结
第3章 语音信号处理及其特征提取
3.1 语音信号产生的机理
3.2 语音信号预处理
3.2.1 采样与量化
3.2.2 归一化处理(normalization)
3.2.3 语音信号的预加重(pre—emphasis)
3.2.4 语音信号的分帧与加窗
3.3 特征参数的提取
3.3.1 特征参数的基本概念
3.3.2 线性预测系数(LPC)和线性预测倒谱系数(LPCC)
3.3.3 Mel频率倒谱系数(MFCC)
3.4 本章小结
第4章 高斯混合模型及其辨认训练算法
4.1 高斯混合模型的基本概念
4.1.1 高斯混合模型的定义
4.1.2 高斯混合模型的阶数
4.1.3 高斯混合模型的说话人识别中的应用
4.2 EM算法
4.2.1 EM算法的引入
4.2.2 EM算法的介绍和初始化
4.2.3 EM算法在说话人识别中的应用
4.3 最大模型距离法(MMD)
4.4 实际应用中存在的几个问题
4.5 本章小结
第5章 系统构架实现与数据测试比较
5.1 软硬件平台
5.2 实验及训练语音库
5.3 系统的数据流和模块
5.4 识别率计算
5.5 系统搭建完成后的验证测试
5.5.1 预加重系数对系统性能的影响
5.5.2 MFCC各维参数进行加权处理对系统的影响
5.5.3 GMM模型阶数对系统性能的影响
5.5.4 测试语音单位长度对系统性能的影响
5.6 本论文所做的尝试与改进
5.6.1 将多线程并行技术应用于说话人识别中
5.6.2 一种提升含样本量较大待测语音库识别率的方法
5.7 本章小结
第6章 总结与展望
6.1 本文已取得的研究成果
6.2 有待进一步研究的工作
发表论文和科研情况说明
参考文献
后记