文摘
英文文摘
1绪论
1.1研究的背景及意义
1.1.1研究的现实意义
1.1.2主要的应用领域
1.2研究的历史与现状
1.2.1研究的历史
1.2.2研究的现状
1.2.3研究的难点
1.3说话人识别基本介绍
1.3.1说话人识别的基本原理
1.3.2说话人识别的几种类别
1.3.3说话人识别常用的特征
1.3.4说话人识别主要的分类方法
1.3.5说话人识别系统的性能评价
1.4本文的结构安排
2语音信号的分析与预处理
2.1语音产生的机理
2.1.1人体发声机理
2.1.2语音发声基础
2.2语音信号的数字模型
2.3语音信号的预处理
2.3.1采样与量化
2.3.2预加重处理
2.3.3分帧后加窗
2.3.4特征提取及评价
2.4相关的分析方法
2.4.1时域分析
2.4.2倒谱分析
2.4.3线性预测分析
3 说话人识别的特征提取
3.1基音周期估计
3.1.1基音周期的基本含义
3.1.2基音周期的检测方法
3.1.3基音周期的提取步骤
3.2 LPC倒谱系数(LPCC)
3.2.1 LPCC的定义
3.2.2 LPCC的提取
3.2.3 LPCC的分析
3.3 Mel倒谱系数(MFCC)
3.3.1 MFCC的定义
3.3.2 MFCC的提取
3.3.3 MFCC的分析
3.4其他倒谱系数
3.4.1长时倒谱特征
3.4.2过渡倒谱特征
3.5其他特征
3.5.1共振峰频率
3.5.2短时平均过零率
3.5.3明亮度
3.5.4 Delta特征
4高斯混合模型在说话人识别中的应用
4.1高斯混合模型的基本概念
4.1.1高斯混合模型的含义
4.1.2高斯混合模型的描述
4.1.3高斯混合模型的训练
4.2 EM算法
4.2.1 EM算法的含义
4.2.2 EM算法的原理
4.2.3用EM算法估计GMM的参数
4.3 GMM参数的初始化
4.3.1常用方法简述
4.3.2 LBG算法
4.3.3 K-均值算法
4.4基于高斯混合模型的说话人识别
4.4.1 GMM应用于说话人识别系统
4.4.2系统判别准则
4.4.3实际应用问题
5系统实现与实验结果
5.1实验条件
5.1.1软硬件条件
5.1.2实验语音库
5.1.3识别率计算
5.2基于高斯混合模型的说话人识别系统的性能研究
5.2.1测试语音单位长度对识别结果的影响
5.2.2不同主流基本特征对识别结果的影响
5.2.3高斯混合模型阶数对识别结果的影响
5.2.4混合模型协方差阈值对识别结果的影响
5.2.5预加重系数对识别结果的影响
5.2.6帧长对识别结果的影响
5.3基于改进特征参数的说话人识别系统的研究
5.3.1一种基于特征加权的说话人识别算法
5.3.2一种基于特征差分的说话人识别算法
5.4基于改进最大期望算法的说话人识别系统的研究
5.4.1改进最大期望算法
5.4.2实验结果及其分析
5.5基于改进统计方法的说话人识别系统的研究
5.5.1识别统计方法改进
5.5.2实验结果及其分析
结 论
参考文献
攻读硕士学位期间发表学术论文情况
致 谢