文摘
英文文摘
原创性声明及本论文使用授权说明
第一章绪论
1.1说话人识别的概念和研究意义
1.1.1说话人识别的概念
1.1.2说话人识别的研究意义
1.2说话人识别的技术难点
1.3说话人识别的研究历史和现状
1.2.1研究历史
1.2.2国内外研究现状
1.4语音信号非线性处理
1.5说话人识别的数据库
1.6本文的主要内容
第二章语音非线性本质
2.1非线性理论概述
2.1.1混沌与分形的概述
2.1.2非线性分析方法
2.2语音的非线性现象
2.2.1发音器官和发音过程
2.2.2语音生成过程的非线性
2.3语音混沌性的验证
2.3.1相空间重构
2.3.2李雅普诺夫指数
2.4实验结果和分析
2.4.1重构语音信号相空间
2.4.2最大李雅普诺夫指数
2.5本章小结
第三章说话人特征参数
3.1语音信号预处理
3.2语音特征的选择原则
3.3说话人识别常用特征提取
3.3.1线性预测系数(LPC)及其倒谱系数(LPCC)
3.3.2 Mel频率倒谱系数(MFCC)
3.4语音非线性特征提取
3.4.1分形维数
3.4.2二阶动态熵
3.4非线性特征参数分析-关系和F比
3.5本章小结
第四章说话人识别模型
4.1高斯混合模型
4.1.1模型描述
4.1.2模型参数的估计
4.2矢量量化模型
4.2.1距离测度和码本生成
4.2.2初始码字的设置和空胞腔的处理
4.3说话人辨认实验及结果分析
4.3.1混合高斯模型基准系统
4.3.2矢量量化模型基准系统
4.4本章小结
第五章说话人常用特征与非线性特征融合
5.1信息融合原理
5.1.1信息融合的分类
5.1.2多分类器融合的类型
5.1.3多分类器融合的方法
5.2基于特征层融合的说话人辨认
5.2.1构建高维矢量法的融合实现
5.2.2构建复数矢量法的融合实现
5.3基于决策层融合的说话人辨认
5.3.1串联形式的说话人辨认实验及分析
5.3.2并联形式的说话人辨认实验及分析
5.4本章小结
第六章总结和展望
参考文献
攻读硕士学位期间发表的论文
致谢