声明
第一章 绪论
1.1研究背景和意义
1.2说话人识别的发展和现状
1.3研究内容与论文结构
1.3.1 主要研究
1.3.2 结构安排
第二章 说话人识别基本理论
2.1语音产生机理
2.2 说话人识别概述
2.2.1说话人识别概念
2.2.2 说话人识别分类
2.3 说话人语音预处理
2.3.1 数据降噪
2.3.2 预加重
2.3.3 分帧加窗
2.3.4 端点检测
2.4 说话人语音特征提取
2.4.1 梅尔倒谱系数
2.4.2 对数能量倒谱系数
2.4.3 线性预测倒谱系数
2.5说话人识别性能评价指标
2.6 本章小结
第三章 相关说话人识别模型算法及分析
3.1说话人识别模型
3.2矢量量化
3.2.1 矢量量化(VQ)的概述
3.2.2 矢量量化的定义
3.2.3矢量量化的失帧测度
3.2.4最佳矢量量化的设计
3.2.5 LBG算法
3.2.6 改进LBG算法
3.3 深度神经网络识别模型
3.3.1深度神经网络
3.3.2玻尔兹曼机 RBM
3.3.3 Dropout 层
3.3.4深度神经网络在说话人识别中的应用
3.4 本章小结
第四章 应用实验与结果分析
4.1 基于矢量量化的针对性别说话人识别系统的实验
4.1.1 系统概述
4.1.2 实验数据集
4.1.3 实验过程
4.1.4 实验结果
4.2 基于深度神经网络的针对性别的说话人识别系统的实验
4.2.1 实验环境
4.2.2 说话人识别系统识别率的计算
4.2.3 实验数据
4.2.4 网络结构
4.2.5 实验结果
4.3 本章小结
第五章 总结与展望
5.1总结
5.2展望
参考文献
攻读学位期间取得的研究成果
致谢
天津工业大学;