摘要
1 绪论
1.1 研究的背景及意义
1.2 说话人识别研究的历史和现状
1.3 说话人识别概述
1.3.1 基本概念
1.3.2 常规分类
1.3.3 基本原理
1.4 论文研究工作和内容安排
1.4.1 研究工作
1.4.2 内容安排
2 语音信号前期处理及特征提取
2.1 语音信号的预处理
2.1.1 预加重
2.1.2 加窗分帧
2.2 语音信号的端点检测
2.2.1 双门限法
2.2.2 谱减法
2.2.3 谱熵法
2.3 语音信号的特征提取
2.3.1 线性预测系数和线谱对系数
2.3.2 线性预测倒谱系数和梅尔频率倒谱系数
2.3.3 线性预测倒谱系数和梅尔频率倒谱系数的Delta特征
2.4 本章小结
3 说话人识别模板训练方法
3.1 矢量量化的原理
3.2 矢量量化的过程
3.3 LBG算法
3.4 本章小结
4 基于矢量量化的说话人识别系统设计
4.1 系统方案的选择
4.2 软件系统构成
4.3 系统功能模块设计
4.3.1 系统登录模块
4.3.2 语音库管理模块
4.3.3 语音采集模块
4.3.4 模式选择模块
4.3.5 前期处理模块与波形绘制模块
4.3.6 特征选择模块
4.3.7 训练识别模块与反馈信息模块
4.3.8 其他功能模块
4.4 本章小结
5.系统性能测试及结果分析
5.1 系统整体功能测试
5.2 实验结果与分析
5.2.1 特征参数及其阶数对识别结果的影响
5.2.2 训练模型码本大小对识别结果的影响
5.2.3 帧长和帧移对识别结果的影响
5.3 本章小结
6 总结和展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
声明