文摘
英文文摘
引 言
1 语音识别技术
1.1 语音识别的重要意义和目的
1.2 语音识别的发展历史
1.3 说话人识别的方法
1.4 本文的主要工作内容
2 样本收集与预处理
2.1 与文本相关的汉语语音小样本库设计
2.2 语音信号的预处理
2.2.1 预加重
2.2.2 分帧和加窗
2.2.3 语音分割
3 语音信号的特征分析
3.1 语音信号的短时时域处理
3.1.1 短时能量分析
3.1.2 短时平均过零率
3.1.3 短时自相关函数
3.1.4 短时平均幅度差函数
3.2 语音信号的频域处理
3.2.1 短时傅里叶变换
3.2.2 基于听觉特性的Mel频率倒谱系数MFCC
本章小结
4 矢量量化技术(VQ)
4.1 码本设计
4.2 失真测度
4.2.1 欧几里得距离测度和平方差误差测度
4.2.2 加权平方误差测度
4.2.3 倒谱失真测度
5 基于隐马尔可夫模型(HMM)的识别技术
5.1 马尔可夫链
5.2 隐马尔可夫模型(HMM)
5.3 HMM基本算法及模型
5.3.1 前向—后向算法
5.3.2 Baum—Welch算法
5.3.3 viterbi算法
6 语音特征提取过程
6.1 改进的Mel频率倒谱系数特征
6.2 元音的特征提取流程
6.2.1 语音信号的短时能量分析
6.2.2 短时平均过零率分析
6.3 语音信号的频域分析
6.3.1 短时傅理叶频率变换
6.3.2 短时傅里叶频谱分析
6.3.3 Mel频率倒谱系数MFCC
6.4 小样本库的语音信号特征提取过程
本章小结
7 基于VQ和HMM的说话人识别系统
7.1 基于VQ的说话人识系统设计
7.1.1 识别任务
7.1.2 VQ模型的训练过程
7.1.3 识别过程
7.1.4 实验结果与分析
7.2 基于HMM的识别系统设计
7.2.1 识别任务
7.2.2 识别过程
7.2.3 HMM说话人识别系统的模型选择
7.2.4 改进的MFC系数对HMM模型的参数的简化
7.2.5 实验结果与分析
7.3 基于VQ/HMM模型的两级说话人识别实验
7.3.1 识别任务
7.3.2 实验结果
本章小结
8 总结与展望
攻读硕士学位期间学术论文及科研情况
致 谢
参考文献