声明
摘要
1 绪论
1.1 课题背景与研究意义
1.2 发展历史与研究现状
1.3 论文的主要内容安排
2 连续语音识别框架与原理
2.1 语音信号的特征提取
2.1.1 感知线性预测系数
2.1.2 梅尔频率倒谱系数
2.1.3 滤波器组特征
2.1.4 基频特征
2.1.5 特征归一化方法
2.2 语音信号声学建模技术概述
2.2.1 声学建模单元选择
2.2.2 常见的声学模型
2.3 发音字典和语言模型概述
2.3.1 语音识别中的发音字典
2.3.2 语音识别中的语言模型
2.4 基于加权有限状态转换器的语音解码网络构建
2.4.1 加权有限状态转换器
2.4.2 混合语音识别器解码
2.4.3 端到端语音识别器解码
2.5 语音识别系统性能评价指标
2.6 本章小结
3 基于连续语音识别器的关键词检出技术
3.1 基于网格结构建立索引
3.1.1 网格结构概述
3.1.2 建立索引
3.2 关键词搜索方法
3.3 基于网格后验概率的置信度
3.4 关键词检出系统性能评价指标
3.5 本章小结
4 基于DNN-HMM声学模型的中文语音关键词检出系统
4.1 中文语音关键词检出系统
4.2 基于DNN-HMM的声学建模
4.2.1 DNN-HMM的网络结构
4.2.2 DNN-HMM网络的训练
4.2.3 DNN-HMM网络参数的选择
4.3 实验条件与结果分析
4.3.1 实验条件
4.3.2 硬件实验设备
4.3.3 相关数据准备
4.3.4 实验结果分析
4.4 DNN-HMM声学模型的应用范围以及存在的问题
4.5 本章小结
5 基于LSTM-RNN声学模型的中文语音关键词检出系统
5.1 基于LSTM-RNN的声学建模
5.1.1 LSTM-RNN的网络结构
5.1.2 LSTM-RNN网络的训练
5.1.3 LSTM-RNN网络参数选择
5.2 实验条件与结果分析
5.3 不同声学特征参数对检出系统性能影响分析
5.4 不同训练数据量对检出系统性能影响分析
5.5 融合置信度对检出系统性能影响分析
5.6 基于系统融合的中文语音关键词检出
5.7 本章小结
6 总结和展望
6.1 本文工作回顾
6.2 未来工作展望
致谢
参考文献
攻读硕士学位期间发表的论文和出版著作情况