声明
摘要
第1章 绪论
1.1 语音检索的研究背景
1.2 语音检索技术的国内外研究现状
1.3 语音检索系统的框架
1.4 语音检索系统的性能评价指标
1.5 论文的研究内容
1.6 论文的结构安排
第2章 大词汇量连续语音识别系统的建立
2.1 连续语音识别的原理
2.1.1 特征提取
2.1.2 特征规整
2.1.3 模型的建立
2.1.4 解码器
2.2 语音识别中声学模型的研究
2.2.1 基于最大似然估计的声学模型
2.2.2 基于区分性训练的声学模型
2.2.3 基于TANDEM的声学模型
2.3 语音识别的数据库和评价标准
2.3.1 数据库
2.3.2 语音识别系统的性能评价指标
2.4 实验结果及分析
2.5 本章小结
第3章 基于混淆网络的语音检索技术
3.1 混淆网络的概念
3.2 网格的定义
3.3 传统的混淆网络生成算法
3.4 快速的混淆网络生成算法
3.5 基于混淆网络的语音检索系统
3.6 实验结果及分析
3.7 本章小结
第4章 基于系统融合的语音检索技术
4.1 系统融合概述
4.2 基于直接串联的系统融合
4.3 识别器输出结果投票融合法
4.3.1 多识别结果动态对齐
4.3.2 投票准则
4.4 混淆网络融合法
4.5 索引融合法
4.6 实验结果及分析
4.7 本章小结
第5章 语音检索中置信度策略的研究
5.1 置信度的概念和意义
5.2 基于后验概率的置信度
5.3 基于伪相关反馈的置信度
5.3.1 伪相关反馈的概念
5.3.2 动态时间规划的基本原理
5.3.3 相似度得分
5.4 基于模板匹配的置信度
5.4.1 多模板的建立
5.4.2 高斯混合-通用背景模型
5.4.3 模板匹配得分
5.5 实验结果及分析
5.6 本章小结
第6章 总结与展望
6.1 论文总结
6.2 研究展望
参考文献
致谢
在读期间发表的学术论文