首页> 中文学位 >大词表自然语音关键词识别系统的研究与实现
【6h】

大词表自然语音关键词识别系统的研究与实现

代理获取

目录

文摘

英文文摘

声明

致谢

1 引言

1.1 关键词识别的研究背景与意义

1.1.1 关键词识别的意义

1.1.2 关键词识别技术的应用

1.2 关键词识别的发展历史与现状

1.3 本文的主要工作和组织结构

2 关键词识别的相关技术

2.1 预处理与特征提取提取

2.1.1 预处理

2.1.2 时域特征参数

2.1.3 频域特征参数

2.2 声学层HMM模型

2.2.1 马尔可夫链

2.2.2 HMM的定义

2.2.3 HMM的三个假设

2.2.4 HMM的三个基本问题及解决办法

2.2.5 HMM算法实现中的问题

2.3 语言学模型

2.4 关键词搜索与关键词确认

2.5 本章小结

3 关键词识别系统的结构与性能评价

3.1 关键词识别系统的基本结构

3.1.1 基于Filler模型的KWS系统

3.1.2 基于LVCSR的KWS系统

3.1.3 两种系统结构的性能比较

3.1.4 本文的关键词识别系统结构

3.2 关键词识别系统的性能评价指标

3.3 实验数据说明

3.4 本章小结

4 关键词搜索

4.1 两种语音识别结果

4.1.1 N-Best词格

4.1.2 音节网格

4.2 关键词搜索算法

4.3 关键词输出准则

4.4 实验结果与分析

4.5 本章小结

5 置信度确认

5.1 置信度的定义

5.1.1 统计假设检验的角度

5.1.2 模式识别的角度

5.2 置信度的构造方法

5.2.1 明确垃圾模型

5.2.2 在线垃圾模型

5.3 三种常用置信度

5.3.1 基于声学模型的置信度

5.3.2 基于后验概率的置信度

5.3.3 基于动态排名信息的置信度

5.3.4 实验结果与分析

5.4 置信度融合

5.4.1 基于声学置信度和后验概率的混合置信度

5.4.2 基于动态排名和后验概率的混合置信度

5.5 本章小结

6 系统的整体实现

6.1 预处理与特征提取

6.2 语音识别器

6.2.1 声学层模型的训练

6.2.2 语言学模型的训练

6.2.3 最优路径搜索

6.3 关键词搜索

6.4 置信度确认

6.5 系统性能

6.5.1 系统运行

6.5.2 系统的性能曲线

6.5.3 系统运行速度

6.6 本章小结

7 结论

7.1 论文工作总结

7.2 未来工作展望

参考文献

作者简历

展开▼

摘要

语音识别作为人机交互的一种重要方式,有着广阔的应用前景。关键词识别是语音识别的一种特殊情况,同传统的连续语音识别相比,有正确率高,实用性强等特点,因此关键词识别技术是近年来语音识别领域的一个研究热点。 本文的主要内容是研究实现一个与说话人无关、与任务无关、针对自然语音、 大关键词表的关键词识别系统。 本文首先介绍了关键词识别的相关技术,包括语音的预处理与特征参数的提取,声学层HMM模型、语言学模型和关键词搜索及关键词确认。然后依据本文目标,设计本文的系统框架,包含预处理和特征提取、语音识别器、关键词搜索和置信度确认四大模块。 在关键词搜索模块中,本文对语音识别器的两种结果,即N-Best音节格和音节网格进行实验讨论,实验结果表明,基于音节网格的关键词搜索,在检测率和运行速度上都优于基于N-Best音节格的关键词搜索。 置信度确认中,阐述了目前常用的三种置信度:基于声学模型的置信度、基于后验概率的置信度和基于动态排名信息的置信度。通过实验及理论分析三者的优缺点,在此基础上,对其进行置信度融合得到两种混合置信度:一种是基于声学置信度和后验概率的混合置信度,另一种是基于动态排名和后验概率的混合置信度。实验结果表明,两种混合置信度较单独使用一类置信度性能更佳,且基于声学置信度和后验概率的混合置信度效果更优。 基于上述实验研究结果,采用实验得到的最优方法对系统进行实现,用1小时的电话信道口语对话语音对系统进行测试,实验结果表明针对一个500个关键词的检测任务,系统的品质因素为74.50%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号