首页> 中文学位 >语音识别置信度特征提取算法研究
【6h】

语音识别置信度特征提取算法研究

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 什么是语音识别的置信度

1.2 研究语音识别置信度的意义

1.3 国内外相关研究现状

1.3.1 传统的置信度特征

1.3.2 基于高层语义信息的置信度特征

1.4 论文的研究内容

1.4.1 环境特征

1.4.2 基于主题相似性的语义层置信特征

1.5 论文的组织结构

第二章 大规模连续语音识别原理

2.1 引言

2.1.1 声学特征提取

2.1.2 隐马尔可夫模型

2.2 语言模型

2.2.1 n—gram语言模型

2.2.2 建立音素级语言模型

2.2.3 稳健的语言模型

第三章 基于混淆网络的置信度标记基线系统

3.1 引言

3.2 音素网络lattice

3.2.1 lattice的结构

3.2.2 基于lattice的关键词后验概率估计

3.3 混淆网络mesh

3.3.1 混淆网络概述

3.3.2 基于lattice的混淆网络生成方法

3.4 基于SVM的置信度标记

3.4.1 SVM支撑向量机

3.4.2 基于SVM的置信度标记与评价标准

第四章 环境特征

4.1 引言

4.2 环境特征

4.2.1 上下文特征

4.2.2 动态特征

4.2.3 句全局特征

4.3 实验设计

4.3.1 系统框架

4.3.2 实验数据

4.4 实验结果

4.5 结论与展望

第五章 基于主题相似度的语义层特征

5.1 引言

5.2 LDA模型

5.3 基于主题相似性的语义层特征提取算法

5.3.1 词的主题分布

5.3.2 上下文主题分布

5.3.3 主题相似性

5.4 实验设计

5.4.1 系统框架

5.4.2 实验数据

5.4.3 基于主题相似性的语义层置信特征提取算法参数选择

5.5 实验结果

5.6 结论与展望

第六章 总结与展望

参考文献

致 谢

攻读硕士学位期间发表的论文

展开▼

摘要

大规模连续语音识别的研究已经进行了二十多年,虽已取得了显著进展,但距离广泛应用还有相当的距离。在克服识别算法本身缺陷、追求识别性能提升的过程中,研究者们逐渐引入了置信度的概念,用它来衡量语音识别系统所作决策的可信程度。近年来,语音识别置信度在语音错误检测与错误纠正,无监督和半监督训练、多遍搜索技术和语料库中错误语料甄选等应用中都发挥了非常重要的作用。传统的语音识别置信度标注基于不同置信特征或者特征组合进行分类判决,目前常使用的置信特征主要来源于解码信息。但是,一方面现有置信度特征对解码信息的挖掘仍局限于孤立和静态,而忽略了词与周围环境之间的关系;另一方面,目前声学特征仍占主要地位,而人类听觉实验表明,人在进行语音理解时,大约有30%的信息来自于语法、语义等知识的指导。因此,在置信度特征提取中,如何挖掘出词与环境之间的关系,同时提炼出词的语法和语义特征,从而提高识别后处理性能,是一个非常值得研究的问题。
   本文在搭建传统语音识别置信度标记系统的基础上,提出了两种新的置信度特征,一是环境特征,分为上下文环境、动态环境、句全局环境三类,通过对解码信息的再加工,从空间与时间角度较全面地描述了词与环境之间的关系;二是基于主题相似性的语义层置信特征提取算法TSS(Topic Similarity based Semanticconfidence feature extraction algorithm),通过主题模型LDA(Latent Dirichlet Allocation)计算得到识别结果中词的主题分布及其上下文的主题分布,并将二者之间的主题相似性作为词的语义置信特征。实验表明,本文提出的两种特征深入挖掘了解码层的有效信息,又增加了置信特征的信息来源,与解码层置信特征进行组合后能有效地提高置信度标注的精度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号