首页> 中文学位 >语音识别后文本处理系统中文本语音信息评价算法研究
【6h】

语音识别后文本处理系统中文本语音信息评价算法研究

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 论文项目背景

1.2 论文研究目的与意义

1.3 语音识别技术介绍

1.3.1 语音识别关键技术

1.3.2 语音识别研究面临的困难和发展趋势

1.4 国内外语音识别后处理研究现状

1.5 本文的基本思路和主要工作

1.5.1 拼音N—gram语言模型和数据平滑

1.5.2 连续拼音N—gram分析和评价

1.5.3 主要工作

1.6 论文的结构安排

第二章 拼音N—gram模型与数据平滑

2.1 汉语拼音与N—gram模型

2.1.1 汉语拼音基础

2.1.2 二元拼音语法模型

2.1.3 三元拼音语法模型

2.1.4 二元和三元拼音语法模型比较

2.2 数据平滑策略

2.2.1 加法平滑

2.2.2 Good—Turing平滑

2.2.3 Witten—Bell平滑

2.2.4 Katz回退平滑

2.3 平滑策略选择

2.4 构建拼音知识库

2.5 本章小结

第三章 连续拼音N—gram分析与评价

3.1 连续拼音N—gram值特点

3.2 N—gram值连续低的点分析

3.3 N—gram值高低点波动幅度分析

3.4 相邻点的N—gram概率值分析

3.5 锚点词

3.6 拼音混淆规则

3.7 拼音稳定度

3.8 拼音相似度

3.9 评价方法

3.10 本章小结

第四章 基于拼音N—gram的语音识别结果检错纠错系统

4.1 系统设计基本思想

4.2 本文研究在系统中的关键技术

4.2.1 定位锚点词

4.2.2 纠错候选词的生成和辅助纠错结果选择

4.3 系统框架与流程

4.4 基于拼音N—gram的语音识别检错纠错系统实现

4.4.1 程序清单,类和函数

4.4.2 程序运行示例

4.5 本章小结

第五章 系统测试与结果分析

5.1 测试环境和测试语料

5.2 二元和三元语法模型与不同平滑策略结果比较

5.3 系统检错纠错实验结果

5.4 锚点词定位结果分析

5.5 基于N—gram的锚点词和使用语境核心词对比

5.6 错误类型分析和效果比较

5.7 本章小结

第六章 总结与展望

参考文献

附 录

附录 1 程序清单,类和函数

致 谢

攻读硕士学位期间发表的学术论文目录

展开▼

摘要

当今语音识别技术迅猛发展,已经开始在许多领域进行应用,但依然存在许多问题。首先,由于背景噪音、说话人口音和表达方式的不规范以及新词的不断出现,实际环境中语音识别的正确率一直不尽如人意。而且,语音文档检索开始大规模应用,有许多语音识别后文本需要进行大规模处理。因此,我们采取对语音识别后的结果进行后处理,以此改善语音识别效果。
   本篇论文主要基于教育部科学技术研究重点项目“语音识别结果的鲁棒性理解方法关键技术研究”,该项目旨在通过对语音识别结果进行分析,得到更加正确,完整的语音识别结果。在此项目研究背景下,本文在完成一个完整的语音识别后文本处理系统中对文本语音信息评价算法进行了深入研究。本文的主要研究内容和工作有:
   1.拼音语法知识库的搭建。对拼音N-gram模型与数据平滑介绍和对比分析,得到更加合适中文拼音的语法模型与数据平滑方法,并介绍如何搭建使用不同语法模型和平滑方法的拼音知识库。
   2.语音识别结果锚点词的定位。对连续拼音N—gram模型进行分析和评价,总结相应规律,辅助应用拼音稳定度,最后得到锚点词的确定方法。
   3.纠错候选建议。该部分在介绍拼音混淆规则后得到相应的相似拼音并转换成对应候选词。为了对候选词进行打分,使用拼音相似度来衡量与原拼音的接近程度。
   4.应用算法至实际系统。将上述算法实际应用到一个完整的语音识别检错纠错系统中,介绍其系统框架与具体实现,解释本文工作在其中发挥的作用,对比分析实际应用效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号