语音识别后文本处理系统中文本语音信息评价算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

当今语音识别技术迅猛发展，已经开始在许多领域进行应用，但依然存在许多问题。首先，由于背景噪音、说话人口音和表达方式的不规范以及新词的不断出现，实际环境中语音识别的正确率一直不尽如人意。而且，语音文档检索开始大规模应用，有许多语音识别后文本需要进行大规模处理。因此，我们采取对语音识别后的结果进行后处理，以此改善语音识别效果。
　　本篇论文主要基于教育部科学技术研究重点项目“语音识别结果的鲁棒性理解方法关键技术研究”，该项目旨在通过对语音识别结果进行分析，得到更加正确，完整的语音识别结果。在此项目研究背景下，本文在完成一个完整的语音识别后文本处理系统中对文本语音信息评价算法进行了深入研究。本文的主要研究内容和工作有：
　　 1.拼音语法知识库的搭建。对拼音N-gram模型与数据平滑介绍和对比分析，得到更加合适中文拼音的语法模型与数据平滑方法，并介绍如何搭建使用不同语法模型和平滑方法的拼音知识库。
　　 2.语音识别结果锚点词的定位。对连续拼音N—gram模型进行分析和评价，总结相应规律，辅助应用拼音稳定度，最后得到锚点词的确定方法。
　　 3.纠错候选建议。该部分在介绍拼音混淆规则后得到相应的相似拼音并转换成对应候选词。为了对候选词进行打分，使用拼音相似度来衡量与原拼音的接近程度。
　　 4.应用算法至实际系统。将上述算法实际应用到一个完整的语音识别检错纠错系统中，介绍其系统框架与具体实现，解释本文工作在其中发挥的作用，对比分析实际应用效果。

著录项

作者
王兴建;
展开▼
作者单位

北京邮电大学;

展开▼
授予单位北京邮电大学;
学科信号与信息处理
授予学位硕士
导师姓名李蕾;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;算法理论;
关键词
语音识别; 后文本处理系统; 文本语音; 信息评价算法; 数据平滑;

相似文献

中文文献
外文文献
专利

1. 语音识别后文本纠检错算法研究 [J] . 马文晖 ,冯国斌 ,刘为民 . 铁道通信信号 . 2020,第011期
2. 基于全信息自然语言理解的语音识别后文本处理 [J] . 李蕾 ,许晶 ,龚媛 . 北京邮电大学学报 . 2006,第z2期
3. 基于word2vec的语音识别后文本纠错 [J] . 张佳宁 ,严冬梅 ,王勇 . 计算机工程与设计 . 2020,第011期
4. 文本文件的语音识别中汉语音节的特征分析 [J] . 张晓东 ,吴捷 . 巢湖学院学报 . 2004,第003期
5. 汉语连续语音识别结果评价算法研究 [J] . 刘刚 ,陈伟 ,郭军 . 中国通信 . 2010,第002期
6. 基于全信息自然语言理解的语音识别后文本处理 [C] . 李蕾 ,许晶 ,龚媛 . 信息、知识、智能及其转换理论第一次高峰论坛 . 2006
7. 基于铁路车务语境的语音识别后文本处理研究 [A] . 王琼 . 2020

语音识别后文本处理系统中文本语音信息评价算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅