首页> 中文会议>第九届全国人机语言通讯学术会议 >实际场景语料和FSN语料的平衡方法

实际场景语料和FSN语料的平衡方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文研究了人机日常对话领域语料的生成方法, 这些语料将被用来训练连续语言识别器的语言模型。语料的来源主要有两部分：一部分是已有的通过整理实际应用场景下录音得到的语料，我们称之为实际场景语料；第二部分是用有限状态网络(Finite State Network, FSN)句法规则方法生成的语料，我们称之为 FSN 语料。本文重点研究了这两种语料的平衡方法，即以何种方法、何种比例混合这两种语料，得到最终训练语料，提出了以实际场景语料和FSN语料中共有的关键词的概率比较为基础，用一定倍数的部分实际场景语料扩展 FSN 语料，得到最终语言模型训练语料的方法。用该方法得到的语料训练的语言模型使连续语音识别器的识别性能有了较大提高。

著录项

来源
《第九届全国人机语言通讯学术会议》|2007年||共4页
会议地点安徽黄山
作者
熊军军; 中国科学院研究生院; 李成荣;
展开▼
作者单位

中国中文信息学会;

中国声学学会;

中国语言学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音识别与设备;
关键词
关键词概率; 语料扩展; 语言模型; 有限状态网络; 人机对话;

相似文献

中文文献
外文文献
专利

1. 二十一世纪语料库语言学的新发展——《语料库语言学:方法、理论与实践》评述 [J] . 司艳辉 ,葛晓帅 . 文教资料 . 2017,第005期
2. 语料库语言学研究的新进展——《语料库语言学研究中的三角验证方法》评介 [J] . 张懂 . 语言教育 . 2017,第003期
3. 汉语中介语语料库XML标注方法的应用r——基于HSK动态作文语料库的分析 [J] . 郑美平 . 福建江夏学院学报 . 2015,第006期
4. 浅析《基于语料库的中国新闻英语主题词研究》中语料库方法的运用 [J] . 唐学琦 . 丝绸之路 . 2014,第014期
5. 语料库研究方法应用的探讨——以KingsleyBolton等基于语料库的学生英语写作中连接词的使用研究为例 [J] . 徐玉秀 . 海外英语 . 2014,第05X期
6. 基于生语料、最大匹配切分语料以及熟语料的中文词频估计方法 [C] . 乔维 ,孙茂松 . 第三届学术计算语言学研讨会 . 2006
7. 大规模平衡语料的收集分析及文本分类方法研究 [A] . 陈克利 . 2004

实际场景语料和FSN语料的平衡方法

摘要

著录项

相似文献

相关主题

期刊订阅