首页> 中文会议>第九届全国人机语言通讯学术会议 >基于后验概率词格的汉语自然对话语音索引

基于后验概率词格的汉语自然对话语音索引

摘要

语音索引是语音检索任务的关键问题之一,本文针对汉语自然对话语音索引问题进行研究,提出了基于子词的词格索引和融合方法。通过最优路径索引和词格索引的性能比较,选择词格进行索引,首先将词格进行后验概率表示,根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格,选择字、有调音节和无调音节作为子词单元,在汉语自然对话语音关键词检测任务上,关键词检测指标FOM从基线系统的68.3%分别提高到 70.9%,71.3%和73.3%,性能优于音节识别器音节索引方法。根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,FOM 指标由基线系统的68.3%(LVSCR)和66.9%(音节识别器)提高到78.8%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号