基于非限定词图的关键词检索

摘要

在关键词系统进行快速索引的时候,因为速度的提升,剪枝力度的加大,会造成召回率的严重不足,究其原因是因为解码生成的词图会丢失很多的信息。在本文中,集中关注了这个问题,针对快速解码条件下语音检索系统召回率不足的问题,从优化索引形式角度入手,提出新的语音识别输出形式,尽可能多地保留语音识别解码过程中搜索空间的活跃词假设,以提高语音检索系统的召回率。提出了非限制词图扩展的算法来保留在剪枝中被剪掉但是可能含有一定信息量的路径。此方法是去除词图中N元语言模型的限制来重新构建非限制词图.在两个中文测试集上,对比了非限制词图与传统的N元词图的性能,在各项指标上,非限制词图比N元词图性能有比较大的改善。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号