【24h】

A Method for Open-Vocabulary Speech-Driven Text Retrieval

机译:一种开放词汇语音驱动文本的检索方法

获取原文
获取原文并翻译 | 示例

摘要

While recent retrieval techniques do not limit the number of index terms, out-of-vocabulary (OOV) words are crucial in speech recognition. Aiming at retrieving information with spoken queries, we fill the gap between speech recognition and text retrieval in terms of the vocabulary size. Given a spoken query, we generate a transcription and detect OOV words through speech recognition. We then correspond detected OOV words to terms indexed in a target collection to complete the transcription, and search the collection for ' documents relevant to the completed transcription. We show the effectiveness of our method by way of experiments.
机译:尽管最近的检索技术并没有限制索引词的数量,但词汇外(OOV)词在语音识别中至关重要。为了通过口头查询检索信息,我们根据词汇量来填补语音识别和文本检索之间的空白。给定一个口头查询,我们生成一个转录并通过语音识别来检测OOV单词。然后,我们将检测到的OOV单词与目标集合中索引的术语相对应以完成转录,并在集合中搜索与完成的转录有关的'文档。我们通过实验证明了我们方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号