首页> 外文期刊>Journal of Information Science >Combination of similarity measures for effective spoken document retrieval
【24h】

Combination of similarity measures for effective spoken document retrieval

机译:结合相似性措施以有效获取语音文件

获取原文
获取原文并翻译 | 示例
       

摘要

Often users of information retrieval systems and document authors use different terms to refer to the same concept. For this simple reason, information retrieval is affected by the 'term mismatch' problem. The term mismatch problem does not only have the effect of hindering the retrieval of relevant documents, it also produces bad rankings of relevant documents. A similar problem can be found in spoken document retrieval, where terms misrecognized by the speech recognition process can hinder the retrieval of potentially relevant spoken documents. We will call this problem 'term misrecognition', by analogy to the term mismatch problem. This paper presents two classes of retrieval models that attempt to tackle both the term mismatch and the term misrecognition problems at retrieval time using term similarity information. The models use either complete or partial knowledge of semantic and phonetic term similarity, evaluated using statistical methods from the corpus.
机译:信息检索系统的用户和文档作者通常使用不同的术语来指代相同的概念。由于这个简单的原因,信息检索受到“术语不匹配”问题的影响。术语“不匹配问题”不仅具有阻碍相关文档检索的作用,而且还会导致相关文档排名不佳。在语音文档检索中会发现类似的问题,其中语音识别过程误识别的术语可能会阻碍潜在相关语音文档的检索。类似于术语不匹配问题,我们将这个问题称为“术语错误识别”。本文介绍了两类检索模型,这些模型试图在检索时使用术语相似性信息来解决术语不匹配和术语误识别问题。模型使用语义或语音术语相似性的全部或部分知识,并使用来自语料库的统计方法进行评估。

著录项

  • 来源
    《Journal of Information Science》 |2003年第2期|p.87-96|共10页
  • 作者

    Fabio Crestani;

  • 作者单位

    Department of Computer and Information Sciences, University of Strathclyde, 26 Richmond Street, Glasgow G1 1XH, Scotland, UK;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 情报学、情报工作;
  • 关键词

  • 入库时间 2022-08-17 23:21:22

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号