首页> 外文OA文献 >Exploiting Query Structure and Document Structure to Improve Document Retrieval Effectiveness
【2h】

Exploiting Query Structure and Document Structure to Improve Document Retrieval Effectiveness

机译:利用查询结构和文档结构提高文档检索效率

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In this paper we present a systematic analysis of documentretrieval using unstructured and structured queries withinthe score region algebra (SRA) structured retrieval framework. The behavior of di®erent retrieval models, namelyBoolean, tf.idf, GPX, language models, and Okapi, is testedusing the transparent SRA framework in our three-level structured retrieval system called TIJAH. The retrieval models are implemented along four elementary retrieval aspects: element and term selection, element score computation, score combination, and score propagation.The analysis is performed on a numerous experimentsevaluated on TREC and CLEF collections, using manuallygenerated unstructured and structured queries. Unstructured queries range from the short title queries to long title+ description + narrative queries. For generating structuredqueries we exploit the knowledge of the document structureand the content used to semantically describe or classifydocuments. We show that such structured information canbe utilized in retrieval engines to give more precise answers to user queries then when using unstructured queries.
机译:在本文中,我们介绍了在分数区域代数(SRA)结构化检索框架内使用非结构化和结构化查询对文档检索进行的系统分析。在我们称为TIJAH的三级结构化检索系统中,使用透明的SRA框架对不同的检索模型(即布尔,tf.idf,GPX,语言模型和Okapi)的行为进行了测试。检索模型沿四个基本检索方面实现:元素和术语选择,元素分数计算,分数组合和分数传播。使用人工生成的非结构化和结构化查询,对对TREC和CLEF集合进行评估的大量实验进行分析。非结构化查询的范围从短标题查询到长标题+描述+叙述查询。为了生成结构化查询,我们利用了文档结构的知识以及用于语义描述或分类文档的内容。我们表明,与使用非结构化查询时相比,可以在检索引擎中利用这种结构化信息为用户查询提供更精确的答案。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号