首页> 外文学位 >Anytime top-k queries on exact and fuzzy data.
【24h】

Anytime top-k queries on exact and fuzzy data.

机译:随时对准确和模糊的数据进行前k个查询。

获取原文
获取原文并翻译 | 示例

摘要

Top-k queries on large multi-attribute data sets are fundamental operations in information retrieval and ranking applications. In this thesis, we initiate research on the anytime behavior of top-k algorithms on exact and fuzzy data. In particular given specific top-k algorithms we are interested in studying their progress towards identification of the correct result at any point of the algorithms' execution. We adopt a probabilistic approach where we seek to report at any point the scores of the top-k results the algorithm has identified, as well as associate a confidence with this prediction. Such functionality can be a valuable asset when one is interested to reduce the runtime cost of top-k computations. We show analytically that such probability and confidence are monotone in expectation. We present a thorough experimental evaluation to validate our techniques using both synthetic and real data sets.
机译:对大型多属性数据集的前k个查询是信息检索和排名应用程序中的基本操作。在本文中,我们开始研究top-k算法在精确和模糊数据上的随时行为。特别是在给定特定的top-k算法的情况下,我们感兴趣的是研究它们在算法执行的任何时候在识别正确结果方面的进展。我们采用一种概率方法,在此方法中,我们试图在任何时候报告算法已识别出的前k个结果的分数,并将可信度与该预测相关联。当人们有兴趣减少top-k计算的运行时成本时,此类功能可能是一项宝贵的资产。我们通过分析表明,这种概率和置信度在期望中是单调的。我们提供了全面的实验评估,以使用综合和真实数据集验证我们的技术。

著录项

  • 作者

    Chaudhari, Bhushan.;

  • 作者单位

    The University of Texas at Arlington.;

  • 授予单位 The University of Texas at Arlington.;
  • 学科 Computer Science.
  • 学位 M.S.
  • 年度 2006
  • 页码 67 p.
  • 总页数 67
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术 ;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号