您现在的位置: 首页> 研究主题> Top-k查询

Top-k查询

Top-k查询的相关文献在2005年到2022年内共计101篇,主要集中在自动化技术、计算机技术、数学、无线电电子学、电信技术 等领域,其中期刊论文83篇、会议论文13篇、专利文献21907篇;相关期刊41种,包括电子设计工程、传感器与微系统、智能计算机与应用等; 相关会议9种,包括第33届中国数据库学术会议(NDBC2016 )、第32届中国数据库学术会议、第29届中国数据库学术会议等;Top-k查询的相关文献由268位作者贡献,包括王国仁、王珊、刘亮等。

Top-k查询—发文量

期刊论文>

论文:83 占比:0.38%

会议论文>

论文:13 占比:0.06%

专利文献>

论文:21907 占比:99.56%

总计:22003篇

Top-k查询—发文趋势图

Top-k查询

-研究学者

  • 王国仁
  • 王珊
  • 刘亮
  • 卢印举
  • 周傲英
  • 张志强
  • 李建中
  • 王斌
  • 秦小麟
  • 谢晓芹
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 郑吉平; 马源; 马炜; 郝志扬; 王美静
    • 摘要: 面临大量数据时,如何从中摘取一部分感兴趣的数据帮助用户进行决策是数据库系统的一项重要功能.在过去几十年里,top-k和skyline查询是两种最常用的技术手段,但他们分别存在不能控制输出结果大小与需要用户提供效用函数的缺陷.为克服两者的缺陷,k代表点查询技术应运而生;其中性质较好、受到较多关注的是k-遗憾查询.本文首先回顾了skyline、top-k查询和几种典型的代表点查询.随后,详细地介绍了k-遗憾查询的概念与方法,从多个角度分析了提升查询质量的途径,并对k-遗憾查询的变体进行了研究.最后对未来遗憾最小化查询的可能研究方向与应用前景进行了展望.
    • 穆聪聪; 王一舒; 袁野; 乔百友; 马玉亮
    • 摘要: 稠密子图的查询是图分析领域的重要研究问题之一,在社交用户相关性分析、Web中社群分析等方面都有着广泛的应用.目前,关于稠密子图查询的研究工作主要基于静态图.而在实际应用中,时序信息会对稠密子图查询产生重要的影响,使得图拓扑结构随时间序列不断发生变化,包含的信息量也不断增加,使得已有的针对静态图的查找方法不再适用于时序图.因此,如何高效地在时序图上查找稠密子图仍然是一个挑战.为了解决上述挑战,首先规范化地定义了基于时序图的稠密子图查找问题;然后,根据图的拓扑结构和包含时间标签的边之间的相似度,提出一种基于阈值的近似查找算法DTS-base.为了加快算法的收敛速度,提出了一个基于快速计算最大相似度时间片的优化算法DTS-opt.最后,通过在真实数据集上的实验,证明了所提算法的高效性和可扩展性.
    • 李靓琦; 黄玉龙; 谢绍国
    • 摘要: 当前移动互联网得到了快速发展,各类嵌入式硬件的计算性能也得到了极大提升.作为信息检索领域的经典问题,Top-k查询在移动应用得到了非常广泛的使用.结合LARA以及SC算法的优势,提出一种适合Jetson-Tk1开发板架构的Top-k查询算法.实验结果表明,提出的算法可以在几秒钟内在数百万个对象中查找出100个分值最大的对象,具有较好的实用性能.
    • 牛炳鑫; 刘秀龙; 谢鑫; 李克秋; 曹建农
    • 摘要: 在动态多类别RFID(Radio Frequency Identification)系统中,某类标签的缺失数量能够反映该类别的"热门"程度.因此,如何快速准确地找出缺失数量最多的k类标签对制定合理的营销策略具有重要意义.为此,该文首次定义了动态多类别RFID系统中针对热门标签类别TOP-k查询问题,并提出了符合EPC C1G2标准的快速查询协议Hot TOP-k Query(HTKQ).其核心思想是,先用阅读器监听当前系统中所有标签参与帧时隙阿罗哈协议的过程,并记录每个时隙的状态,从而获得真实时隙帧向量;然后在服务器端保存的每类标签ID集合上分别虚拟执行阿罗哈协议,为每个标签类别分别得到虚拟时隙帧向量.该文利用概率统计的方法,通过对比两类时隙帧的差异,分别估计每类标签的缺失数量.该文提出了大量理论分析,在保证查询结果准确性的同时优化参数使得算法时间代价最小.大量的仿真实验结果表明,该文提出的HTKQ协议能够在不同实验条件下满足预定的查询精度,并且当RFID系统中标签类别较多时,HTKQ协议的时间效率比现有协议可以提升80%.%In dynamic multi-category RFID systems, the number of absent tags in a category can reflect the popularity of this tag category.Hence, it is of great importance to quickly and accurately pinpoint the k categories whose absent tags are the most, for the purpose of making proper marketing strategies.In practical RFID applications, tags are usually categorized into various categories according to the brands or manufacturers of the items that the tags are attached to.We consider a set of tags where each tag has a unique ID that consists of two fields:a category ID that specifies the category of the tag, and a member ID that identifies the tag within its category.Besides the multi-category property, RFID systems also have the dynamic property, e.g., the tagged items are frequently moved out of (or into) the system.This may entail that the set of tags in the current system is not consistent with that stored in the database on the back-end server side.We refer to the tags whose IDs are stored in database but are not present in the system asthe absent tags.The number of absent tags in a category sometimes reflects the popularity of this category, e.g., the absent tags may be the sold tagged items in a market.The popular pareto principle states that, for many events, roughly 80%of the effects come from 20%of the causes.Hence, the most popular k categories whose absent tags are the most may determine the profit and loss of a retailer.This paper takes the first step to define the problem of TOP-k query for popular categories in dynamic multi-category RFID systems, and proposes the EPC C1 G2-compliant fast query protocol called Hot TOP-k Query (HTKQ).Its basic idea is to let the reader monitor the communication process that the present tags in the current system participate in the framed slotted Aloha protocol, and record each slot state to obtain an actual frame vector.Then, we virtually execute the framed slotted Aloha protocol on the tag IDs in each category that is stored in the back-end server to obtain a virtual frame vector for each category.By comparing the difference between these two vectors, this paper uses statistical methods to estimate the number of absent tags in each category.As the frames go on, the variance in the average estimate will decrease.Moreover, HTKQ can delete the categories whose absent tag numbers are obviously small, and are very likely not in the TOP-kset.Thus, the valuable communication resource can be left for the categories that are more likely in TOP-k set.The HTKQ protocol does not terminate until the number of remaining tags is equal to k, and these categories have met the predefined estimation accuracy.This paper proposes sufficient theoretical analysis to guarantee the query accuracy, meanwhile optimizing the involved parameters to minimize the time cost of the proposed protocol.The extensive simulation results reveal that, the proposed HTKQ protocol can ensure the predefined query accuracy under various conditions, and outperforms the existing protocols by 80% at most in terms of time-efficiency when there are a large number of categories in the system.
    • 郭帅; 刘亮; 秦小麟
    • 摘要: 定位技术和文本处理技术的结合使空间关键词查询处理技术成为研究热点.传统空间关键词查询由单用户提出,包含一个查询位置和一组查询关键词.协同空间关键词Top-k查询(TKCSKQ)返回离多个查询位置近、文本与多组查询关键词相关度高的Top-k对象.针对TKCSKQ中多组查询关键词存在重复和近义关键词,设计了基于查询关键词权重的关键词相关度计算公式.对IR-tree进行了扩展,提出了支持近义关键词匹配的SKNIR-tree索引,并基于SKNIR-tree提出了高效的协同空间关键词Top-k查询处理算法(TKCSK).通过维护一个优先队列以及计算每个节点与查询的最小空间文本相关度来达到剪枝目的,快速识别结果对象.实验结果表明,TKCSK算法的性能相比基础算法平均提高3倍.
    • 朱睿; 王斌; 杨晓春; 王国仁
    • 摘要: Top-k连续查询是流数据管理领域的经典问题,它监听窗口内的数据.当窗口滑动时,该查询返回窗口内分值最高的k个元素.许多学者已针对该问题展开研究,并提出一系列高效算法.然而,现有算法的假设条件是流数据是以顺序的形式到达窗口,这一假设在实际应用中显然是不成立的.更重要的是·这些算法对于数据间的时序关系非常敏感,这导致它们在乱序环境下无法高效工作.鉴于乱序流的普遍性和top-k连续查询的重要性,该文基于滑动窗口模型研究高速乱序环境下的top-k连续查询问题.和传统的问题定义不同,该查询返回窗口中满足时序约束条件的k个分值最高的对象.该文提出查询处理框架GSTopK支持该查询.该框架的核心思想是维护窗口中对象集合的一个子集.当窗口滑动时,新的查询结果可在该子集中找到.为了高效维护候选集,GSTopK一方面需高效过滤新流入窗口的数据中不可能成为查询结果的对象,从而降低候选集的更新频率.另一方面,GSTopK需降低乱序对算法带来影响.为达到上述两个目标,该文首先提出边界窗口和边界对象的概念.以此为基础,该文提出了两种面向不同分布的哈希过滤器.它们将边界对象的分值作为键值从而过滤产生于不同时刻的乱序数据.对于被过滤的对象,算法保证它们不会成为查询结果.对于无法被过滤的对象,该文提出一种基于栈操作的候选对象维护算法.和已有算法相比,该算法不仅效率更高而且对数据的时序关系不敏感.假设窗口长度为N,流速为s,GSTopK可将原有算法的时间复杂度从O(N)降低到O(max(1,Nk/s2)).最后,通过大量实验验证了该文所提出算法的有效性.
    • 连春月; 李孝忠; 牛浩浩
    • 摘要: 基于机会理论,提出了在非确定数据和不确定数据同时存在条件下的不确定随机网络的Top-k最近节点的查询问题.对一个不确定随机网络,在一定的机会测度下,将节点间的权重建模为节点间的路径长度,根据路径长度寻找距离指定节点最近的k个节点.该算法能有效解决在经验数据和小样本数据混杂情况下的节点查询问题.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号