您现在的位置: 首页> 研究主题> 最近邻查询

最近邻查询

最近邻查询的相关文献在2004年到2022年内共计93篇,主要集中在自动化技术、计算机技术、科学、科学研究、公路运输 等领域,其中期刊论文58篇、会议论文6篇、专利文献23021篇;相关期刊33种,包括齐齐哈尔大学学报(自然科学版)、电信科学、计算机工程等; 相关会议6种,包括第33届中国数据库学术会议(NDBC2016 )、第28届中国数据库学术会议、第八届中国计算机图形学大会等;最近邻查询的相关文献由182位作者贡献,包括姚斌、李松、郝忠孝等。

最近邻查询—发文量

期刊论文>

论文:58 占比:0.25%

会议论文>

论文:6 占比:0.03%

专利文献>

论文:23021 占比:99.72%

总计:23085篇

最近邻查询—发文趋势图

最近邻查询

-研究学者

  • 姚斌
  • 李松
  • 郝忠孝
  • 张丽平
  • 李飞飞
  • 肖小奎
  • 高云君
  • 过敏意
  • 陈中普
  • 郝晓红
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 张芳; 孙鹏; 李杨
    • 摘要: 针对用户移动后解析服务节点切换问题,文中提出一种基于Geohash网格编码的节点地理邻居生成方法,用于新服务节点的快速发现。该方法通过把节点的地理位置转换为Geohash网格编码,借助编码规律提高近邻查询效率。实验结果表明,与kNN查询中最精确的穷举法对比,在保证地理邻居节点查全率的情况下,节点数量级为104时,算法平均耗时下降60%,且随着节点数量的不断上升,算法耗时下降比例会继续增加。在节点数量较大时,所提方法可以大量节省计算资源。
    • 陈可心; 陈业斌
    • 摘要: 针对路网数据存储数据量较大、常规查询算法效率较低的问题,将存储技术与查询算法相结合,提出利用4-叉树结构对路网数据进行均匀划分的最近邻查询算法.首先根据兴趣点使用Voronoi图将空间划分为多个相邻空间单元,利用空间均分法对整个空间区域分区,使每个分区包含若干个空间单元;再使用4-叉树结构创建内存索引数据,降低最近邻查询的数据范围;最后采用OSM(open street map)官网的路网数据进行分区查询实验验证.结果 表明,与传统迭代切分法和折半分割法相比,建立在结构化分区上的最近邻查询算法可大大提高路网数据的查询效率.
    • 王波涛; 李昂; 陈月梅; 邓诗卓; 常博涵; 吴俊学
    • 摘要: 隐私问题受到越来越多的关注,基于计算的私有信息检索(CPIR)的隐私保护技术允许用户从服务提供商检索数据并且不会泄露查询信息.但是,对于大规模应用,隐私保护技术与可用性之间存在较大差距.针对CPIR算法计算量大、计算时间长而不适合应用于大规模数据隐私保护的问题,提出了基于Spark和Huff man编码的CPIR最近邻查询隐私保护算法(H-PCPIR-V).H-PCPIR-V算法主要是在数据预处理阶段将最近邻矩阵使用Huff man编码进行压缩减少计算位数,然后通过压缩后矩阵中元素的最大位数对其他元素进行补位,在服务端使用Spark并行框架对查询网格进行并行计算.通过对比实验及实验结果分析发现,相比PCPIR-V算法,H-PCPIR-V算法在服务端的计算代价下降30%左右,客户端的计算代价下降10%左右,通信代价下降40%左右.%With the privacy issues drawing more and more concerns,privacy protection techniques based on Computational Private Information Retrieval (CPIR) allow a user to retrieve data from a service provider without revealing the users query information.For large-scale applications,there exists a gap between privacy protection techniques and its feasibility.For the problem that the CPIR algorithm needs long computing time so as not to be suitable for large-scale data privacy protection,this paper proposes a CPIR nearest neighbor privacy protection algorithm (H-PCPIR-V) based on Spark and Huffman code.The H-PCPIR-V algorithm partitions the spatial data into Voronoi diagrams according to the points of interest in the data preprocessing stage,and then utilizes the Huffman code to compress the candidate data in order to reduce bit computation operation.Spark parallel framework is used for query grid parallel computing in the server side.The experimental results show that the computational cost of HPCPIR-V algorithm is about 30 % lower than that of PCPIR-V algorithm on the server side,the computational cost of client is about 10% lower,and the communication cost is about 40% lower.
    • 鲍金玲; 王斌; 杨晓春; 朱怀杰
    • 摘要: Nearest neighbor query,as one of the building blocks of location-based service,has become a hot research topic in recent years.Compared with Euclidean space,road network is a more practical model in real applications;hence,nearest neighbor query in road network has received broader research efforts.In road network,tremendous data are generated along with sophisticated data structure,making nearest neighbor query computationally expensive.This poses a major challenge to spatial database community on its effort to effectively improve the query processing efficiency for nearest neighbor query.This work summarizes existing nearest neighbor query techniques in road network,and conducts analysis and comparison among them,from various perspectives including indexing structure and algorithm implementation.Additionally,several variants of nearest neighbor query are also summarized in this work.Finally,future research focus and trend for nearest neighbor query in road network are discussed.%最近邻查询作为基于位置服务的重要支持性技术之一,引起了众多学者的广泛关注和深入研究.相对于欧式空间而言,路网环境下的最近邻查询更贴近人们的生活,有着更重要的研究意义.路网环境下庞大的数据量和复杂的数据结构,使得最近邻查询的操作代价变得非常昂贵,如何有效地提高查询效率,是研究者面临的主要挑战.对路网环境下的最近邻查询技术进行综述,分别从最近邻查询采用的索引结构和查询处理过程对现有路网环境下的最近邻查询方法进行了分析和比较,也介绍了路网环境下最近邻的变体查询技术的研究情况,最后探讨路网上最近邻查询技术未来的研究重点.
    • 朱命冬; 申德荣; 寇月; 聂铁铮; 于戈
    • 摘要: 局部敏感哈希方法(LSH)已经被广泛用于高维数据和大规模数据集的最近邻查询,然而现有方法大多将LSH方法用于单一类型的数据,文中尝试将LSH方法用于二元混合类型数据,如图像-文本数据,空间-文本数据等.文中提出了一种基于LSH混合索引结构的相似性查询方法,该方法可有效地管理含两种数据类型的数据,并且融合两种数据类型的相似性进行最近邻查询.文中提出的查询方法主要有三个特点:首先,结合LSH方法为混合数据构建混合哈希值,该混合哈希值保留有数据对象之间内容相似性的信息,基于混合哈希值构建哈希索引,进行快速准确的最近邻查询;其次,该方法解决传统LSH方法固定敏感半径的问题,可以有效地处理可变查询范围的相似性查询;最后,该方法在分布式环境中不需要全局索引信息,保证分布式查询的伸缩性.文中通过理论分析证明了查询方法和查询算法的准确性和有效性,进一步通过分布式系统优化及基于真实数据和合成数据的大量实验验证了方法的伸缩性和高效性.
    • XIONG Yi-li
    • 摘要: 对学习型哈希算法用于最近邻查询,出现二进制编码的海明距离小导致重排序的问题进行研究,提出一种基于加权自学习框架的哈希方法.给定一个查询对象,通过自学习哈希方法返回满足特定海明距离的候选对象,根据所得候选集求得二进制编码各位的权重,计算查询对象与候选集中各个数据对象的加权海明距离,得到在更细粒度上排序的候选集.实验结果表明,我们的方法能够高效的对具有相同海明距离的不同海明编码进行重排序.
    • 于启迪; 吴雷; 马昂
    • 摘要: 随着移动互联网的快速发展和智能移动设备的广泛普及,空间文本对象的数量在不断增大,随之而来的是开展空间关键词查询技术的研究.Top-k空间关键词搜索是从空间数据库中探索有用信息的重要途径.近年来已经提出了各种各样的混合索引技术,主要是将R树和倒排表结合起来,从而同时执行空间修剪和文本修剪.然而,随着数据量的快速增长,在索引维护成本和查询处理时间两个方面对现有的方法提出了很大的挑战.针对这一问题,在改进的线性四分树的基础上,提出一种基于自适应虚拟四分树的空间关键词最近邻查询算法Avqt.在真实数据上进行实验验证,结果表明该算法的有效性.
    • 彭聪; 钱江波; 陈华辉; 董一鸿
    • 摘要: 因为查询和存储具有高效性,学习型散列逐渐被应用于解决最近邻查询问题.学习型散列将高维数据转化成二进制编码,并使得原始高维空间中越相似的数据对应二进制编码的汉明距离越小.在实际应用中,每次查询都会返回许多与查询点汉明距离相同而编码互不相同的数据.如何对这些数据进行排序是一个难题.提出了一种基于加权自学习散列的近邻查找算法.实验结果表明,算法能够高效地对具有相同汉明距离的不同编码进行重排序,加权排序后查询的F1值约是原来的2倍并优于同系算法,时间开销可比直接计算原始距离进行排序降低一个数量级.%Because of efficiency in query and storage,learning hash is applied in solving the nearest neighbor search problem.The learning hash usually converts high-dimensional data into binary codes.In this way,the similarities between binary codes from two objects are conserved as they were in the original high-dimensional space.In practical applications,a lot of data which have the same distance from the query point but with different code will be returned.How to reorder these candidates is a problem.An algorithm named weighted self-taught hashing was proposed.Experimental results show that the proposed algorithm can reorder the different binary codes with the same Hamming distances efficiently.Compared to the naive algorithm,the F1-score of the proposed algorithm is improved by about 2 times and it is better than the homologous algorithms,furthermore,the time cost is reduced by an order of magnitude.
    • 马艳萍; 姬光荣; 邹海林; 谢洪涛
    • 摘要: 由于多索引哈希基于数据集中的二进制码呈均匀分布这一假设,不能有效地处理非均匀分布的数据集,故针对这一问题提出数据依赖的多索引哈希算法.首先把二进制码划分为多个连续不重合的子串,并通过计算二进制码每位之间的相关性为每一个子串学习得到自适应投影向量;在为每个子串建立哈希表时,使用投影向量对子串进行投影,从而得到哈希表中的下标;采用自适应投影的方法可以使得哈希表中的元素接近于均匀分布,进而提升了查询速度.此外,提出一个基于熵的分布度量方法,以评价哈希表中数据元素的分布情况.在大规模数据集上的实验表明,与多索引哈希算法相比,数据依赖的多索引哈希算法可以使查询速度提升36.9%~87.4%.%The multi‐index hashing ( MIH ) is the state‐of‐the‐art method for indexing binary codes . However , it is based on the dataset codes uniform distribution assumption , and will lower efficiency in dealing with non‐uniformly distributed codes . In this paper , we propose a data‐oriented multi‐index hashing method . We first compute the correlations between bits and learn adaptive projection vector for each binary substring . Then , instead of using substrings as direct indices into hash tables , we project them with corresponding projection vectors to generate new indices . With adaptive projection , the indices in each hash table are nearly uniformly distributed . Besides , we put forward an entropy based measurement to evaluate the distribution of data items in each hash table . Experiments conducted on reference large scale datasets show that compared to the MIH the time performance of our method can be 36.9% ~ 87.4% better .
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号