您现在的位置: 首页> 研究主题> 高维索引

高维索引

高维索引的相关文献在2002年到2021年内共计82篇,主要集中在自动化技术、计算机技术、科学、科学研究、测绘学 等领域,其中期刊论文62篇、会议论文6篇、专利文献6959篇;相关期刊31种,包括中国数字医学、计算机工程、计算机工程与应用等; 相关会议5种,包括第二届中国互联网学术年会、第27届中国数据库学术会议、第十九届全国数据库学术会议等;高维索引的相关文献由184位作者贡献,包括崔江涛、梁俊杰、王国仁等。

高维索引—发文量

期刊论文>

论文:62 占比:0.88%

会议论文>

论文:6 占比:0.09%

专利文献>

论文:6959 占比:99.03%

总计:7027篇

高维索引—发文趋势图

高维索引

-研究学者

  • 崔江涛
  • 梁俊杰
  • 王国仁
  • 冯玉才
  • 周项敏
  • 庄毅
  • 刘燕
  • 刘艳
  • 张伟
  • 王建民
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 何丽媛
    • 摘要: 违规音视频节目的自动识别,主要通过内容分析系统来实现.首先需要将音视频节目的基本信息提取出来,包括音视频节目的底层特征和音视频节目的相关文本摘要信息;之后再把提取出来的基本信息集合在一起,形成一个高维索引,系统再以这个索引为基础,对违规音视频节目进行自动识别.本文详细介绍了违规音视频节目的自动识别过程.
    • 何丽媛
    • 摘要: 违规音视频节目的自动识别,主要通过内容分析系统来实现。首先需要将音视频节目的基本信息提取出来,包括音视频节目的底层特征和音视频节目的相关文本摘要信息;之后再把提取出来的基本信息集合在一起,形成一个高维索引,系统再以这个索引为基础,对违规音视频节目进行自动识别。本文详细介绍了违规音视频节目的自动识别过程。
    • 邓理睿; 包涵; 陈靓; 全成斌; 赵有健
    • 摘要: 在大规模视频、图像、文本检索等许多实际应用中,高维空间内海量数据的索引及近邻检索一直是难点和关键问题之一.传统的K-D树等树形索引方法在高维空间中容易陷入"维度灾难",而主流的哈希散列方法(如局部敏感哈希)空间复杂度较高,在大规模数据下难以应用.本文总结了近年来基于向量量化的检索算法的相关研究,提出了一种基于GPU优化的高维数据近似近邻检索算法,在组合量化算法的基础上融合双层索引树结构与局部子空间最优化思想,在提高算法准确率的同时针对GPU模型优化算法,极大改善了检索性能,在单张GPU上实现了十亿量级高维数据的高效近似近邻检索.%ANN (Approximate Nearest Neighbor) search for large-scale data in high-dimensional space have been one of the most difficult and key issues in many multimedia applications. Tradition methods based on tree partition, like K-D tree, falls into "the curse of dimensionality"while hashing techniques such as LSH comes with high spatial complexity and requires unacceptable RAMusage. In this paper, we propose a GPU-based ANN search algorithm for billion-scale high-dimensional data based on composite quantization.We first combines the multi-layer inverted index structure with local subspace optimization in composite quantization to achieve high accuracy, then adjust the calculate process constrained with the GPU model to reduce GRAMusage and enhance retrieval performance.Finally, our methods successfully implement efficient ANN searching for billion scale high-dimensional data on one single GPU.
    • 张洋
    • 摘要: 目前PGC/UGC视频面临着重复推广、重复付费等问题,需要向PGC/UGC的制作人提供版权保护的服务.我们通过基于特征的视频、音频匹配技术提供了视频匹配的工具,并通过基于哈希化的算法提供了索引,使在海量数据中快速查到匹配视频成为可能.
    • 贾佳; 唐胜; 谢洪涛; 肖俊斌
    • 摘要: 随着移动互联网、智能移动终端和云计算的高速发展,移动视觉搜索在移动电子商务和网络信息安全等方面具有重要的研究价值和应用前景.文中针对当前移动视觉搜索的国内外研究现状,探讨和分析了移动视觉搜索的系统框架及其关键方法,重点介绍其中的特征提取与表示、高维索引与匹配、几何一致性校验等方面的基本内容.最后对现有研究中存在的难点问题及其未来的发展趋势进行了展望.%With the fast development of mobile internet, smart mobile terminals, and cloud computing, mo-bile visual search is of great research value and application prospect in the field of mobile e-commerce and network information security, etc. In this paper, based on a comprehensive survey of the progress of foreign and domestic research on mobile visual search, we introduce the system framework and key technologies of mobile visual search, and focus on detailed analysis of its main contents of feature extraction and represen-tation, high dimensional indexing, and geometrical consistency verification, etc. Finally, we present some challenges, together with the future directions of the research on mobile visual search.
    • 孙钦佩; 孙健永; 杨媛媛; 张建国
    • 摘要: 在医学影像信息学中,基于内容的图像检索(CBIR)技术被用来帮助放射科医师检索具有相似图像容的图像.CBIR通过图像的量化特征来检索高维特征数据库中与查询图像类似的影像.然而,当前大部分CBIR系统都会受特征维数影响,系统检索的响应时间随着特征向量维数及检索图像数量的增加而增长.对此提出了一种新的框架,使用VA-Trie结构来对图像特征建立高维数据库索引,以提高集成RIS/PACS中的CBIR的准确性和检索速度.%In medical imaging informatics,content-based image retrieval (CBIR) techniques are employed to aid radiologists in the retrieval of images with similar image contents.CBIR uses the quantization feature of the image to search for images similar to the query image in the high dimensional feature database.However,most of the current CBIR systems are affected by the feature dimension,and the response time of the system search increases with the increase of the feature vector dimension.In this presentation,we propose a novel framework to use the VA-Trie structure to establish high-dimensional database indexes for image features to improve the accuracy and retrieval speed of CBIR in integrated RIS / PACS.
    • 文庆福; 王建民; 朱晗; 曹越; 龙明盛
    • 摘要: 近似近邻查询是信息检索领域中的一项重要技术.随着文本、图像、视频等非结构化数据规模的迅速增长,如何对海量高维数据进行快速、准确的查询是处理大规模数据所必须面对的问题.哈希作为近似近邻查询的关键方法之一,能够在保持数据相似性的条件下对高维数据进行大比例压缩.以往所提出的哈希方法往往都是应对集中式存储的数据,因而难以处理分布式存储的数据.该文提出了一种基于乘积量化的分布式哈希学习方法SparkPQ,并在Spark分布式计算框架下实现算法.在传统的乘积量化方法的基础上,该文首先给出了分布式乘积量化模型的形式化定义.然后,作者设计了一种按行列划分的分布式矩阵,采用分布式K-Means算法实现模型求解和码本训练,利用训练出的码本模型对分布式数据进行编码和索引.最终,该文构建了一套完整的近似近邻查询系统,不仅可以大幅降低存储和计算开销,而且在保证高检索准确率的条件下加速查询效率.在较大规模的图像检索数据集上进行的实验验证了方法的正确性和可扩展性.
    • 梁俊杰; 李凤华; 刘琼妮; 尹利
    • 摘要: 针对大规模高维数据近似查询效率低下的问题,利用MapReduce编程模型在大规模集群上的数据与任务的并行计算与处理优势,提出MapReduce 框架下大规模高维数据索引及KNN 查询方法(iPBM),重点突破Ma-pReduce数据块(block)的优化划分与各数据块对计算的共同贡献两大难题,利用两阶段数据划分策略并依据相关性与并行性原则将数据均匀分配到各数据块中,设计分布式的双层空间索引结构与并行KN N查询算法,检索时利用全局索引、局部索引与二维位码索引实现三层数据过滤,大幅缩小搜索范围并降低高维向量计算代价,实验表明iPBM对大规模高维数据的近似查询具有准确性、高效性和扩展性。%To address the low efficiency problem caused by the approximate large-scale high-dimensional data query, we propose a novel high-dimensional index and KNN query method,called iPBM,which exploits two main problems,inclu-ding the optimal division on the MapReduce’s data block and their contributions to the computing.Specifically,based on the principles of relativity and parallelity,iPBM employs a two-phase partitioning scheme of clustering and zoning to equally split the data to the available blocks,then we design a distributed two-layer index structure and parallel KNN query algo-rithm.With fully considering the global index,local index and two-dimensional bitcode property,iPBM achieves triple-layers filtering,and thus the number of queried area and the computing cost on the high-dimensional data is minimized.The accura-cy,efficiency and scalability of the proposed iPBM are thoroughly evaluated via detailed simulations.
    • 刘恋; 向凤红; 毛剑琳
    • 摘要: "Adaptive Cluster Distance Bounding"could obtain tighter distance bounds between the query and clusters, but this method suffers large amount of distance bound computations, can't take both filtration capacity and CPU performance when the number of clusters increases, and doesn't provide effective pruning mechanisms inside the candidate clusters yet. In this paper, a new indexing method called TreeHB is provided to improve the performance of nearest-neighbor search, which is based on two improvements of existing hyperplane method. Firstly, this paper divides clusters with hierarchic methods, and manages the clustering results with a tree structure to ensure the premise filtering capabilities and reduce the amount of computation and the CPU cost. Secondly, a new pruning algorithm is designed to reject the irrelevant points in the candidate clusters further and reduce the IO cost. It turns out that the new approach outperforms the original hyperplane method and other popular high-dimensional indexing methods.%"自适应集群距离边界"高维索引方法虽可得到查询点与聚类之间更紧致的距离边界,但该方法需要大量的边界距离计算,当集群个数增加时无法兼顾过滤能力和CPU性能,且没有在候选集群内部提供高效的剪除机制.本文提出一种新的以超平面聚类为基础的索引结构TreeHB来提升最近邻查询性能.首先,用层次化聚类方法聚类,将聚类结果用树形结构进行管理,在保证过滤能力的前提下,可降低距离下界计算量,减少CPU开销.其次,在候选集群内部设计一种新的剪除机制,进一步过滤无关数据元,降低I/O开销.结果证明,这种新方法性能优于原有的超平面索引方法及其他著名的高维索引方法.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号