首页> 中文学位 >基于二维索引的结构化P2P高维数据范围检索
【6h】

基于二维索引的结构化P2P高维数据范围检索

代理获取

目录

文摘

英文文摘

声明

1 绪论

1.1概述

1.2 P2P网络的概念

1.3 P2P网络的特点

1.4 P2P网络拓扑结构

1.4.1集中式结构模型

1.4.2纯分布式结构模型

1.4.3混合式结构模型

1.4.4结构化P2P网络

1.5 P2P网络存在的问题

1.6 P2P技术的发展趋势

1.7本文的结构和工作

2 P2P网络中的信息检索技术研究

2.1信息检索概述

2.2 P2P信息检索的优势

2.3 P2P信息检索分类

2.3.1 非结构化P2P网络中的信息检索

2.3.2结构化P2P网络中的信息检索

2.4基于P2P搜索方法的改进

2.4.1 Super-peer

2.4.2 Bloom Filter

2.4.3基于兴趣局部性优化的P2P信息检索

2.5 P2P网络信息检索的发展趋势

2.6小结

3 一种高维数据空间的二次划分策略

3.1 Web中的高维数据

3.2高维数据的分布特点

3.3高维数据空间的二次划分

3.3.1 高维数据空间的子空间划分

3.3.2主成分分析方法

3.3.3高维数据空间分区划分

3.4小结

4基于二维索引的Chord高维数据范围检索

4.1引言

4.2 Chord网络的设计及算法

4.2.1 Chord的设计

4.2.2直接查询算法

4.2.3 改进的查询算法

4.3数据的索引

4.4节点结构

4.5范围检索实现

4.5.1 范围检索定义

4.5.2子空间过滤

4.5.3区间过滤

4.5.4检索过程

4.6小结

5 仿真实验

5.1实验目的与比较对象选择

5.2实验环境选择与配置

5.2.1实验环境选择

5.2.2实验环境配置

5.3实验结果与分析

5.3.1中间结果集

5.3.2查询时间

5.3.3消息转发次数

5.3.4查准率

5.4小结

结 论

参考文献

攻读硕士学位期间发表学术论文情况

致 谢

展开▼

摘要

近年来,随着网络技术的发展,很多P2P系统相继出现,P2P技术也越来越被人们所关注。目前P2P技术已经被应用在很多方面,主要有信息检索、文件共享、电子商务、分布式计算等领域。其中,信息检索作为查找网络信息的主要手段,是P2P技术目前最常见的应用。
   一直以来,高维数据都是数据库领域研究的热点,在实际中也有很多应用,例如数据挖掘、多媒体信息检索等领域。相似性检索是个非常关键的问题,即在数据集中找到与某个对象相似性较大的数据。高维数据检索过程中,距离计算是影响检索效率的一个重要因素,为了减少距离计算,近些年已经提出了一些解决办法,主要是以近似向量表示或者为数据建立~维索引为思路,前者通常是为高维数据寻找一个近似的向量表示形式,简化搜索空间。为数据建立一维索引是将高维数据通过某种方法转化为~维数据,以降低维度带来的影响。
   高维空间与我们所熟悉的低维空间不同,其中的数据分布有其独特的特点,即高维数据空间几乎是中空的,这使得大多数多元密度估计方法无法得出准确的结果,因为密度相对低的区域占了分布的很大一部分体积,而密度高的区域却缺乏足够的观测值。本文在分析了高维空间的这些分布特点之后,根据数据量将其分割成若干个子空间,使得这些子空间中的数据量分布大致均匀。子空间的划分是对数据空间纵向的分割。在子空间建立的基础上再进行分区划分,分区的划分是对数据空间横向的分割。空间划分之后,综合近似向量表示和为数据建立一维距离索引的基础上,为数据建立二维索引值,在数据索引和结构化P2P网络Chord节点的标识符之间建立映射关系,在检索过程中对查询进行两层过滤,减少了数据之间的距离计算,提高了查询性能。实验结果表明,这种二维索引结构在查准率,查找效率等方面有很好的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号