首页> 中文学位 >基于小世界理论的P2P文本检索研究
【6h】

基于小世界理论的P2P文本检索研究

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 选题背景及其研究意义

1.2 对等网研究现状

1.3 本文研究内容和论文结构

第二章 对等网简述

2.1 P2P网络简介

2.2 P2P网络拓扑结构

2.2.1 中心化拓扑

2.2.2 全分布式非结构化拓扑

2.2.3 全分布式结构化拓扑

2.2.4 半分布式拓扑

2.3 P2P与C/S结构比较

2.4 P2P技术的应用

2.5 P2P技术存在的问题

2.5.1 侵犯版权问题

2.5.2 缺乏管理机制

2.5.3 吞噬网络带宽问题

2.5.4 P2P网络安全问题

2.5.5 P2P标准制定问题

2.6 网络搜索机制

2.6.1 传统搜索技术

2.6.2 P2P搜索技术

第三章 小世界理论和文本分类技术

3.1 小世界理论

3.1.1 P2P网络的小世界特性

3.1.2 小世界模型概述

3.1.3 WS小世界模型

3.1.4 复杂网络里的幂规律

3.2 文本分类技术

3.2.1 文本分类工作原理

3.2.2 文本预处理

3.2.3 文本的向量表示

3.2.4 特征项选择

3.2.5 文本分类

第四章 一种基于小世界理论的非结构化P2P文本检索算法

4.1 引言

4.2 向量空间模型

4.2.1 文档向量表示

4.2.2 特征向量降维

4.2.3 向量空间模型工作原理

4.2 系统结构

4.3 搜索机制描述

4.3.1 算法思想

4.3.2 算法描述

4.4 邻居节点更新策略

4.5 实验模拟

4.5.1 PeerSim简介

4.5.2 实验评估标准

第五章 总结与展望

致谢

参考文献

研究成果

展开▼

摘要

对等网是一种采用对等模式计算的网络,与传统的客户端/服务器比较,有低成本、高可扩展性、容错性好、自治性和自组织性等优点,随着对等网络的广泛应用,网络中共享的文本、视频、音频、图像的数量呈现出惊人的增长速度。因此,对于检索这些内容的需求越来越多要求也越来越高。
   本文研究的对象是非结构化的P2P网络。非结构化的P2P网络指的是以Gnutella为典型代表的一类网络。在这类网络中,节点没有指定的逻辑地址,采用随机方法或者启发策略加入网络,网络拓扑随着节点的变迁和网络通信的进行而发生演变。
   本文对复杂网络的幂规律和小世界特征进行了分析研究,并对现在的对等网络的拓扑结构和搜索下载方式进行了分析比较,针对Gnutella网络中消息转发的泛洪问题,提出了一种基于小世界模型的非结构化P2P网络中文本检索方法。在本方法中,网络中的每个节点都维护一定数量的邻居节点作为短程连接,同时每个节点还要维护一些长程连接来提高文本检索效率和减少节点之间的通信开销。邻居节点的更新策略是在查询后根据反馈信息进行邻居节点调整:即计算邻居节点的重要度并进行排序,然后选择重要度高的节点做为邻居节点,而被替换的重要度低的节点有一定几率成为长程连接节点。这样,节点能够快速的了解其他节点的文档内容并使得兴趣相似的节点紧密连接。实验结果证明,对比于Gnutella网络的搜索算法,本文提出的基于小世界理论的非结构化P2P网络中的文本检索算法具有较好的性能,而且随着搜索的继续进行这种效果会越来越明显。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号