首页> 中文学位 >分布式网络数据包索引存储系统研究
【6h】

分布式网络数据包索引存储系统研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究课题背景及意义

1.2 相关研究工作

1.3 论文研究内容

1.4 论文组织方式

第2章 相关基础知识

2.1 存储技术

2.2 索引技术

2.3 小结

第3章 系统设计与实现

3.1 系统概况

3.2 系统支撑技术

3.3 系统结构

3.4 数据的加工处理

3.5 数据的存储与管理

3.6 任务执行

3.7 语言设计

3.8 小结

第4章 实验结果与分析

4.1 实验环境

4.2 性能测试评价指标与测试分析

4.3 小结

结论

参考文献

致谢

附录A 发表论文和参加科研情况说明

展开▼

摘要

随着网络技术的飞速发展,全球网络数据流量逐年高速增长,在现今大数据时代,网络数据的价值尤为重要。提供网络服务的企业或提供商、金融机构、具有高度安全性要求的数据中心等大型机构越来越关注于这样的一些强大工具,它们能够将网络数据进行存档并且可以方便进行事后分析。然而需要存储的网络信息是非常庞大的,如何将这庞大的数据进行存储并组织好方便用于之后的安全分析是个非常重要的,并且具有挑战性的问题。
  网络数据的数量庞大,其存储需要大量的存储空间,如何解决如此庞大的存储需求是一个难题。本文利用分布式结构,通过将大量廉价的计算机组合在一起构成一个庞大的存储空间。满足存储需求只解决了一方面问题,庞大的数据存储在计算机,如何将其组织以便用户可以方便使用是本文要解决的另一难题。本文采用索引技术对数据进行组织,有了索引的数据库可以大大加快对数据的访问。针对网络数据信息的多维性,本文采用位图索引。
  因此,本文实现了一个基于位图索引的,针对网络数据包的,分布式的,快速索引存储系统。在系统中,有两个重要概念blobs和tags,它们负责系统中的数据的分布、复制、持久、寻址以及访问。利用该系统可以将捕获的网络数据包中包含的一些重要信息截取下来,依据这些重要信息建立其位图索引;采用内存映射的方法对数据进行加工存储;整个系统基于MapReduce的编程模型;存储的信息可添加副本分布于整个分布式系统的不同服务器上,增强系统的可靠性;系统中的服务器可随意加入和离开,使得系统具有良好的扩展性;系统中的各服务器端都可以进行独立插入和查询操作,很好地支持多用户。本文使用几台较为低端配置的计算机实现了本系统,使用从真实网络中捕获的网络数据包对本系统进行了性能测试,测试实验得到了较好的结果:单台计算机的插入速率大约每秒30,000条记录,查询效率大约每秒5,000,000条记录;N台计算机并行执行时,其效率为单台计算机效率的N倍。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号