首页> 中文学位 >基于大数据的日志管理系统的设计与实现
【6h】

基于大数据的日志管理系统的设计与实现

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究背景

1.2 问题描述

1.3 本课题来源和主要工作

1.4 本文的组织结构

第2章 相关概念及技术

2.1 云计算

2.2 数据挖掘

2.3 NoSQL系统

2.3.1 NoSQL理论基础

2.3.2 NoSQL系统的特征

2.3.3 MongoDB系统

2.4 本章小结

第3章 系统需求分析与设计

3.1 需求分析

3.2 概要设计

3.2.1 总体设计

3.2.2 日志收集模块的设计

3.2.3 日志存储模块的设计

3.2.4 日志分析模块的设计

3.2.5 应用交互模块的设计

3.3 可行性分析

3.4 本章小结

第4章 关键技术的研究与改进

4.1 开源日志收集系统研究

4.2 MongoDB集群的研究与改进

4.2.1 Chunk块策略

4.2.2 基于Chord环的数据均衡策略

4.2.3 基于Chord环的优化实验

4.3 并行计算模型MapReduce

4.3.1 MapReduce处理流程

4.3.2 MapReduce作业运行方式

4.4 本章小结

第5章 系统实现与应用

5.1 系统实现

5.1.1 日志收集模块

5.1.2 日志存储模块

5.1.3 日志分析模块

5.1.4 用户交互模块

5.2 系统应用

5.3 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

展开▼

摘要

云计算技术实现了软硬件资源的共享,极大节省了用户基础设备的购置和管理成本,促使越来越多的企业将应用程序部署在云平台之上。云计算提供按需服务,动态分配资源,造成了应用程序日志的丢失,同时分布式存储的日志也不便于查看和分析。日志信息对于系统的维护和优化具有重要意义,因此,将云平台下应用程序的日志进行统一的收集和管理是非常必要的。
  针对云计算环境下应用程序日志的特点,本文做了如下的研究工作:(1)云计算根据应用程序的负载变化情况,动态分配计算资源,造成了应用程序日志容易丢失的问题。本文研究和对比了主流的分布式日志收集系统,从中选择Flume对日志进行集中收集管理。
  (2)各种应用、中间件、系统等每天都会产生大量的日志,这些日志经过日志收集系统聚合之后,形成了海量的日志信息。传统的关系型数据库已经不能很好的面对海量数据的存储需求。本文考察了当前流行的非关系型数据库,重点研究了其中代表性的MongoDB数据库。研究发现,MongoDB无模式的存储方式、简便的集群扩充等特点非常适合作为海量异构日志的载体。在进一步的研究中发现,MongoDB基于Chunk块的数据均衡策略存在性能严重下降的问题。本文提出基于Chord环的数据均衡策略,依此改造了MongoDB集群,并通过实验验证了改造的有效性。
  (3)传统的单机日志分析方法面对海量日志时已经力不从心,本文对并行化日志分析方法进行了研究。并行计算模型MapReduce具有简单、适用性强、处理数据规模大等优点,可以满足海量日志的分析需求。
  最后,基于以上的研究,本文使用Flume、MongoDB和MongoDB自带的MapReduce实现了日志的收集、存储和并行分析,设计并实现了日志管理系统。该系统实现了对日志的集中管理,方便了开发人员和运维人员查看和分析日志信息,充分利用了日志的价值。

著录项

  • 作者

    牟肖蓬;

  • 作者单位

    东北大学;

  • 授予单位 东北大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 卢朝霞;
  • 年度 2014
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.52;
  • 关键词

    分布式日志; 收集管理; 系统设计; 云计算;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号