声明
摘要
1.1 课题背景
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文主要工作
1.4 本文的组织结构
2.1 总体需求分析
2.2 系统架构设计
2.3 系统数据流
2.4 系统的业务需求
2.5 信息管理系统日志分析的业务特征
3.1 总体系统设计
3.1.1 总体数据流向
3.1.2 基于hadoop生态体系实现日志分析系统的利弊
3.2 日志采集部分系统设计
3.2.1 日志文件内容设计
3.2.2 Flume实现日志采集
3.2.3 日志采集部分不同设计方案比较
3.3 日志存储部分系统设计
3.4 日志处理部分系统设计
3.4.1 MapReduce预处理日志数据
3.4.2 利用Hive对数据进行逻辑处理
3.4.3 Hive实现系统的横向扩展
3.4.4 Hive实现预处理结果存储与传统关系型数据库实现方式的比较
3.5 日志处理结果存储部分系统设计
3.6 结果展示部分系统设计
第4章 系统实现
4.1 日志采集部分系统实现
4.1.1 配置tomcat日志格式
4.1.2 配置Flume组件
4.2 日志存储部分系统实现
4.3 日志处理部分系统实现
4.3.1 MapReduce实现日志的预处理
4.3.2 Hive实现日志的预处理结果的存储
4.4 日志处理结果存储部分实现
4.5 结果展示部分系统实现
4.5.1 系统访问流量模块业务实现
4.5.2 系统访问时序模块业务实现
4.5.3 系统异常种类分析模块业务实现
4.5.4 系统访问热门模块与系统访问人员构成模块业务实现
第5章 总结与展望
参考文献
致谢