摘要
第一章 绪论
1.1 论文选题背景
1.2 本文的主要内容
1.3 本文的章节安排
第二章 系统现状和相关技术分析
2.1 企业现有的数据分析平台架构和问题
2.2 主流的数据平台架构和技术分析比较
第三章 视频日志分析平台的需求分析和新架构设计
3.1 视频日志分析平台的需求分析
3.1.1 数据分析业务人员的需求
3.1.2 数据平台维护人员的需求
3.1.3 数据平台开发人员的需求
3.1.4 日志分析平台的架构需求
3.2 数据分析系统新架构设计
3.2.1 各个模块功能描述
3.2.2 日志分析系统解决的核心问题
第四章 系统详细设计和各模块设计
4.1 存储模块设计
4.1.1 Hadoop集群的设计
4.1.2 Mysql的高可用设计和参数优化
4.2 抽取模块设计
4.2.1 Flume实时抽取日志
4.2.2 Sqoop抽取数据库数据
4.2.3 ftp主动下载
4.2.4 rsyncserver被动接收
4.3 计算模块设计
4.3.1 rabbitmq消息中间件
4.3.2 ElasticSearch日志搜索服务
4.3.3 Storm集群
4.3.4 Flume输出hdfs
4.3.5 Hive数据装载
4.3.6 数据清洗机制设计
4.4 对外用户接口设计
4.4.1 hive查询界面和hive-server接口
4.4.2 hive报表系统
4.5 监控报警机制的设计与实现
4.6 调度系统设计与实现
第五章 系统验证
5.1 系统可靠性
5.2 系统实时性
5.3 海量日志计算
第六章 结论
6.1 海量日志分析系统已经达到的目标
6.2 不足与展望
参考文献
致谢
声明