声明
致谢
摘要
1 绪论
1.1 课题背景与意义
1.2 国内外现状分析
1.2.1 国外发展现状
1.2.2 国内发展现状
1.3 研究目标与内容
1.3.1 研究目标
1.3.2 研究内容
1.4 论文章节安排
1.5 本章小结
2 系统需求分析
2.1 系统需求分析概述
2.2 业务需求分析
2.3 功能需求分析
2.3.1 采集多种数据类型功能需求
2.3.2 一键部署处理组件功能需求
2.3.3 便捷配置采集组件功能需求
2.3.4 可视化采集工作流功能需求
2.3.5 监控采集流程功能需求
2.4 非功能性需求分析
2.5 本章小结
3 系统总体设计
3.1 系统总体设计概述
3.2 系统模块设计
3.3 系统网络拓扑结构设计
3.4 系统架构设计
3.5 技术选型
3.6 数据库设计
3.6.1 实体关系
3.6.2 数据库表设计
3.7 关键技术方案
3.8 本章小结
4 系统详细设计与实现
4.1 扩展flume模块详细设计与实现
4.1.1 自定义关系型数据库采集
4.1.2 自定义本地文件、hdfs、ftp、sftp采集
4.1.3 自定义hbase数据采集
4.1.4 自定义kafka采集
4.2 处理组件部署模块详细设计与实现
4.2.1 配置flume集群的信息
4.2.2 部署flume集群
4.2.3 实现成果展示
4.3 配置采集组件模块详细设计与实现
4.3.1 源组件配置
4.3.2 处理组件配置
4.3.3 终端组件配置
4.3.4 具体实现设计
4.3.5 实现成果展示
4.4 采集工作流模块详细设计与实现
4.4.1 flume工作流的设计
4.4.2 storm工作流的设计
4.4.3 实现成果展示
4.5 采集监控模块详细设计与实现
4.5.1 监控方案选择
4.5.2 具体实现设计
4.5.3 实现成果展示
4.6 本章小结
5 系统评估与验证
5.1 系统测试环境
5.1.1 硬件测试环境
5.1.2 软件测试环境
5.2 系统功能测试
5.2.1 处理组件部署测试
5.2.2 配置采集组件测试
5.2.3 采集工作流测试
5.2.4 采集监控测试
5.3 系统可用性测试
5.4 测试结论
5.5 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集