声明
致谢
摘要
1 引言
1.1 课题研究背景
1.1.1 研究背景
1.1.2 问题提出
1.2 国内外研究现状
1.2.1 Spark研究现状
1.2.2 Spark监控系统研究现状
1.3 论文组织结构
2 理论基础及相关技术
2.1 Spark框架
2.1.1 Spark简介
2.1.2 Spark系统架构
2.1.3 RDD弹性分布式数据集
2.2 Icinga监控
2.2.1 Icinga架构
2.2.2 Icinga监控策略
2.2.3 Icinga扩展
2.3 SNMP协议
2.3.1 SNMP管理框架
2.3.2 SNMP工作过程
2.3.3 SNMP协议Trap消息
2.4 日志监控
2.4.1 日志和日志文件
2.4.2 日志采集
2.5 本章小结
3 大数据平台健康指标研究及监控难点分析
3.1 大数据平台健康指标研究
3.1.1 集群指标研究
3.1.2 节点性能指标研究
3.1.3 作业运行指标研究
3.2 监控难点分析
3.2.1 作业运行监控代理分析
3.2.2 作业运行监控插件分析
3.3 本章小结
4 大数据平台运行监控系统设计与实现
4.1 总体结构
4.1.1 系统架构
4.1.2 监控流程
4.2 集群监控
4.2.1 集群监控代理
4.2.2 集群监控插件
4.3 节点性能监控
4.3.1 节点性能监控代理
4.3.2 节点性能监控插件
4.4 作业运行监控
4.4.1 作业运行监控代理
4.4.2 作业运行监控插件
4.5 告警
4.6 本章小结
5 实验
5.1 环境要求
5.2 环境搭建
5.2.1 配置本地环境
5.2.2 设置SSH无密码互联环境
5.2.3 配置Spark
5.3 实验结果
5.3.1 集群监控
5.3.2 节点监控
5.3.3 作业运行监控
5.4 本章小结
6 总结与展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集