第1章 绪 论
1.1 课题来源
1.2 课题研究背景和意义
1.3 国内外研究现状
1.3.1 流计算的主流容错方法
1.3.2 基于检查点机制的容错方法
1.3.3 检查点间隔优化方法
1.3.4 动态检查点间隔优化方法
1.3.5 现有研究的不足
1.4 本文的主要研究内容
1.5 论文组织结构
第2章 系统模型描述
2.1 分布式流处理系统模型
2.2 FLINK系统模型
2.2.1 FLINK主从运行架构
2.2.2 FLINK作业状态管理
2.3 基于栅栏的检查点容错模型
2.3.1 基于栅栏的异步检查点
2.3.2 故障恢复模型
2.4 强化学习模型
2.5 本章小结
第3章 检查点优化问题建模和容错代价分析
3.1 问题建模
3.2 检查点运行时容错代价分析
3.3 故障恢复容错代价分析
3.4 本章小结
第4章 动态检查点间隔调整算法设计与实现
4.1 算法设计
4.2 算法开销分析
4.3 基于FLINK平台的算法实现
4.4 本章小结
第5章 实验设计与分析
5.1 实验环境
5.2 实验设置
5.3 实验结果分析
5.3.1 检查点间隔变化情况对比
5.3.2 元组处理延迟对比
5.3.3 故障恢复时间对比
5.4 本章小结
结论和展望
参考文献
攻读硕士学位期间发表的论文及其他研究成果
声明
致 谢
哈尔滨工业大学;