声明
摘要
第1章绪论
1.1研究背景及意义
1.2国内外研究现状
1.3本文主要工作
1.4本文组织结构
第2章相关技术
2.1 Apache Hadoop
2.1.1 MapReduce框架
2.1.2 Hadoop项目
2.1.3 HDFS文件系统
2.1.4 Hadoop缺陷
2.2 Spark框架
2.2.1弹性分布式数据集
2.2.2 Spark操作
2.2.3 Spark容错机制
2.3空间数据
2.3.1空间数据特性
2.3.2空间数据索引
2.3.3空间数据查询类型
2.4 Argo全球海洋观测网
2.4.1 Argo计划概述
2.4.2 Argo数据格式
2.5空间插值算法
2.5.1空间插值提出
2.5.2空间插值原理
2.5.3参考点选取策略
2.5.4典型的空间插值算法
2.6本章小结
第3章基于Spark的Argo数据查询处理框架
3.1整体框架
3.1.1框架描述
3.1.2框架优势
3.2索引结构设计
3.2.1 Argo数据特点及预处理
3.2.2 Argo数据查询需求
3.2.3索引结构设计
3.2.4索引构建
3.2.5双层网格索引优势
3.3基于双层网格索引的并行查询算法
3.3.1 ID查询
3.3.2范围查询
3.4本章小结
第4章基于Spark的Argo数据插值算法
4.1参考点的确定
4.1.1混合参考点选取策略
4.1.2参考点选取算法
4.2空间插值算法
4.2.1 IDW算法
4.2.2普通克里金算法
4.3本章小结
第5章实验与分析
5.1.3实验数据
5.1.4实验内容
5.2并行查询算法
5.2.1双层网格索引
5.2.2 ID查询
5.2.3空间范围查询
5.2.4时空范围查询
5.3并行插值算法
5.3.1 PIRPS算法
5.3.2混合参考点选取策略
5.3.3插值结果精度
5.4本章小结
第6章总结与展望
6.1内容总结
6.2未来展望
参考文献
致谢
攻读硕士期间发表的论文和参加的项目