摘要
第一章绪论
1.1研究背景
1.2研究现状
1.3研究内容
1.4论文结构
2.1 引言
2.2大数据平台与开发工具
2.2.1 Hadoop平台
2.2.2 Spark计算引擎
2.2.3 Hadoop分布式文件系统概述
2.2.4 HBase分布式数据库
2.3油藏数据分析概述
2.4数据挖掘算法简介
2.5本章小结
3.1 引言
3.2油藏数据特点
3.3油藏数据处理功能性需求
3.3.1油藏数据的导入与存储
3.3.2油藏数据分析
3.3.3分析结果推送入库
3.4非功能性需求
3.5总体架构与层次功能模块
3.5.1 总体架构
3.5.2层次功能模块
3.6本章小结
4.1引言
4.2油藏数据分布式存储总体架构
4.3油藏数据接入模块
4.4油藏数据存储模块
4.4.1油藏数据表设计
4.4.2 HBase表设计
4.4.3协处理器Coprocessor实现二级索引
4.5本章小结
5.1 引言
5.2 C4.5决策树算法
5.3基于油藏数据的决策树模型构建
5.3.1油藏数据特征提取
5.3.2基于油藏数据的C4.5决策树生成算法
5.3.3 基于油藏数据的C4.5算法构造决策树
5.4基于Spark的C4.5决策树地层分类的实现
5.5实验结果与分析
5.5.1 实验环境
5.5.2 实验结果
5.6本章小结
第六章基于大数据技术的油藏数据分析系统的设计与实现
6.1引言
6.2系统研发环境
6.2.1硬件配置
6.2.2软件环境
6.3系统实现
6.3.1系统总体框架
6.3.2油藏数据监控模块
6.3.3油藏数据存储模块
6.3.4员工信息管理模块
6.3.5油藏数据分析模块
6.3.6油藏数据出库备份
6.4系统功能测试
6.4.1等价类划分
6.4.2系统测试用例
6.5本章小结
7.1研究总结
7.2研究展望
参考文献
附录
致谢
攻读学位期间发表的学术论文与参加的研究工作
声明
扬州大学;