首页> 中文学位 >基于Hadoop平台径流分析方法的研究和应用
【6h】

基于Hadoop平台径流分析方法的研究和应用

代理获取

目录

声明

第1章 绪论

1.1 课题来源

1.2 课题研究背景和意义

1.3 国内外研究现状

1.4 论文研究的内容和章节安排

第2章 基于Hadoop水文分析平台的设计

2.1 原有的水文平台

2.2 Hadoop平台

2.3 水文监测平台架构

2.4 水文预测平台的搭建

2.5 水文预测平台的存储和计算服务

2.6 水文数据存储的安全性

2.7 本章小结

第3章 径流回归分析算法研究

3.1 径流和水文-气象遥相关

3.2 基于随机森林径流分析算法研究

3.3基于支持向量径流分析算法研究

3.4基于逐步线性回归的径流分析算法研究

3.5 本章小结

第4章 基于Hadoop月径流分析模块的设计与实现

4.1 径流数据处理的流程

4.2 并行随机森林月径流分析算法的设计

4.3 径流分析模块设计

4.4 水文平台成果展示

4.5 本章小结

第5章 实验分析结果

5.1 实验数据来源

5.2 单机和并行时随机森林运算速度的对比

5.3径流分析算法比较

5.4 本章小结

第6章 总结和展望

6.1 本文工作总结

6.2 工作展望

致谢

参考文献

攻读学位期间获得与学位论文相关的科研成果目录

展开▼

摘要

干旱和洪水灾害已经严重制约了我国的经济建设,国家对水情监控分析的要求也越来越高。现代水文监测系统,不仅需要有准确的短期分析能力,以防御突发的自然灾害;还要有中长期的分析能力,以便制定应对措施。传统单服务器模式的水文监测系统,由于速度慢、能耗高、可扩展性差,已经不能满足新的需求。水利云平台由于具备资源分配和调度的特点,是水利行业水文信息化的发展方向。 本文以径流为分析对象,径流指的是单位时间流经封闭管道或明渠有效截面的流体量。在流域的径流分析中,流域的初始水文特征和气候条件是影响未来径流变化的重要因素。因此,确定符合实际情况的初始水文条件和解释因子是提高中长期径流回归分析精度的有效方法。本文研究了Hadoop云计算技术和径流分析的方法,结合径流分析业务,设计和实现了的水文监测分析平台。主要工作如下: (1)采用B/S和C/S的模式,设计基于Web应用服务器的水文信息监测系统。B/S模式直接与用户进行交互,C/S模式用于接收水文采集终端和外部数据。 (2)以传统的水文平台为基础,通过额外扩展一个Hadoop计算集群,设计和搭建了一个由Web服务器和Hadoop计算集群组成的水文信息监测平台。利用Hadoop平台的HDFS和MapReduce解决水文大数据的存储和计算问题。HDFS提供了分布式的文件存储,MapReduce提供了并行的数据处理框架。 (3)详细研究了随机森林和支持向量在分类回归问题中的应用。相对于单棵决策树,随机森林在保证训练样本分类回归效果的同时,具有更好的泛化能力。由于支持向量机对样本规模要求不高,也被应用于分类回归的问题求解中。本文在水文站径流预测业务的基础上,利用随机森林和支持向量机对黄河流域站点的月径流进行回归分析,通过对比找到合适的分析模型。 (4)在随机森林的构建过程中,区别于传统的单机模式,本文采用分布式的方式,将训练过程分解为若干个Map子任务下发至集群的不同子节点完成。子任务全部生成完成后,被返还到主节点的HDFS文件系统中保存,得到完整的模型。实验表明这种并行化的方式,能够提高计算效率,并且随机森林算法对月径流回归也较为准确,是一种可行的径流分析方法。

著录项

  • 作者

    李勇;

  • 作者单位

    武汉理工大学;

  • 授予单位 武汉理工大学;
  • 学科 信息与通信工程
  • 授予学位 硕士
  • 导师姓名 王昱;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    平台; 流分析方法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号