首页> 中文学位 >电力云数据分析平台数据挖掘算法的研究与应用
【6h】

电力云数据分析平台数据挖掘算法的研究与应用

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 引言

1.1 课题的研究背景

1.2 国内外研究现状

1.3 论文研究的主要内容

1.4 论文的组织结构

1.5 本章小结

第2章 云计算和数据挖掘相关技术

2.1 云计算技术

2.2 Hadoop开源框架

2.3 数据挖掘技术

第3章 电力云数据分析平台

3.1 电力云数据分析平台介绍

3.2 电力云数据分析平台架构

3.3 本章小结

第4章 关联规则Apriori算法的研究和应用

4.1 关联规则挖掘算法

4.2 传统单节点Apriori算法

4.3 基于MapReduce的并行化Apriori算法的实现

4.4 并行化Apriori算法的应用

4.5 实验过程及测试结果分析

4.6 本章小结

第5章 朴素贝叶斯算法的研究和应用

5.1 朴素贝叶斯分类算法

5.2 基于MapReduce的并行化朴素贝叶斯算法的实现

5.3 并行化朴素贝叶斯算法的应用

5.4 实验过程及测试结果分析

5.5 本章小结

第6章 总结与展望

6.1 本论文的主要工作

6.2 对未来工作的展望

参考文献

攻读硕士学位期间发表的论文及其他成果

致谢

展开▼

摘要

随着电网建设速度的加快,智能电网的发展,在智能终端迅速积累了大量的电力数据,一年的数据存储规模将从目前的GB级增长到TB级,甚至PB级,同时,数据维度也从几十向上百过渡。可以利用数据挖掘算法对电力海量数据进行处理,但是传统的数据挖掘算法在面对海量数据时,会面临诸多瓶颈,比如数据的存储问题和它的处理性能等,这就造成了数据挖掘算法不能有效地对海量数据进行处理。云计算具有高可靠性、虚拟性、分布式存储和强大的并行计算能力,并且具有良好的扩展性能,这些特点和数据挖掘相结合就能解决传统数据挖掘所面临的问题。在此背景下,本文对上述问题展开研究。
  首先,为了有效地对海量电力数据进行负荷预测分析和用户分类,选取了数据挖掘的经典算法:关联规则 Apriori算法和朴素贝叶斯算法,对这两个算法进行了深入的研究,特别是算法的思想和算法的计算步骤。其次,在对两个算法的思想有了理解之后,分析传统的算法所存在的不足,并针对算法本身的特点,提出能够改进的地方,关联规则 Apriori算法中频繁项集的获取和朴素贝叶斯算法的模型训练阶段需要重复的计算,在这两方面对算法进行并行化改进。最后,采用云计算技术中的MapReduce编程框架以及HBase分布式数据库等技术,对数据挖掘算法进行改进,并设计相应的Map和Reduce函数,以提高其处理海量数据的能力。并且在对数据挖掘算法进行并行化改进之后,将数据挖掘算法注册到电力云数据分析平台上去处理海量电力数据。
  本文利用MapReduce框架对关联规则Apriori算法和朴素贝叶斯算法进行并行化改进,在实际应用中,利用关联规则 Apriori算法去分析气温的高低对电力负荷的影响,利用朴素贝叶斯算法对用户进行分类,并对比了改进之后算法的效率。实验证明,经过并行化处理之后的算法在效率方面有了较大幅度的改进。但是本文只是对算法的一些步骤做了 MapReduce的并行化处理,并没有对算法本身进行优化和改进。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号