第一个书签之前
摘要
第一章 绪论
1.1课题研究背景及研究的意义
1.2国内外研究现状
1.3论文的研究内容
1.4 论文结构安排
第二章 相关技术理论
2.1 智能电网和电力大数据
2.1.2 电力大数据
2.2 数据挖掘
2.2.1 聚类分析
2.2.2 XGBoost
2.3 Hadoop云计算平台
2.3.1 Hadoop简介
2.3.2 Hadoop文件系统HDFS
2.3.3 MapReduce并行计算平台
2.4 Spark 并行计算平台
第三章 基于Spark的聚类算法检测与修正异常数据
3.1传统异常数据检测
3.2 Spark计算平台搭建与配置
3.2.1 Hadoop平台的搭建环境
3.2.2 Hadoop集群安装配置
3.2.3 Spark安装与配置
3.3 基于并行ISODATA聚类的负荷特征曲线提取
3.3.1 改进的ISODATA算法
3.3.2 负荷特征曲线提取
3.4 基于负荷特征曲线的异常数据处理
3.4.1利用纵向相似性检测和辨识异常数据
3.4.2利用横向相似性检测和辨识异常数据
3.5实例分析
3.6 本章小结
第四章 基于Spark的短期负荷预测
4.1 短期负荷预测方法
4.1.1经典负荷预测方法
4.1.2传统负荷预测方法
4.1.3 智能负荷预测方法
4.2 XGBoost算法的并行化
4.3 基于Spark并行XGBoost的短期负荷预测
4.3.1 数据处理
4.3.2特征工程
4.3.3 XGBoost分布式部署
4.4 实例分析
4.5 本章小结
第五章 总结与展望
5.1 本文总结
5.2 结论与展望
参考文献
附录1 攻读硕士学位期间撰写的论文与专利
致谢