首页> 中文学位 >基于XGBoost的超短期负荷预测研究
【6h】

基于XGBoost的超短期负荷预测研究

代理获取

目录

声明

摘要

图表清单

第一章绪论

1.1研究背景

1.2国内外研究现状

1.3研究的主要内容

第二章负荷预测算法研究分析

2.1负荷预测算法概述

2.2 K折交叉验证及网格搜豪模型训练

2.3预测误差评判方式

2.4小结

第三章时间序列下的超短期负荷预测

3.1基于随机森林回归负荷预测

3.2基于梯度增强回归树负荷预测

3.3基于LSTM负荷预测

3.4基于XGBoost负荷预测

3.5实验结果与分析

3.6小结

第四章多维度下的超短期负荷预测

4.1单增加温度因素的XGBoost模型负荷预测

4.2单增加湿度因素的XGBoost模型负荷预测

4.3单增加降雨量的XGBoost模型负荷预测

4.4温度、温度、降雨量综合考虑的多维度XGBoost模型

4.5实验结果与分析

4.6小结

5.1结论

5.2展望

参考文献

致谢

个人简介

展开▼

摘要

电网负荷预测作为电力系统中的重要环节,提出至今一直被行业内专家重视。从时间序列到机器学习如支持向量机等模型的应用,电网负荷预测取得了显著的进展。然而,随着预测精度要求的提高,数据量的提升,影响因素的增加,传统模型在处理海量负荷预测数据时显现出疲态、无法达到高效,本文尝试将机器学习领域和各大数据挖掘比赛中取得较好效果的eXtreme Gradient Boosting(XGBoost)模型应用在电网负荷预测中,并选第九届电工数学建模A题负荷预测竞赛的某地区真实电荷数据作样本,采用K折交叉验证及网格搜索法进行模型训练,利用平均绝对百分误差、均方根误差、准确率,单点达标率等指标比较XGBoost模型和传统模型的差异。同时本文还将尝试长短期记忆人工神经网络(Long-Short Term Memory,LSTM)在电网负荷预测中的应用。
  本文对实例2015-01-10日内的每隔15分钟的电网负荷96个样本点进行预测,并利用达标率和准确率两个指标来比较4种模型在单个时间点和整体预测上的精度(其中达标率为单个时间点预测相对误差<3%的点占总预测点的比例;准确率为所有预测点预测结果的误差率,其中准确率≥94%表示整体预测合格)。随机森林回归(RandomForest,RF)预测样达标率为31.25%、准确率为92.42%;梯度增强回归树(Gradient Boosting Regression Tree,GBRT)预测样达标率为57.29%、准确率为96.48%;LSTM预测样达标率为88.54%、准确率为98.04%;XGBoost预测样达标率为85.42%、准确率为98.05%。XGBoost模型相对于传统GBRT模型达标率提升28.13%,准确率提升1.57%,说明XGBoost对波动明显的单点有更好的拟合能力。同时LSTM模型也表现出了较好的拟合能力,是今后电网负荷预测的一个发展方向。但由于深度学习目前运行设备成本高、且相对树模型更为黑盒可解释性低,不利于业务人员理解。而XGBoost模型属于浅层学习,不仅对硬件设施要求低、运行速率快,而且预测精度高。XGBoost模型是目前较符合电网超短期负荷预测发展趋势的具有实用性和应用前景的算法。
  同时本文还研究了不同的特征维度对电网负荷预测的影响,即多维度下的电力系统负荷预测。(1)、只考虑时序特征的XGBoost模型(Single-XGBoost,S-XGBoost)达标率为44.79%、准确率为96.26%;(2)、单增加温度因素的XGBoost模型(Temperature-XGBoost,T-XGBoost)达标率为95.84%、准确率为98.61%;(3)、单增加湿度因素的XGBoost模型(Humidity-XGBoost,H-XGBoost)达标率为83.33%、准确率为97.89%;(4)、单增加降雨量的XGBoost模型(Rainfall-XGBoost,R-XGBoost)达标率为64.58%、准确率为96.44%;(5)、温度、湿度、降雨量综合考虑的多维度XGBoost模型(Multi-dimensiona-XGBoost,M-XGBoost)达标率为85.42%、准确率为98.05%。从预测点达标率和准确率分析,T-XGBoost模型预测达标率分别优于H-XGBoost模型12.51%、R-XGBoost模型31.26%;准确率方面T-XGBoost模型比H-XGBoost模型高0.72%、R-XGBoost模型2.17%,证明温度因素对电网负荷预测影响突出。同时T-XGBoost模型预测达标率优于M-XGBoost模型10.42%,准确率方面T-XGBoost模型准确率比M-XGBoost模型准确率高出0.56%,表明机器学习中特征因素并不是越多越好,当特征项存在相关性过高的冗余因素时模型预测精度会降低。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号