公开/公告号CN112348260A
专利类型发明专利
公开/公告日2021-02-09
原文格式PDF
申请/专利权人 国网江苏省电力有限公司;
申请/专利号CN202011243023.7
申请日2020-11-09
分类号G06Q10/04(20120101);G06K9/62(20060101);G06Q30/02(20120101);G06F16/9537(20190101);
代理机构11108 北京太兆天元知识产权代理有限责任公司;
代理人张洪年
地址 210024 江苏省南京市上海路215号
入库时间 2023-06-19 09:52:39
技术领域
本发明涉及大数据应用领域,特别是涉及电力行业大数据应用领域,更为具体的说是涉及区域业扩工程投资额预测方法。
背景技术
业扩(供电业务扩展)指发展新的电力用户相关的业务。业扩工程是指由客户申请用电而引起的客户全部或部分投资建设的电力工程,作为电力投资的重要领域、服务地方经济可持续发展的重要工程,既直接关系到用户的切身利益,又关系到电网的稳定运行、电力企业的社会形象。业扩工程具有建设周期短、物资需求响应速度快等特点,准确预测区域业扩工程投资额对合理规划业扩工程项目、有序开展物资采购具有重要意义。
为提高预测精度,业界研究了多种预测方法,比较经典的传统预测方法有加权平均法、指数平滑法、灰色预测等,然而传统的预测方法比较适用于市场环境稳定、规律性较强的情形。近年来,随着计算机技术的快速发展,机器学习算法被广泛应用于预测工作之中。
发明内容
本发明所要解决的技术问题是结合区域业扩工程投资额的周期性、趋势性等特点,开发基于机器学习算法的区域业扩工程投资额预测方法,从而提高区域业扩工程投资额预测的准确性,为业扩工程项目储备、施工计划安排等工作高效开展提供良好支撑。
为了解决上述技术问题,本发明公开了区域业扩工程投资额的预测方法,包括以下步骤:
第一步,选取符合业扩工程投资额预测的算法模型,在本发明中我们选用Prophet算法模型;
第二步,根据选定的Prophet算法模型,选取训练参数;
第三步,按照第二步中选取的训练参数,将选定区域历史数据进行预处理,并形成输入数据样本;
第四步,预设训练参数初始值,并从第三步划分部分输入数据样本作为训练集数据代入Prophet算法模型进行预测;
第五步,将第四步中的预测值与实际值进行对比,根据拟合效果和预测目标调整训练参数;
反复循环第四步与第五步,直到取得满足要求的拟合效果和预测精度;
第六步,确定该区域的Prophet预测模型;
第七步,利用训练后的Prophet预测模型进行该区域业扩工程投资额预测,并且将预测结果输出。
优选的,所述Prophet算法模型为y(t)=g(t)+s(t)+h(t)+∈_t,选取训练参数为g(t)、s(t),其中:
s(t):季节项、反应周期性变化,模型调控参数为seasonality_prior_scale;
g(t):趋势项,反应趋势性变化,模型调控参数为change points&changepoint_prior_scale。
进一步优选的,第三步中所述的预处理是指清洗和梳理,具体为:
(1)区域物料季度出库额预处理:梳理分析近年来业扩工程各年度实际出库表单,按照季度维度对出库数据进行拆解;
(2)区域季度投资额预处理:对各个区域业扩工程历年投资计划总额按照季度拆解,测算方法是,某年的季度投资额=业扩年度投资总额×季度业扩物资出库金额占比。
作为优选,第四步中预设训练参数初始值是指预设change points、changepoint_prior_scale、seasonality_prior_scale等算法训练参数的初始值。
优选的,所述满足要求是预测值与实际值拟合准确率高于90%。
Prophet算法是基于时间序列分解和机器学习的一种数据预测工具,不仅可以处理时间序列存在一些异常值的情况,还能够几乎全自动地预测时间序列未来的走势,拟合速度快,有利于与使用者之间的交互式探索,在区域业扩工程投资额预测方面具有较强的适用性和有效性。
采用本发明公开的技术方案后,可以根据历史区域业扩工程投资额数据和输入参数,快速、自动预测区域业扩工程未来多个季度的投资额,进而实现区域业扩项目年度投资额的预测,预测值具有较高的准确性,能够有效提高业扩工程项目投资预算管理水平。
附图说明
图1为实施例2中得到的预测曲线。
具体实施方式
为了更好的理解本发明,下面我们结合具体的实施例对本发明进行进一步的阐述。
实施例1
某区域业扩工程投资额的预测方法,包括以下步骤:
第一步,选取符合业扩工程投资额预测的算法模型,在本发明中我们选用Prophet算法模型;Prophet算法考虑时间序列的趋势性、季节性、节假日效应以及噪声因素,也就是:y(t)=g(t)+s(t)+h(t)+∈_t。
第二步,根据选定的Prophet算法模型,选取训练参数;优选的,在本发明中根据各区域业扩工程投资额的变化特性及预测目标,选取以下两项:
s(t):季节项、反应周期性变化,模型调控参数为seasonality_prior_scale;
g(t):趋势项,反应趋势性变化,模型调控参数为change points&changepoint_prior_scale。
第三步,按照第二步中选取的训练参数,将选定区域历史数据进行预处理,并形成输入数据样本;
在本发明中我们对算法模型输入涉及的相关数据进行清洗和梳理,在本实施例中优选具体包括,
(1)区域物料季度出库额预处理。梳理分析近年来业扩工程各年度实际出库表单,按照季度维度对出库数据进行拆解。
(2)区域季度投资额预处理。对各个区域业扩工程历年投资计划总额按照季度拆解,测算方法是,某年的季度投资额=业扩年度投资总额*季度业扩物资出库金额占比。
第四步,预设训练参数初始值,并从第三步划分部分输入数据样本作为训练集数据代入Prophet算法模型进行预测;
在本发明中优选的根据数据样本的特征,预设change points、changepoint_prior_scale、seasonality_prior_scale等算法训练参数的初始值;
第五步,将第四步中的预测值与实际值进行对比,根据拟合效果和预测目标调整训练参数;
反复循环第四步与第五步,直到取得满足要求的拟合效果和预测精度;
具体来说,根据预设的训练参数,输入第五步中预处理的季度区域投资额数据,采用采取Prophet算法对数据进行训练,得到区域业扩工程投资额一次预测值,然后根据拟合效果和预测目标,调整训练参数,再次对数据进行训练,直至取得较好的拟合效果和预测精度。
第六步,确定该区域的Prophet预测模型;
第七步,利用训练后的Prophet预测模型进行该区域业扩工程投资额预测,并且将预测结果输出。即,输出拟合效果和预测精度最佳的预测值,即为区域业扩工程投资额最终的预测结果。
实施例2
下面我们以A区域的2017-2019年的数据样本为例,来说明A区域的业扩工程投资额预测方法。
第一步,选取符合业扩工程投资额预测的算法模型,在本发明中我们选用Prophet算法模型;Prophet算法考虑时间序列的趋势性、季节性、节假日效应以及噪声因素,也就是:y(t)=g(t)+s(t)+h(t)+∈_t。
第二步,根据选定的Prophet算法模型,选取训练参数;优选的,在本发明中根据各区域业扩工程投资额的变化特性及预测目标,选取以下两项:
s(t):季节项、反应周期性变化,模型调控参数为seasonality_prior_scale;
g(t):趋势项,反应趋势性变化,模型调控参数为change points&changepoint_prior_scale。
第三步,按照第二步中选取的训练参数,将选定区域历史数据进行预处理,并形成输入数据样本;
譬如在本实施例中按季度维度梳理A区域2017-2019年的出库数据,依据出库数据将投资额预算数据按季度拆分。
在本发明中我们对算法模型输入涉及的相关数据进行清洗和梳理,在本实施例中优选具体包括,
(1)区域物料季度出库额预处理。梳理分析近年来业扩工程各年度实际出库表单,按照季度维度对出库数据进行拆解。
(2)区域季度投资额预处理。对各个区域业扩工程历年投资计划总额按照季度拆解,测算方法是,某年的季度投资额=业扩年度投资总额*季度业扩物资出库金额占比。
譬如,在本实施例中以A区域的2017年-2019年的数据为例,对数据进行如下处理:
(1)历史出库数据。梳理分析2017-2019年度的实际出库表单,对共计131587条出库数据条目按照季度维度进行拆解。
(2)投资计划额。2017年和2019年各季度的投资额,以2018年度投资额与出库额的比例为基础进行拆分,比如,A区域2018年各季度投资额与出库额的比例为1.41,则2019年第一季度的投资额=2019年第一季度的出库额/1.41。
以A区域为例,最终整理形成输入数据样本如表1:
表1:
第四步,预设训练参数初始值,并从第三步划分部分输入数据样本作为训练集数据代入Prophet算法模型进行预测;
譬如,在本实施例中,我们预设训练参数初始值如下:
Change points:3
changepoint_prior_scale:0.4
seasonality_prior_scale:8
第五步,将第四步中的预测值与实际值进行对比,根据拟合效果和预测目标调整训练参数;
反复循环第四步与第五步,直到取得满足要求的拟合效果和预测精度;
具体来说,根据预设的训练参数,输入第五步中预处理的季度区域投资额数据,采用采取Prophet算法对数据进行训练,得到区域业扩工程投资额一次预测值,然后根据拟合效果和预测目标,调整训练参数,再次对数据进行训练,直至取得较好的拟合效果和预测精度;
譬如在本实施例中,我们以A区域2017-2019年7个季度为训练数据,2019年第二季度为预测数据,将输入数据样本带入模型中训练中,得到区域业扩工程投资额一次预测值,如表2所示,
表2:
不断调整Change points、changepoint_prior_scale、seasonality_prior_scale等3个训练参数的值,再次对数据进行训练,直至取得较好拟合效果的预测精度。各参数情况下得到的预测结果如表3所示,
表3:
第六步,确定该区域的Prophet预测模型;
即以序号4所列的参数作为Prophet预测模型参数。
第七步,利用训练后的Prophet预测模型进行该区域业扩工程投资额预测,并且将预测结果输出。即,输出拟合效果和预测精度最佳的预测值,即为区域业扩工程投资额最终的预测结果。如图1所示的投资额预测曲线,其中黑点表示训练数值,无黑点表示预测值,图面右侧部分的三角形区域为预测的置信区间。
以上所述是本发明的具体实施方式。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
机译: 区域特征预测方法,区域特征预测装置和区域特征预测程序
机译: 接触区域预测装置,接触区域预测方法和接触区域预测程序
机译: 使用运动补偿帧间预测方法的运动图像编解码装置,该运动补偿帧间预测方法可以是集成区域