公开/公告号CN112686491A
专利类型发明专利
公开/公告日2021-04-20
原文格式PDF
申请/专利权人 国网浙江省电力有限公司台州供电公司;
申请/专利号CN202011186999.5
申请日2020-10-30
分类号G06Q10/06(20120101);G06Q30/02(20120101);G06Q50/06(20120101);G06K9/62(20060101);
代理机构33217 杭州华鼎知识产权代理事务所(普通合伙);
代理人项军
地址 317000 浙江省台州市椒江区中心大道809号
入库时间 2023-06-19 10:41:48
技术领域
本发明涉及电力数据分析技术领域,尤其是指一种基于用电行为的企业电力数据分析方法。
背景技术
随着经济的发展,关于企业的电力数据分析也随之变得十分重要,一方面,政府管理部门需要及时掌握宏观经济现状和产业发展趋势,整合分析上下游产业链,科学制定产业发展规划政策;应急情况下,需要及时高效获知具备物资生产资质的生产企业信息,提升信息统计和生产调配效率;另一方面,企业需要提高洞察行业风向的敏锐嗅觉,科学规避投资风险,进一步释放发展动能;需要获知生产链上下游及本行业市场供需情况,优化企业排产和扩产;需要知晓在行业内的综合能耗水平,推动产业优化升级,提升企业竞争力。但是现有的企业电力数据服务于内部管理的同时,也在积极挖掘对外增值服务,支撑政府管理部门或企业通过电力数据来达到综合精准全面分析的效果。
发明内容
本发明的目的是克服现有技术中的缺点,提供一种基于用电行为的企业电力数据分析方法。
本发明的目的是通过下述技术方案予以实现:
一种基于用电行为的企业电力数据分析方法,包括以下步骤:
步骤1,收集企业的基本信息数据、用电量数据、电力档案数据和工业互联网数据,并将所有数据进行数据融合;
步骤2,选取融合数据的特征量,对特征量进行K-means++聚类分析,完成对企业的用能特征聚类分析;
步骤3,通过Topsis评价法对企业的能耗等级进行评价;
步骤4,根据企业的用能特征、企业的能耗等级结合企业的基本信息数据、用电量数据和、电力档案数据和工业互联网数据,对企业的电力数据进行表格和图像存储;
步骤5,相关人员通过电力数据的特征表述对企业的电力数据进行检索,并通过检索结果进行后续分析研究。
本方案中,首先多维度全方位收集企业的基本信息、电力相关信息和工业互联网企业产能信息,由于收集的信息是多维度的,所以要进行数据融合;通过对企业的用能特征等级划分和企业的能耗等级进行评价,可以更加深入直观了解企业的电力数据,为后续政府管理部门和企业进行研究提供了强有力的支撑。
作为一种优选方案,所述的步骤5中,后续分析研究包括产业链整合分析,具体方法为:
步骤a,将上下游企业的用电量数据作为离散数据,构建横坐标参数为日期,纵坐标参数为用电量的每天用电量曲线,上游企业的用电量曲线为m,下游企业的用电量曲线为n;
步骤b,对用电量曲线m和用电量曲线n做曲线相似度分析,计算相似度;
步骤c,若相似度指数大于等于设定的阈值则判断上下游企业用电趋势相似,产能匹配,若相似度指数小于设定的阈值则判断上下游企业用电趋势不相似,发出异常告警。
作为一种优选方案,所述的步骤c中,当相似度指数小于设定的阈值则判断上下游企业用电趋势不相似,则分析上下游企业的用电趋势,若上游用电趋势上升,下游用电趋势下滑,则给出上游需要降低产能的建议,若上游用电趋势下降,下游用电趋势上升,则给出上游需要增加产能的建议。
作为一种优选方案,所述的步骤1中,在数据融合后还包括数据清洗的步骤,数据清洗包括以下子步骤:
子步骤1,调用数据清洗模型;
子步骤2,数据清洗模型对融合数据进行检测,检测出融合数据中的错误数据;
子步骤3,数据清洗模型生成修复建议,相关人员根据修复建议手动完成对错误数据的修复或者数据清洗模型根据修复建议完成对错误数据的修复。
作为一种优选方案,数据清洗模型对数据集进行检测的错误数据包括以下的一种或多种:重复值、别名、缺失值和异常值,每一种错误数据均对应一个数据清洗模型。
数据在采集和融合的过程中,难免会产生诸如重复值、别名、缺失值和异常值等数据错误。数据错误可能影响数据可视化分析的结果,因此,有效的数据可视化分析必然离不开高质量和高可用的数据集。本发明主要进行面向数据可视化分析的数据清洗,核心是清洗对数据分析结果影响加大的部分数据子集,降低数据清洗的代价,提高数据清洗和数据准备阶段的效率。
作为一种优选方案,所述的别名的错误数据对应的数据清洗模型为连接算法匹配模型,连接算法匹配模型采用模糊匹配算法来查找任意两个别名数据中可能存在的同义词,若相似度大于设定的阈值,则此两个别名数据为同一个实体概念,因此数据准备层将一个数据名称作为正确数据,另一个为别名的错误数据修正为正确数据,完成别名的错误数据清洗。
作为一种优选方案,所述的步骤2具体为:融合数据的特征量包括月度用电量、用电量增长趋势、负荷变化量、月度电费量和包装容量,根据月度用电量、用电量增长趋势和负荷变化量构成企业若干个月内的电量变化情况的三个分析维度,对电量变化情况进行K-means++聚类分析,完成对企业的用能特征等级划分。
作为一种优选方案,所述的步骤3具体包括以下子步骤:
子步骤a,提取与计算企业能耗指标;
子步骤b,Topsis综合评价算法对企业产能打分;
子步骤c,应用matplotlib模块将分类结果可视化,根据企业得分结果,统计不同用电特征的企业得分段的企业数量。
Topsis综合评价法原理是在明确理想解的前提下,判断每个样本与理想解间的“距离”,从而判断多个样本间的排序。其中,理想解通常包括正理想解和负理想解,通过设计距离的不同表达方式反映样本与理想解间的“距离”。
作为一种优选方案,所述的子步骤a中,对企业能耗指标提取的数据做归一化处理,归一化处理的方法为min-max标准化或z-score标准化。
本发明的有益效果是:基于用电行为的企业电力数据分析方法通过对企业用电数据的深度研究分析,可以有效帮助政府管理部门或企业通过用电行为来判断企业、行业的用电趋势、发展形势,便于做出相应的措施提高产能。本发明实用性强、易于实现。
附图说明
图1是本发明的一种流程图;
图2是本发明产业链整合分析流程图;
图3是本发明数据清洗流程图;
图4是本发明Topsis评价法流程图;
图5是企业相似度曲线对比图。
具体实施方式
下面结合附图和实施例对本发明进一步描述。
实施例:一种基于用电行为的企业电力数据分析方法,如图1所示,包括以下步骤:
步骤1,收集企业的基本信息数据、用电量数据、电力档案数据和工业互联网数据,并将所有数据进行数据融合;
步骤2,选取融合数据的特征量,对特征量进行K-means++聚类分析,完成对企业的用能特征聚类分析;
步骤3,通过Topsis评价法对企业的能耗等级进行评价;
步骤4,根据企业的用能特征、企业的能耗等级结合企业的基本信息数据、用电量数据和、电力档案数据和工业互联网数据,对企业的电力数据进行表格和图像存储;
步骤5,相关人员通过电力数据的特征表述对企业的电力数据进行检索,并通过检索结果进行后续分析研究。
本方案中,首先多维度全方位收集企业的基本信息、电力相关信息和工业互联网企业产能信息,由于收集的信息是多维度的,所以要进行数据融合;通过对企业的用能特征等级划分和企业的能耗等级进行评价,可以更加深入直观了解企业的电力数据,为后续政府管理部门和企业进行研究提供了强有力的支撑。
所述的步骤5中,后续分析研究包括产业链整合分析,具体方法如图2所示:
步骤a,将上下游企业的用电量数据作为离散数据,构建横坐标参数为日期,纵坐标参数为用电量的每天用电量曲线,上游企业的用电量曲线为m,下游企业的用电量曲线为n;
步骤b,对用电量曲线m和用电量曲线n做曲线相似度分析,计算相似度;
步骤c,若相似度指数大于等于设定的阈值则判断上下游企业用电趋势相似,产能匹配,若相似度指数小于设定的阈值则判断上下游企业用电趋势不相似,发出异常告警。
所述的步骤c中,当相似度指数小于设定的阈值则判断上下游企业用电趋势不相似,则分析上下游企业的用电趋势,若上游用电趋势上升,下游用电趋势下滑,则给出上游需要降低产能的建议,若上游用电趋势下降,下游用电趋势上升,则给出上游需要增加产能的建议。
本实施例中,如图5所示,分析上下游企业同时刻点用电量相似度,相似度指数为89.9%,接近于1,说明上下游企业用电趋势相似,产能匹配。
所述的步骤1中,在数据融合后还包括数据清洗的步骤,如图3所示,数据清洗包括以下子步骤:
子步骤1,调用数据清洗模型;
子步骤2,数据清洗模型对融合数据进行检测,检测出融合数据中的错误数据;
子步骤3,数据清洗模型生成修复建议,相关人员根据修复建议手动完成对错误数据的修复或者数据清洗模型根据修复建议完成对错误数据的修复。
数据清洗模型对数据集进行检测的错误数据包括以下的一种或多种:重复值、别名、缺失值和异常值,每一种错误数据均对应一个数据清洗模型。
数据在采集和融合的过程中,难免会产生诸如重复值、别名、缺失值和异常值等数据错误。数据错误可能影响数据可视化分析的结果,因此,有效的数据可视化分析必然离不开高质量和高可用的数据集。本发明主要进行面向数据可视化分析的数据清洗,核心是清洗对数据分析结果影响加大的部分数据子集,降低数据清洗的代价,提高数据清洗和数据准备阶段的效率。
所述的别名的错误数据对应的数据清洗模型为连接算法匹配模型,连接算法匹配模型采用模糊匹配算法来查找任意两个别名数据中可能存在的同义词,若相似度大于设定的阈值,则此两个别名数据为同一个实体概念,因此数据准备层将一个数据名称作为正确数据,另一个为别名的错误数据修正为正确数据,完成别名的错误数据清洗。
所述的步骤2具体为:融合数据的特征量包括月度用电量、用电量增长趋势、负荷变化量、月度电费量和包装容量,根据月度用电量、用电量增长趋势和负荷变化量构成企业5个月内的电量变化情况的三个分析维度,对电量变化情况进行K-means++聚类分析,完成对企业的用能特征等级划分。选取5个月每月月度用电量、用电量增长趋势、用电负荷变化量三个维度数据作为输入,对应的输入数据为118*12维的企业用电特征指标值。通过对企业进行分类时SSE误差平方和曲率变化的计算,电企业分为3类时SSE误差平方和曲率变化最大,因此聚三类效果最优。最后用matplotlib模块将分类结果可视化,根据可视化结果判断不同类别的属性,为每个企业用户制定高用电量、中等用电量、低用电量三个分类标签;根据用户的定性标签,将企业用电特征分为三个档级。
所述的步骤3如图4所示,具体包括以下子步骤:
子步骤a,提取与计算企业能耗指标;基于工业互联平台和电网系统获取企业产能数据和用电数据,并判断其理想解:其中正向测度的指标包含月度用电量、用电增长率、累计产量、企业资质数量、极限产能(计算公式为:极限产能=产品产量/运行时长*24小时)等;负向测度指标包括单位能耗、累计能耗等指标。结合企业用电特征聚类分析结果数据,将这些指标作为企业能耗综合评估分析的输入。
子步骤b,Topsis综合评价算法对企业产能打分;将指标数据标准化,应用TOPSIS评估算法进行综合评估,并将得分进行0-1最大最小标准化,依次由大到小进行企业产能排序。
子步骤c,应用matplotlib模块将分类结果可视化,根据企业得分结果,统计不同用电特征的企业得分段的企业数量。
所述的子步骤a中,对企业能耗指标提取的数据做归一化处理,归一化处理的方法为min-max标准化或z-score标准化。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。
机译: 一种计算机实现的综合电路的行为分析方法,包括基于不同类型的若干准则的路径选择
机译: 一种计算机实现的综合电路的行为分析方法,包括基于不同类型的若干准则的路径选择
机译: 一种计算机实现的综合电路的行为分析方法,包括基于不同类型的若干准则的路径选择