首页> 中国专利> 基于多维度指标聚类的园区用电群体生命周期评价方法

基于多维度指标聚类的园区用电群体生命周期评价方法

摘要

本发明公开了一种基于多维度指标聚类的园区用电群体生命周期评价方法,包括以下步骤:建立由初期阶段、发展阶段、成熟阶段和衰退阶段四个生命周期阶段构成的园区群体生命周期评价体系;确定园区群体生命周期评价体系的多项评价指标;对模板用户的各项评价指标进行聚类,得到四个生命周期阶段每个指标的边界值;将园区其他用电群体的评价指标值输入园区群体生命周期评价体系中,与各边界值进行对比,确定所处的生命周期阶段。本发明提供的基于多维度指标聚类的园区用电群体生命周期评价方法,对不同的园区客户群体,依据多维度的评价指标,再通过聚类划分其所处的园区生命周期阶段,从而可以对不同生命周期的群体提供差异化的服务,提高电网的增值服务。

著录项

说明书

技术领域

本发明涉及智能电网技术领域,特别是涉及一种基于多维度指标聚类的园区用电群体生命周期评价方法。

背景技术

“电力”是一种商品,但又区别于其它商品,首先是产销的同步性,即电力无法进行规模性贮存使得其产、供、销必须在瞬间完成;其次是产品的同质化,不同电力公司提供的电力商品几乎无差别。很显然通过“产品细分、地理细分、人口细分、行为细分、心理细分、生活方式细分、利益细分、文化细分”等方法效用很低,或者说必须重新阐述相关细分技术在电力行业的应用目标,即电力客户细分仅以市场占有率为目标意义不大,主要目标应该是通过细分管理,加强对广大用户的服务力度,使用户拥有更好的体验,能较为稳妥地掌控地区电力需求变化态势,进而为电网建设规划、电网运营规划提供决策依据,有效防控企业经营风险。

随着用电技术的进步和智能电网的快速发展,为充分的了解客户的特点和用电行为,准确的把握客户的购电的生命周期,就需要基于客户的用电习惯和客户的基础信息以及整个园区的特性,采用多维度的指标,对客户的生命周期体系进行划分,有针对性的对不同生命周期阶段的客户提供各项差异化服务,提供电网增值服务。但是,现有的群体生命周期体系建立技术一般是基于客户价值体系进行生命周期的划分,或者是采用客户细分模型和经验算法技术进行生命周期的划分。现有的客户细分模型技术大多对于分类指标划分不全面,或者是客户用电特性以及用电习惯考虑不全面,从而导致生命周期的划分不够准确,因此无法切实的提高电网增值服务水平。

发明内容

本发明的目的是提供一种基于多维度指标聚类的园区用电群体生命周期评价方法,对不同的园区客户群体,依据多维度的评价指标,再通过聚类划分其所处的园区生命周期阶段,从而可以对不同生命周期的群体提供差异化的服务,提高电网的增值服务。

为实现上述目的,本发明提供了如下方案:

一种基于多维度指标聚类的园区用电群体生命周期评价方法,所述方法包括以下步骤:

S1,对园区特性以及园区用电群体的特性进行分析,建立由初期阶段、发展阶段、成熟阶段和衰退阶段四个生命周期阶段构成的园区群体生命周期评价体系;

S2,确定园区群体生命周期评价体系的多项评价指标包括:成长活跃指数、电量波动稳定性、交易额、发展成熟度;

S3,获取园区中的部分用电群体作为模板客户,基于模板客户的用电数据,计算各项评价指标,对模板用户的各项评价指标进行聚类,得到四个生命周期阶段每个指标的边界值;

S4,将园区其他用电群体的评价指标值输入园区群体生命周期评价体系中,将输入的评价指标值与各边界值进行对比,即可确定园区群体所处的生命周期阶段。

可选的,所述步骤S2中,各项评价指标的计算方法包括:

成长活跃指数,用于衡量特定观测周期内园区用电群体的用电浮动情况,即:

式中:

电量波动稳定性,用于衡量特定观测周期内园区用电群体用电的波动性,即:

式中:

交易额,用于衡量园区群体交易额在设定时间内的变化,从而判断用电群体的交易额是否增加,判定用电群体是否有发展,确定园区用电群体的发展阶段,即:

式中:v

发展成熟度,用于衡量一段时期以来的园区用电群体的发展情况,用于判断群体所处的阶段,即:

DEV=Contract capacity (4)

式中,Contract capacity为园区用电群体一年的运行容量。

可选的,所述步骤S3中,对模板用户的各项评价指标进行聚类,具体包括:

根据四个生命周期阶段选择4个初始聚类中心,然后计算各项评价指标对这4个初始聚类中心各自的距离,按照最小距离原则分配到最邻近聚类;

再使用每个聚类中的样本均值作为聚类中心,最后重复聚类过程直至聚类中心不再发生变化,得到4个聚类类别。

可选的,所述步骤S3中,四个生命周期阶段每个指标的边界值,具体包括:

初期阶段:成长活跃指数0.933<GAI<4.3877、电量波动稳定性167<PES<176556、交易额0.903<VOT<4.3529、发展成熟度50<DEV<6400;

发展阶段:成长活跃指数0.0525<GAI<0.0118、电量波动稳定性7125868<PES<12727394、交易额0.0088<VOT<0.0416、发展成熟度6000<DEV<8000;

成熟阶段:成长活跃指数0.0121<GAI<0.067、电量波动稳定性1714771

衰退阶段:成长活跃指数-0.2999

可选的,所述步骤S3中,还包括采用inertias、兰德指数、互信息、同质化得分、完整性得分、v_meansure_score、轮廓系数、Calinski-harabaz Index对聚类结构进行评价。

根据本发明提供的具体实施例,本发明提供的基于多维度指标聚类的园区用电群体生命周期评价方法,公开了以下技术效果:通过对园区特性以及园区用电群体的特性进行分析,定义园区群体生命周期体系评价指标,再选定园区内的模板用户,对模板用户进行评价指标的计算,然后在对模板用户的指标进行聚类,得到四个生命周期阶段每个指标的边界值,最后再将园区其他客户群体的生命周期指标值输入生命周期体系,通过指标边界值的对比,即可确定园区群体所处的生命周期阶段,从而对不同生命周期阶段的群体采取差异化营销手段和差异化服务,为园区群体提供更好的增值服务。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于多维度指标聚类的园区用电群体生命周期评价方法的流程图;

图2为本发明实施例生命周期体系指标雷达图;

图3为本发明园区群体生命周期体系结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于多维度指标聚类的园区用电群体生命周期评价方法,对不同的园区客户群体,依据多维度的评价指标,再通过聚类划分其所处的园区生命周期阶段,从而可以对不同生命周期的群体提供差异化的服务,提高电网的增值服务。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示,本发明提供的基于多维度指标聚类的园区用电群体生命周期评价方法,包括以下步骤:

S1,对园区特性以及园区用电群体的特性进行分析,建立由初期阶段、发展阶段、成熟阶段和衰退阶段四个生命周期阶段构成的园区群体生命周期评价体系;

S2,确定园区群体生命周期评价体系的多项评价指标包括:成长活跃指数、电量波动稳定性、交易额、发展成熟度;

S3,获取园区中的部分用电群体作为模板客户,基于模板客户的用电数据,计算各项评价指标,对模板用户的各项评价指标进行聚类,得到四个生命周期阶段每个指标的边界值;

S4,将园区其他用电群体的评价指标值输入园区群体生命周期评价体系中,将输入的评价指标值与各边界值进行对比,即可确定园区群体所处的生命周期阶段。

其中,所述步骤S1中,初期阶段、发展阶段、成熟阶段和衰退阶段的特征如下:

初期阶段是考察客户群体是否有意愿购电,以及是否能够为企业带来更大的收益,从成长活跃指数、电量波动稳定性、交易额,发展成熟度这四个指标来评判客户的购电意愿度,以及是否愿意签署长期的购电合同;

发展阶段是通过初期确定了可发展的潜在群体,并且群体也确定电力公司能提供满意的服务,双方有长期发展的意愿。但是处于这一周期群体存在很大的波动性,可通过如成长活跃指数,电量波动稳定性等指标来确定其波动性。同时还可以通过计算园区群体的发展成熟度来确定客户的发展情况。在这阶段企业的任务是不断提高客户服务,赢得客户的满意,巩固和加强初期阶段建立的客户信任以及培养客户忠诚度;

成熟阶段,这个阶段客户群体与企业的合作关系已经趋于成熟,企业和客户开始明确双方建立持续长期的关系的意愿,并且双方为了长期的维护这段稳定的关系而努力,因此成熟阶段是双方关系发展的最高阶段,这一阶段依然可以通过成长活跃指数、发展成熟度,电量波动稳定性、交易额这四个指标来判别,在这一阶段为了巩固双方的合作关系应将重点放在提升使客户服务以及提升客户管理关系;

衰退期,这段时期是客户关系的水平逆转阶段,这一阶段导致原因可能是服务不够到位或者是客户有了新的需求,在这一阶段客户购电量下降,因此在衰退阶段,重要的是确定客户流失的原因,以及恢复客户关系。

所述步骤S2中,各项评价指标的计算方法包括:

成长活跃指数,用于衡量特定观测周期内园区用电群体的用电浮动情况,即:

式中:

电量波动稳定性,用于衡量特定观测周期内园区用电群体用电的波动性,即:

式中:

交易额,用于衡量园区群体交易额在设定时间内的变化,从而判断用电群体的交易额是否增加,判定用电群体是否有发展,确定园区用电群体的发展阶段,即:

式中:v

发展成熟度,用于衡量一段时期以来的园区用电群体的发展情况,用于判断群体所处的阶段,即:

DEV=Contract capacity (4)

式中,Contract capacity为园区用电群体一年的运行容量。

所述步骤S3中,对模板用户的各项评价指标进行聚类,具体包括:

根据四个生命周期阶段选择4个初始聚类中心,然后计算各项评价指标对这4个初始聚类中心各自的距离,按照最小距离原则分配到最邻近聚类;

再使用每个聚类中的样本均值作为聚类中心,最后重复聚类过程直至聚类中心不再发生变化,得到4个聚类类别。

如图3所示,所述步骤S3中,四个生命周期阶段每个指标的边界值,具体包括:

初期阶段:成长活跃指数0.933<GAI<4.3877、电量波动稳定性167<PES<176556、交易额0.903<VOT<4.3529、发展成熟度50<DEV<6400;初期阶段是考察客户群体是否有意愿购电,以及是否能够为企业带来更大的收益,根据模板用户的聚类结果求得了初期阶段的指标边界值,初期阶段的四个指标值边界值都比较小,即相邻两个周期四个指标值的变化非常小,说明在这一阶段双方都还未建立长久稳定的合作关系;

发展阶段:成长活跃指数0.0525<GAI<0.0118、电量波动稳定性7125868

成熟阶段:成长活跃指数0.0121

衰退阶段:成长活跃指数-0.2999

所述步骤S3中,还包括采用inertias、兰德指数、互信息、同质化得分、完整性得分、v_meansure_score、轮廓系数、Calinski-harabaz Index对聚类结构进行评价。

1、inertias:是K-Means模型对象的属性,它作为没有真实分类结果标签下的非监督式评估指标。表示样本到最近的聚类中心的距离总和。值越小越好,越小表示样本在类间的分布越集中。

2、兰德指数:兰德指数(Rand index)需要给定实际类别信息C,假设K是聚类结果,a表示在C与K中都是同类别的元素对数,b表示在C与K中都是不同类别的元素对数,则兰德指数为:

其中,

对于随机结果,RI并不能保证分数接近零。为了实现“在聚类结果随机产生的情况下,指标应该接近零”,调整兰德系数(Adjusted rand index)被提出,它具有更高的区分度:

ARI取值范围为[-1,1],值越大意味着聚类结果与真实情况越吻合。从广义的角度来讲,ARI衡量的是两个数据分布的吻合程度。

3、互信息(Mutual Information,MI):指的是相同数据的两个标签之间的相似度,即也是在衡量两个数据分布的相似程度。利用互信息来衡量聚类效果需要知道实际类别信息。

假设U与V是对N个样本标签的分配情况,则两种分布的熵分别为:

其中,P(i)=|U

其中,P(i,j)=|U

标准化后的互信息(Normalized Mutual Information):

调整互信息(Adjusted Mutual Information):

MI与NMI取值范围[0,1],AMI取值范围[-1,1],都是值越大说明聚类效果越好。

4、同质化得分(Homogeneity):如果所有的聚类都只包含属于单个类的成员的数据点,则聚类结果满足同质性。取值范围[0,1],值越大意味着聚类结果与真实情况越符合。

5、完整性得分(Complenteness):如果作为给定类的成员的所有数据点是相同集群的元素,则聚类结果满足完整性。取值范围[0,1],值越大意味着聚类结果与真实情况越符合。

6、v_meansure_score:同质化和完整性之间的谐波平均值,v=2*(同质化*完整性)/(同质化+完整性),取值范围[0,1],值越大意味着聚类结果与真实情况越符合。

7、轮廓系数(Silhouette):适用于实际类别信息未知的情况,用来计算所有样本的平均轮廓系数。对于单个样本,设a是该样本与它同类别中其他样本的平均距离,b是与它距离最近不同类别中样本的平均距离,轮廓系数为:

8、Calinski-harabaz Index:适用于实际类别信息未知的情况,为群内离散与簇间离散的比值,值越大聚类效果越好。

表1聚类评价指标表

由上述聚类评价指标公式计算得出表1的聚类评价指标表,由表中的各项参数可见,ARI、MI、AMI的值都比较大,且处于[-1,1]的范围内,所以按照该聚类方法对生命周期的四个阶段进行聚类得到的聚类效果较好。

为了便于对四个聚类类别进行生命周期体系阶段的对应和划分,通过python画出上述模板用户的生命周期聚类的雷达图,如图2,由雷达图可见,处于客户群1的电量波动稳定性(PFS)和发展成熟度(DEV)与客户群3相差不大,而交易额(VOT)与成长活跃指数(GAI)又与客户群2持平,且4个评价指标的数值为4个群体中的最小值,说明该阶段的用户正处于各方面指标的初始并有可能想发展阶段过渡的阶段,因此可判定其为初期阶段。

处于客户群2的群体的用户数最多,占全部用户的94%,处于客户群2群体,其电量波动稳定性(PFS)最大,其发展成熟度(DEV)也最大,但是交易额(VOT)和成长活跃指数(GAI)数值上为4类客户中数值最小的,并且通过聚类结果显示,客户群2的指标参数存在负数,即与上一周期相比,这一周期的用电量以及交易额有所下降,通过该特性,可判定客户群2为衰退阶段。

处于客户群3的群体主要是在交易额(VOT)和成长活跃指数(GAI)表现最好,且交易额和成长活跃值的变化波动不大,代表该类客户用电较稳定,因此客户群3为成熟阶段。

处于客户群4群体主要是在电量波动稳定性(PFS)和发展成熟度(DEV)表现较好,并且这两个指标的数值也比较大,由于这一类别的群体PFS的值较大,即与上一周期相比这一周期的用电量变化较大,且从DEV的数值可见这一阶段的发展空间也较大,因此,这一阶段可判定为发展阶段。

表2园区群体生命周期阶段边界值表

通过上述雷达图对模板用户的生命周期的体系阶段的划分,并对聚类输出的各项指标的值进行分析处理,可得如表2的园区群体生命周期阶段边界值表,由下表可得到生命周期体系各阶段边界值。即通过每个生命周期阶段的边界值,就可对输入的园区群体进行生命周期阶段的划分。

本发明利用智能电表相关数据分析,对国内园区用电企业,从成长活跃指数、电量波动稳定性、发展成熟度以及交易额等多个维度观测,建立适应配售电市场环境的园区客户群体生命周期阶段评估指标体系;在售电市场环境下,衡量园区综合发展水平的关键因素,从全区群体自身的用电属性,用电习惯出发,结合实践研究构建具有园区特色的且具有通用性的生命周期阶段评价指标;基于多维度的园区生命周期体系评价指标和针对园区不同客户进行聚类分析,确定园区群体所处的生命周期阶段。

现有技术采用的基于客户价值综合评价建立的聚类模型或者基于用电客户细分模型的生命周期评价体系的缺点在于其只关注了用户的价值而忽视了用户的自身属性特点等因素,以及用电客户细分模型采用的赋值方式随意性大,周期长的缺点所导致的分类不准确。而本发明有效的避免了这些不足,不但通过生命周期体系可以较好的了解和观察客户关系的变化发展以及客户的价值,还可以准确的把握客户自身特征以及整个园区的特性,并且基于园区模板客户聚类得出的阶段指标边界值对于整个园区的生命周期阶段的划分更加具有通用性和适用性,因此基于聚类的多维度指标生命周期体系模型对于划分园区群体的生命周期阶段会更加准确。

求取园区群体生命周期体系评价指标的边界值除了基于聚类之外,还可以采用将已知生命周期体系阶段的客户作为模板用户,将该用户的生命周期指标值作为其所处阶段的指标边界值,然后再用关联度分析的方法将该用户指标值与其他用户的指标值作对比,从而得到园区其他群体的所处的生命周期阶段。

本发明提供的基于多维度指标聚类的园区用电群体生命周期评价方法,根据园区群体的用电特性和用电习惯,建立园区群体生命周期体系的评价指标,最后通过选择模板客户再对模板客户的各项指标进行聚类找到具有通用性的园区群体生命周期阶段指标的边界值,从而可将园区中的群体按照生命周期体系进行划分,对不同生命周期阶段的群体采取差异化营销手段和差异化服务,从而为园区群体提供更好的增值服务。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号