公开/公告号CN112418633A
专利类型发明专利
公开/公告日2021-02-26
原文格式PDF
申请/专利权人 国网冀北电力有限公司计量中心;
申请/专利号CN202011284909.6
申请日2020-11-17
分类号G06Q10/06(20120101);G06Q50/06(20120101);
代理机构33233 浙江永鼎律师事务所;
代理人陆永强;张晓英
地址 100032 北京市西城区地藏庵南巷1号10号楼2层
入库时间 2023-06-19 10:00:31
技术领域
本发明属于电力技术领域,尤其是涉及一种基于典型相关分析的停电敏感性相关因素分析方法。
背景技术
目前已有的停电敏感性分析方法主要是基于神经网络和聚类,以及基于异源交叉回归分析的。如中国专利公开了一种基于神经网络及聚类的停电敏感性分析方法[申请号:CN202010408011.9],包括以下具体步骤:步骤1:数据预处理:采集停电计划表、停电工单表、报修工单表、客户诉求工单表,作为数据样本,计算各区域对应的停电工单数量,对停电计划表和停电工单中文本型分类变量进行数据标签化,使得数据样本平衡;步骤2:聚类分析:对数据样本进行聚类分析,标注各地域的停电敏感性标签,将停电敏感性标签作为地域因素指标加入停电计划政策向导表;步骤3:构建线路敏感性神经网络预测模型;根据投诉工单和报修工单量是否超过预设阈值,判分是否敏感特性;步骤4:停电计划安排:对停电导致的投诉工单和报修工单向上追溯至地区和线路,精准定位客户的敏感度特性,为未来停电安排提供依据。
现有技术中,没有对停电敏感客户形成明确、统一的定义,各相关因素与停电敏感度的相关程度不明确,导致后续对客户的敏感度定位存在较大的误差。
发明内容
本发明的目的是针对上述问题,提供一种基于典型相关分析的停电敏感性相关因素分析方法。
为达到上述目的,本发明采用了下列技术方案:
一种基于典型相关分析的停电敏感性相关因素分析方法,包括以下步骤:
S1:基于典型相关分析方法依次计算各属性和停电敏感度的相关系数;
S2:根据所述相关系数给出相应属性与停电敏感度的关系等级。
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,所述的步骤S1包括:
S11.通过敏感度定义算法定义所有用户的停电敏感度以获取停电敏感度矩阵Y;
S12.提取所有用户关于各项属性的属性数据以获得各项属性的属性矩阵X;
S13.所述典型相关分析方法根据停电敏感度矩阵Y和各项属性的属性矩阵X依次计算各项属性和停电敏感度的相关系数。
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S13中,所述的典型相关分析方法通过对停电敏感度矩阵Y和相应属性的属性矩阵X进行降维处理后计算相应属性与停电敏感度的相关系数。
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S13中,在计算某属性和停电敏感度的相关系数时,执行以下相应的降维步骤:
S131.计算相应属性的方差S
计算相应属性与停电敏感度的协方差S
S132.由属性线性系数计算方法根据相应属性的方差S
由敏感度线性系数计算方法根据停电敏感度的方差Syy及两个协方差S
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S132中,
所述的属性线性系数计算方法包括公式(1),且通过以下方式获取相应属性的属性线性系数a:
A1.对公式N进行特征分解,找到最大的特征值,取平方根;
A2.找到对应特征向量,此为相应属性的属性线性系数a;
所述的敏感度线性系数计算方法包括公式(2),且通过以下方式获取相应属性对应的敏感度线性系数b:
B1.对N'进行特征分解,找到最大的特征值,去平方根;
B2.找到对应特征向量,此为相应属性对应停电敏感度的敏感度线性系数b。
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S13中,所述的典型相关分析方法包括公式(3)
其中,ρ为相关系数,cov(a
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S11中,所述的敏感定义算法包括公式(4)
其中P代表客户的停电敏感程度;
x
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S11中,用于定义敏感程度的因素包括用电类别、行业类别、合同容量、历史停电时间和电话咨询次数中的任意一种或多种的组合;
所述的属性包括用户编号、用户年龄、用户最常用电时间段、开户年数、历史信用情况、用户类别、总用电量、最高单日用电量、应缴金额、风险等级、供电单位、最高单日用电量、高耗能行业类别、城乡类别和负荷性质中的任意一种或多种的组合。
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S2中,所述的相关系数大于等于负1且小于等于正1,且将[-1,1]平均划分为负相关4级至正相关4级的8个关系等级。
在上述的基于典型相关分析的停电敏感性相关因素分析方法中,在步骤S1之前,先对样本数据进行包括异常值去除和标准化处理的预处理。
本发明的优点在于:通过统计数据对停电敏感性进行定义,并给出相应的计算方法,实现对停电敏感客户的形成明确统一的定义;提供典型相关分析方法,能够统一分析各属性与停电敏感度之间的相关程度。
附图说明
图1为本发明基于典型相关分析的停电敏感性相关因素分析方法中数据预处理的方法流程图;
图2是本方明基于典型相关分析的停电敏感性相关因素分析方法的方向流程图;
图3是本方明基于典型相关分析的停电敏感性相关因素分析方法的流详细程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细的说明。
本实施例公开了一种基于典型相关分析的停电敏感性相关因素分析方法,包括以下步骤:
如图1所示,为了让输入数据真实一致,本实施例在进行分析之前先对样本数据进行预处理以便于后面的分析,在这里,预处理操作主要包括异常值去除和标准化处理两步操作。数据预处理可以分为以下四步:
(1)输入数据:从数据库中选出所要求的数据作为输入;
(2)去除异常值:是指对某些数据元组来说,它们在被输入时可能因为种种原因缺少了某个字段的值、重复出现和取值太过异常。对这种情况的可以根据其他字段的值推测出该异常字段的应该取的值将其修改或者从直接输入数据中删去,以免在进行分析时出现错误;
(3)标准化是指,在进行完上述操作之后,得到的数据虽然已经没有了异常值,但是由于数据源的数据在数据类型等方面仍可能存在不符合典型相关分析所需要的情况,这里要将这些取值不规范的属性规范化;
(4)输出数据:将数据预处理之后的数据输出。
对数据进行预处理后执行以下步骤:
S1:基于典型相关分析方法依次计算各属性和停电敏感度的相关系数;
S2:根据所述相关系数给出相应属性与停电敏感度的关系等级。具体为,输出相应属性和停电敏感度的相关系数ρ,根据ρ的正负和绝对值大小来分级。
相关系数ρ大于等于负1且小于等于正1,这里将[-1,1]平均划分为如表1中负相关4级至正相关4级的8个关系等级。
表1相关系数ρ对应的相关等级
如表1,根据求出的相关系数ρ,可以把当前所分析的属性同用户停电敏感度的关系分为正负相关共8级,最后把这些等级输出作为本系统的分析结果,实现对各种不同属性与停电敏感度之间的相关性的分级分析。
具体地,步骤S1包括:
S11.通过敏感度定义算法定义所有用户的停电敏感度以获取停电敏感度矩阵Y;
这里敏感定义算法包括公式(1)
其中P代表客户的停电敏感程度;
x
该步骤对停电敏感度进行统计上的定义,从已有数据出发来定义停电敏感度,且优选将定义中使用过的数据,在之后的相关因素分析中不再作为因素来进行分析。
在本实施例中,用于定义敏感程度的因素包括用电类别、行业类别、合同容量、历史停电时间和电话咨询次数这五个因素,故公式中的n为5。
S12.提取所有用户关于各项属性的属性数据以获得各项属性的属性矩阵X;
S13.所述典型相关分析方法根据停电敏感度矩阵Y和各项属性的属性矩阵X依次计算各项属性和停电敏感度的相关系数。
以下表2列出了14种用户停电敏感性相关因素的相关属性的类型和取值范围。在之后的典型相关分析中就会使用到这14种相关因素作为输入,来分别分析这些属性同用户停电敏感性之间的相关程度。
表2停电敏感性相关因素属性
本实施例采用典型相关分析(Canonical Correlation Analysis,CCA)进行停电敏感性的分析,CCA的概述:
有两组一维的数据集X和Y,则相关系数ρ的定义为:
其中cov(X,Y是X和Y的协方差,而D(X),D(Y)分别是X和Y的方差。相关系数ρ的取值为[-1,1,]ρ的绝对值越接近于1,则X和Y的线性相关性越高,越接近于0,则X和Y的线性相关性越低。
虽然相关系数可以很好地分析一维数据的相关性,但是对于高维数据缺不能直接使用。所以本实施例中,典型相关分析方法通过对停电敏感度矩阵Y和相应属性的属性矩阵X进行降维处理后计算相应属性与停电敏感度的相关系数。即将多维的X和Y都用线性变换为1维的X'和Y',将高维数据降到一维,然后再用相关系数进行相关性的分析。对所有属性进行反复操作后可以得到总体的结果输出各属性与停电敏感性程度的相关性结果。
进一步地,如图3所述,在步骤S13中,在计算某属性和停电敏感度的相关系数时,执行以下相应的降维步骤:
S131.计算所有用户相应属性X的方差S
计算所有用户相应属性X与所有用户停电敏感度Y的协方差S
S132.由属性线性系数计算方法根据相应属性的方差S
由敏感度线性系数计算方法根据停电敏感度的方差Syy及两个协方差S
CCA的最终目标是:降维到1维后,使数据集两组数据的相关系数最大。这里数据集是所有用户的某项属性X和所有用户的停电敏感度Y,X为1×n的相关因素样本矩阵,Y为1×n的停电敏感度样本矩阵,其中n为用户个数。
对于属性矩阵X,我们将其投影到1维,或者说进行线性表示,对应的投影向量或者说属性线性系数向量为a,对于停电敏感度矩阵Y,我们将其投影到1维,对应的投影向量为停电敏感度线性系数向量为b,这样X,Y投影后得到的一维向量分别为X',Y'
可以得到X'=a
CCA的优化目标是最大化ρ(X',Y')得到对应的属性线性系数a和敏感度线性系数b,即类似最大似然估计的方法最大化L
由于S
经过优化,等式(5)转化为:
L(a,b)=a
然后采用特征分解方法来优化等式(6)中的L(a,b),通过利用拉格朗日函数,将优化目标转化为等式(7)的最大问题:
经过推导可以把上式中求最大相关系数λ的问题转换成求矩阵
因此,这里的属性线性系数计算方法包括公式(8),且通过以下方式获取相应属性的属性线性系数a:
A1.对公式N进行特征分解,找到最大的特征值,取平方根;
A2.找到对应特征向量,此为相应属性的属性线性系数a;
所述的敏感度线性系数计算方法包括公式(9),且通过以下方式获取相应属性对应的敏感度线性系数b:
B1.对N'进行特征分解,找到最大的特征值,取平方根;
B2.找到对应特征向量,此为相应属性对应停电敏感度的敏感度线性系数b。
通过上述方法,将问题转换成求矩阵
进一步地,在步骤S13中,所述的典型相关分析方法包括公式(10)
其中,ρ为相关系数,cov(a
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
机译: CANDU驻地停电的严重事故敏感性评估分析方法
机译: 基于元胞自动机的地理多元流数据时空自相关分析方法
机译: 人相关分析系统,人相关分析方法和程序