首页> 中国专利> 基于电力企业大数据技术的配电网差异特征诊断分析方法

基于电力企业大数据技术的配电网差异特征诊断分析方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请公开了一种基于电力企业大数据技术的配电网差异特征诊断分析方法，以大数据平台作为数据源，使得数据获取来源范围更大，分析角度更加全面，同时，以数据源中提取的预设关键指标信息来建立诊断指标集，从而定量地确定诊断指标信息，并根据预先获取的多个目标电力企业的发展状态信息获得种子样本，通过种子样本与定量的诊断指标集进行对比，从而准确地获得对电力企业在发展建设中出现的差异特征，解决了配电网的差异诊断分析结论的公正性不足的问题，为电力企业在发展过程中指引发展方向，还可以发现不同类别配电网的差异特点。

著录项

公开/公告号CN112270622A

专利类型发明专利
公开/公告日2021-01-26

原文格式PDF
申请/专利权人广东电网有限责任公司电力调度控制中心;
展开▼

申请/专利号CN202011305503.1
发明设计人刘嘉宁;曾凯文;杜斌;林斌;
展开▼

申请日2020-11-19
分类号G06Q50/06(20120101);G06Q10/06(20120101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人苏云辉
地址 510600 广东省广州市越秀区梅花路75号
入库时间 2023-06-19 09:41:38

说明书

技术领域

本发明涉及电力企业数据诊断分析技术领域，尤其涉及一种基于电力企业大数据技术的配电网差异特征诊断分析方法。

背景技术

随着我国智能电网的建设和发展，电力企业积累了海量的配电网运行数据，其发展的差异特征十分明显，其中，配电网的差异性不仅会受到电力企业内部在运营、规划、建设等各方面的影响，还会受到外部使用条件的影响，因此，需要把握配电网在发展过程中存在的差异规律对推动电力企业的配电网发展建设具有重大意义。

目前电力企业对于配电网的差异诊断分析大部分是通过指标分析，但是，其评价指标是基于专家的经验认识和讨论得出，缺乏对相关数据和环境变量的定量判断，容易导致诊断缺乏客观性，诊断结论的公正性不足，难以在行业中有大范围的运用。

发明内容

本申请提供了一种基于电力企业大数据技术的配电网差异特征诊断分析方法，用于解决配电网的差异诊断分析结论的公正性不足的技术问题。

有鉴于此，本申请提供了一种基于电力企业大数据技术的配电网差异特征诊断分析方法，包括以下步骤：

基于预先建立的大数据平台作为数据源，从所述数据源中提取用于配电网诊断分析的预设关键指标信息，从而建立诊断指标集；

根据预先获取的多个目标电力企业的发展状态信息，通过聚类算法对所述发展状态信息进行聚类合并处理，从而筛选出目标簇，所述目标簇内仅包含孤立点的电力企业，其他簇作为种子样本；

基于KL变换和KL散度的方法对所述种子样本再进行聚类合并处理，并将聚类合并处理后的种子样本与所述诊断指标集比对，从而得到配电网中不同目标电力企业的差异特征。

优选地，所述基于预先建立的大数据平台，提取用于配电网诊断分析的预设关键指标信息，从而建立诊断指标集之前还包括：

建立分别连接于配电网中的不同目标电力企业内部业务数据系统和配电网使用数据系统的大数据平台。

优选地，所述数据源中的数据包括生产业务数据、营销系统的客户档案、电网模型数据、用电数据、业务扩展报表数据、客户投诉数据、计量自动化系统配变数据、调度自动化系统线路出口电流数据、调度自动化系统线路出口电压数据、调度自动化系统线路出口开关状态数据、地理信息系统的配电网模型数据、变电站一次接线图以及其馈线单线图。

优选地，所述从所述数据源中提取用于配电网诊断分析的预设关键指标信息，建立诊断指标集的步骤具体包括：

采集预设关键指标信息内的样本数据，对所述样本数据进行预处理，根据预处理后的所述样本数据建立训练样本，并将预处理后的所述样本数据转换为适用于数据挖掘形式的样本数据；

采用主成分分析法对所述训练样本进行降维处理，得到低纬度的训练样本；

基于低纬度的训练样本的特征差异，构建加权支持向量数据的多分类模型；

将所述适用于数据挖掘形式的样本数据加入至所述加权支持向量数据的多分类模型内进行训练，通过所述加权支持向量数据的多分类模型对所述适用于数据挖掘形式的样本数据进行特征提取，将从所述适用于数据挖掘形式的样本数据中进行特征提取得到的关键指标信息建立用于分析配电网差异特征的诊断指标集。

优选地，所述诊断指标集包括用电客户指标、变压器数量、线路条数和线路长度指标、售电量、电力损耗值、供电质量、业务扩展报装指标与安全水平指标。

优选地，所述对所述样本数据进行预处理，根据预处理后的所述样本数据建立训练样本，并将预处理后的所述样本数据转换为适用于数据挖掘形式的样本数据具体包括：

对所述样本数据中的重复数据和无关数据进行删除处理，并对所述样本数据中的异常数据和缺失数据进行插补处理；

根据删除处理和插补处理后的样本数据建立训练样本；

对删除处理和插补处理后的样本数据进行维归约处理，通过数据概化的方式对维归约处理后的样本数据转换为适用于数据挖掘形式的样本数据。

优选地，所述聚类算法采用k-means算法。

优选地，所述基于KL变换和KL散度的方法对所述种子样本再进行聚类合并处理，并将聚类合并处理后的种子样本与所述诊断指标集比对，从而得到配电网中不同目标电力企业的差异特征之后包括：

通过程序页面呈现配电网中不同目标电力企业的差异特征的诊断结果。

优选地，所述通过程序页面呈现配电网中不同目标电力企业的差异特征的诊断结果的呈现形式为图形、表格和页面中的一种或多种组合。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例提供了一种基于电力企业大数据技术的配电网差异特征诊断分析方法，以大数据平台作为数据源，使得数据获取来源范围更大，分析角度更加全面，同时，以数据源中提取的预设关键指标信息来建立诊断指标集，从而定量地确定诊断指标信息，并根据预先获取的多个目标电力企业的发展状态信息获得种子样本，通过种子样本与定量的诊断指标集进行对比，从而准确地获得对电力企业在发展建设中出现的差异特征，解决了配电网的差异诊断分析结论的公正性不足的问题，为电力企业在发展过程中指引发展方向，还可以发现不同类别配电网的差异特点。

附图说明

图1为本申请实施例提供的一种基于电力企业大数据技术的配电网差异特征诊断分析方法的流程图；

图2为本申请另一实施例提供的一种基于电力企业大数据技术的配电网差异特征诊断分析方法的流程图；

图3为本申请另一实施例中步骤S201的流程图；

图4为本申请另一实施例的k-means算法中k值与平均距离的关系示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，本申请提供的一种基于电力企业大数据技术的配电网差异特征诊断分析方法，包括以下步骤：

S100：基于预先建立的大数据平台作为数据源，从数据源中提取用于配电网诊断分析的预设关键指标信息，从而建立诊断指标集；

需要说明的是，从数据源中提取用于配电网诊断分析的预设关键指标信息需遵循系统性、一致性、可测性、独立性和可比性五大基本原则，使得收集样本数据建立评价指标，能客观公正的反应数据差异特征所表现的规律价值，具有实用价值和参考价值，克服指标建立上的主观性，另外，建立的诊断指标集内的指标信息是具有可预测性的。

S200：根据预先获取的多个目标电力企业的发展状态信息，通过聚类算法对发展状态信息进行聚类合并处理，从而筛选出目标簇，目标簇内仅包含孤立点的电力企业，其他簇作为种子样本；

S300：基于KL变换和KL散度的方法对种子样本再进行聚类合并处理，并将聚类合并处理后的种子样本与诊断指标集比对，从而得到配电网中不同目标电力企业的差异特征。

本实施例以大数据平台作为数据源，使得数据获取来源范围更大，分析角度更加全面，同时，以数据源中提取的预设关键指标信息来建立诊断指标集，从而定量地确定诊断指标信息，并根据预先获取的多个目标电力企业的发展状态信息获得种子样本，通过种子样本与定量的诊断指标集进行对比，从而准确地获得对电力企业在发展建设中出现的差异特征，解决了配电网的差异诊断分析结论的公正性不足的问题，为电力企业在发展过程中指引发展方向，还可以发现不同类别配电网的差异特点。

以上为本发明提供的一种基于电力企业大数据技术的配电网差异特征诊断分析方法的一个实施例的详细描述，以下为本发明提供的一种基于电力企业大数据技术的配电网差异特征诊断分析方法的另一个实施例的详细描述。

为了方便理解，请参阅图2，本申请提供的一种基于电力企业大数据技术的配电网差异特征诊断分析方法，包括以下步骤：

S101：建立分别连接于配电网中的不同目标电力企业内部业务数据系统和配电网使用数据系统的大数据平台；

S201：基于大数据平台作为数据源，从数据源中提取用于配电网诊断分析的预设关键指标信息，从而建立诊断指标集；

具体地，数据源中的数据包括生产业务数据、营销系统的客户档案、电网模型数据、用电数据、业务扩展报表数据、客户投诉数据、计量自动化系统配变数据、调度自动化系统线路出口电流数据、调度自动化系统线路出口电压数据、调度自动化系统线路出口开关状态数据、地理信息系统的配电网模型数据、变电站一次接线图以及其馈线单线图。

同时，生产业务数据包括资产管理系统的设备台帐信息、网架结构信息、配电网故障抢修数据、设备停电数据、供电可靠性能测试数据、设备缺陷数据与线路故障数据。

请参考图3，步骤S201中从数据源中提取用于配电网诊断分析的预设关键指标信息，建立诊断指标集的步骤具体包括：

S2011：采集预设关键指标信息内的样本数据，对样本数据进行预处理，根据预处理后的样本数据建立训练样本，并将预处理后的样本数据转换为适用于数据挖掘形式的样本数据；

S2012：采用主成分分析法对训练样本进行降维处理，得到低纬度的训练样本；

可以理解的是，通过降维处理，可以减少各数据之间的信息冗余，提供后面分类算法的运行效率及准确性。

S2013：基于低纬度的训练样本的特征差异，构建加权支持向量数据的多分类模型；

需要说明的是，在低纬度的训练样本的特征差异中，构建支持向量数据描述模型时的贡献程度，对低纬度的训练样本设置相应的权重值，将低纬度的训练样本和其相应的权重值输入支持向量数据描述模型中，构建加权支持向量数据的多分类模型。

S2014：将适用于数据挖掘形式的样本数据加入至加权支持向量数据的多分类模型内进行训练，通过加权支持向量数据的多分类模型对适用于数据挖掘形式的样本数据进行特征提取，将从适用于数据挖掘形式的样本数据中进行特征提取得到的关键指标信息建立用于分析配电网差异特征的诊断指标集。

需要说明的是，在本实施例中，诊断指标集包括用电客户指标、变压器数量、线路条数和线路长度指标、售电量、电力损耗值、供电质量、业务扩展报装指标与安全水平指标。除此之外，本领域人员可以根据获取符合不同电力企业配电网差异特征的关键指标，建立符合企业本身的诊断指标集。

S301：根据预先获取的多个目标电力企业的发展状态信息，通过聚类算法对发展状态信息进行聚类合并处理，从而筛选出目标簇，目标簇内仅包含孤立点的电力企业，其他簇作为种子样本；

需要说明的是，本实施例中的聚类算法采用k-means算法，k-means算法为聚类合并中常用算法，具有实现简洁、聚类效率较高与可扩展性强的优点，可应用到诸如图像识别、生物学、Web文档分类等领域。

S401：基于KL变换和KL散度的方法对种子样本再进行聚类合并处理，并将聚类合并处理后的种子样本与诊断指标集比对，从而得到配电网中不同目标电力企业的差异特征。

需要说明的是，由于差异诊断所需数据量大，受到多种因素影响，KL变换的参数为随机变量，且其展开的基础取决于过程，更适合用于配电网中不同电力企业差异特征的简化。

同时，通过基于KL散度的改进k-means算法，可较快的确定k值和初始聚类中心，更适用于电力配电网差异特征的提取。

同时，k-means算法关键的步骤是确定聚类个数k和初始聚类中心，初始聚类中心会影响到同一簇内数据点的平均距离d，研究k和d之间的关系如图4所示。

由图中可以看出，当k值较小时，因为聚类数目较少，同一簇内的数据点有的边缘化比较严重，簇内的平均距离d会比较大。随着k值的增大，平均距离d递减的趋势会慢慢趋于平缓，这是因为数据越来越集中的缘故，显得比较紧凑。当k值增大到一定程度后，簇内的平均距离d基本趋于稳定。

基于上述k和d之间的特性，提出如下算法步骤：

(1)k值取1、2、4、6、8、…，通过k-means算法计算相应的d值；

(2)根据下式计算d值的变化趋势；

(3)通过比较Δ

基于二分法，进一步缩小其区间范围，最终可求得k值。

对于初始聚类中心的问题，基于距离度量的特征分类方法，一般采用数据密度进行分析，例如欧式距离或KL散度。一般情况下，同簇内数据点分平均距离k值布比较密集，而离中心点近处的密度比较大，离中心较远处的密度会相对较小。如果某一数据对象附近的数据密度较大，同时其它对象与其距离越小，说明该对象能够较好地反映数据分布特征，比较适合作为初始聚类中心。

S501：通过程序页面呈现配电网中不同目标电力企业的差异特征的诊断结果。

需要说明的是，通过程序页面呈现配电网中不同目标电力企业的差异特征的诊断结果的呈现形式为图形、表格和页面中的一种或多种组合。

进一步地，对样本数据进行预处理，根据预处理后的样本数据建立训练样本，并将预处理后的样本数据转换为适用于数据挖掘形式的样本数据具体包括：

对样本数据中的重复数据和无关数据进行删除处理，并对样本数据中的异常数据和缺失数据进行插补处理；

根据删除处理和插补处理后的样本数据建立训练样本；

对删除处理和插补处理后的样本数据进行维归约处理，通过数据概化的方式对维归约处理后的样本数据转换为适用于数据挖掘形式的样本数据。

需要说明的是，随着电力大数据的快速发展，电力系统的数据呈爆炸式增长，电力系统中所包含的数据量范围广，容量大。

因此，通过维归约处理减少数据的特征数目，摒弃掉不重要特征，尽量使用少数的关键特征来描述数据，之后通过数据概化的方式将维归约处理后的剩余的样本数据转换为适用于数据挖掘的形式。可以对删除处理和插补处理后的数据进行精简，在尽可能保持数据原貌的前提下，通过精简数据量，减少数据交换以及以后的数据挖掘时间。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于电力企业大数据技术的配电网差异特征诊断分析方法 [P] . 中国专利： CN112270622A . 2021-01-26
2. 基于电力企业大数据技术的配电网差异特征诊断分析方法 [P] . 中国专利： CN107133722A . 2017-09-05
3. METHOD OF IDENTIFICATION AND QUANTIFICATION OF PROTEINS, ISOFORMS OF THE ANGIOTENSIN I CONVERTING ENZYME, MOLECULAR GENETIC MARKER BASED ON SAID PROTEINS, USE OF MENTIONED MARKER, ANALYTICAL METHOD FOR DIAGNOSIS, RISK STRATIFICATION, THERAPEUTICAL DECISION IN CARRIERS OF ARTERIAL HYPERTENSION AND RENAL LESION AND KIT FOR USING IN THE DIAGNOSIE [P] . 美国专利： US2010209954A1 . 2010-08-19

机译：蛋白质的鉴定和定量方法，血管紧张素I转化酶的同工型，基于所述蛋白质的分子遗传标记，使用标记的标记，诊断的分析方法，风险分层，治疗目的和诊断目的在诊断中使用
4. Identification of the protein which is iso form of the angiotenshin I conversion enzyme and quantitative method, use of the molecular gene marker and this marker which are based on this protein, the artery hypertension and the kit in order to use diagnosis and the danger in the possession person of kidney lesion stratification, at the time of the analysis method, and diagnosing for remedy decision [P] . 日本专利： JP2006510365A . 2006-03-30

机译：鉴定为血管紧张素I转化酶同工型的蛋白质和定量方法，基于该蛋白质的分子基因标记物和该标记物，动脉高血压和试剂盒的使用，以便在诊断中使用诊断和危险肾损害分层的拥有者，在分析方法时，并诊断出补救决定
5. MEASURING ANALYTICAL METHOD FOR PULSE DIAGNOSIS IN ORIENTAL MEDICINE, MEASURING ANALYTICAL SYSTEM FOR THE SAME, AND SIMPLE AND PORTABLE MEASURING ANALYTICAL DEVICE FOR PULSE DIAGNOSIS USING ARTIFICIAL-INTELLIGENCE [P] . 日本专利： JP2015016268A . 2015-01-29

机译：东方医学中脉冲诊断的测量分析方法，同一系统的测量系统以及基于人工智能的脉冲诊断分析装置的简单便携式测量