首页> 中国专利> 一种确定无源台区线损率的主影响因素的方法及系统

一种确定无源台区线损率的主影响因素的方法及系统

摘要

本发明公开了一种确定无源台区线损率的主影响因素的方法及系统包括:获取多个台区的原始的台区线损特征数据,并进行预处理;根据台区容量对多个经过处理的台区线损特征数据进行分组,并对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇;采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分;确定与每个主成分相关性最强的特征类别为无源台区线损率的主影响因素;确定训练数据集和测试数据集,基于选取的台区线损主要影响因素构建用于确定无源台区线损率的神经网络初始模型,以验证所确定的无源台区线损率主要影响因素的合理性。

著录项

说明书

技术领域

本发明涉及基于机器学习的电力系统数据处理技术领域,并且更具体地,涉及一种确定无源台区线损率的主影响因素的方法及系统。

背景技术

电力系统正常运行时,在发电、输电、配电和用电四个环节上均会产生不同程度的线路损耗,其中线路损耗电量占供电总量的比例即为线损率。作为电网运行过程中的重要指标,线损率的准确计算一直是电力企业的研究重心。低压台区通常指一台变压器低功率测的供电区域,而低压无源台区线损率的准确计算对于电网运行情况的分析至关重要,尤其是对于高损台区及其他线损率异常台区的有效识别起到重要作用。基于上述原因,寻找一种确定无源台区线损率的主影响因素的方法是有研究价值的。目前台区线损的计算方法主要包括台区损耗率法、等值电阻法、牛顿拉普逊法、回归分析法等。由于上述的传统线损率计算方法对于包括网架结构、线路长度、线路阻抗、实抄电量等相关数据过于依赖,且难以考虑到更加复杂的线损率影响因素,如居民用电比例等因素,因此根据实际情况,在现有低压无源台区统计数据的基础上进行筛选与分析。

因此,需要研究一种确定对无源台区线损率的主影响因素的方法。

发明内容

本发明提出一种确定无源台区线损率的主影响因素的方法及系统,以解决低压无源台区线损率难以准确计算的问题。

为了解决上述问题,根据本发明的一个方面,提供了一种确定无源台区线损率的主影响因素的方法,所述方法包括:

获取多个台区的原始的台区线损特征数据,并对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据;

根据台区容量对多个经过处理的台区线损特征数据进行分组,并对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇;

采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分;

确定与每个主成分相关性最强的特征类别为无源台区线损率的主影响因素;

基于每个经过处理的台区线损特征数据对应的簇,确定训练数据集和测试数据集,构建基于台区线损特征数据的用于确定无源台区线损率的神经网络初始模型,并根据所述训练数据集和测试数据集对所述用于确定无源台区线损率的神经网络初始模型进行训练和测试,以获取用于确定无源台区线损率的神经网络优化模型,以准确计算无源台区线损率,并对所确定的无源台区线损率主影响因素的合理性进行验证;

优选地,其中所述台区线损特征数据对应的特征类别,包括:台区居民用户比例、功率因数、负载率、三相不平衡度和最大负荷。

优选地,其中所述对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据,包括:

其中,n为台区总数,z

优选地,其中利用Mean-shift算法对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇。

优选地,其中所述采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分,包括:

利用如下公式根据经过处理的台区线损特征数据计算相关系数矩阵,包括:

其中,m为原始特征数,R为m行m列的相关系数矩阵,r

根据所述相关系数矩阵,利用如下公式计算特征值与特征向量,包括:

|R-λE|=0,

(R-λ

其中,λ为相关系数矩阵R的特征值,E为单位矩阵,λ

利用如下公式计算每个成分的信息贡献率b

其中,b

对所述贡献率进行降序排列,根据降序结果依次进行累加,并选取累计贡献率大于等于预设的累计贡献率阈值时的前预设个数a的成分为主成分;

将主成分对应的前a个特征向量u

U=[u

其中,u

优选地,其中确定与每个主成分相关性最强的特征类别为无源台区线损率的主影响因素,并将主影响因素作为BP神经网络输入样本的特征,进行训练与测试,若测试的线损偏差满足要求则说明主影响因素选取合适,若不满足要求,则增大主成分个数进而增加主影响因素个数,基于新确定的主影响因素重新构建BP神经网络并对所确定的影响因素是否满足要求进行验证。

根据本发明的另一个方面,提供了一种确定无源台区线损率的主影响因素的系统,所述系统包括:

台区线损特征数据处理单元,用于获取多个台区的原始的台区线损特征数据,并对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据;

聚类处理单元,用于根据台区容量对多个经过处理的台区线损特征数据进行分组,并对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇;

主成分确定单元,用于采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分;

主影响因素确定单元,用于确定与每个主成分相关性最强的特征类别为无源台区线损率的主影响因素;

神经网络模型获取单元,用于基于每个经过处理的台区线损特征数据对应的簇,确定训练数据集和测试数据集,构建基于台区线损特征数据的用于确定无源台区线损率的神经网络初始模型,并根据所述训练数据集和测试数据集对所述用于确定无源台区线损率的神经网络初始模型进行训练和测试,以获取用于确定无源台区线损率的神经网络优化模型,以准确计算无源台区线损率,并对所确定的无源台区线损率主影响因素的合理性进行验证;

优选地,其中所述台区线损特征数据对应的特征类别,包括:台区居民用户比例、功率因数、负载率、三相不平衡度和最大负荷。

优选地,其中所述台区线损特征数据处理单元,对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据,包括:

其中,n为台区总数,z

优选地,其中所述聚类处理单元,利用Mean-shift算法对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇。

优选地,其中所述主成分确定单元,采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分,包括:

利用如下公式根据经过处理的台区线损特征数据计算相关系数矩阵,包括:

其中,m为原始特征数,R为m行m列的相关系数矩阵,r

根据所述相关系数矩阵,利用如下公式计算特征值与特征向量,包括:

|R-λE|=0,

(R-λ

其中,λ为相关系数矩阵R的特征值,E为单位矩阵,λ

利用如下公式计算每个成分的信息贡献率b

其中,b

对所述贡献率进行降序排列,根据降序结果依次进行累加,并选取累计贡献率大于等于预设的累计贡献率阈值时的前预设个数a的成分为主成分;

将主成分对应的前a个特征向量u

U=[u

其中,u

优选地,其中确定与每个主成分相关性最强的特征类别为无源台区线损率的主影响因素,并将主影响因素作为BP神经网络输入样本的特征,进行训练与测试,若测试的线损偏差满足要求则说明主影响因素选取合适,若不满足要求,则增大主成分个数进而增加主影响因素个数,基于新确定的主影响因素重新构建BP神经网络并对所确定的影响因素是否满足要求进行验证。

本发明提供了一种确定无源台区线损率的主影响因素的方法及系统,在充分考虑到台区居民用户比例、功率因数、负载率、三相不平衡度和最大负荷的影响,并从上述因素提取特征数据,经过预处理和Mean-shift聚类后,通过主成分分析法对原始数据进行降维,找出对线损率起到主要影响作用的特征类别作为主要影响因素,将主要影响因素作为输入样本的特征来训练BP神经网络模型计算无源台区线损率,为提升台区的管理水平与运行效率提供了科学依据和数据支撑。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为根据本发明实施方式的确定无源台区线损率的主影响因素的方法100的流程图;

图2为根据本发明实施方式的确定主影响因素的流程图;

图3为根据本发明实施方式的神经网络模型的架构图;

图4为根据本发明实施方式的台区线损率的对比图;

图5为根据本发明实施方式的确定无源台区线损率的主影响因素的系统500的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

图1为根据本发明实施方式的确定无源台区线损率的主影响因素的方法100的流程图。如图1所示,本发明实施方式提供的确定无源台区线损率的主影响因素的方法,在充分考虑到台区居民用户比例、功率因数、负载率、三相不平衡度和最大负荷对于线损率的影响,并从上述因素提取特征数据,经过预处理和Mean-shift聚类后,通过主成分分析法对原始数据进行降维,找出对线损率起到主要影响作用的特征数据类别作为输入样本来训练BP神经网络模型,为提升台区的管理水平与运行效率提供了科学依据和数据支撑。本发明实施方式提供的确定无源台区线损率的主影响因素的方法100,从步骤101处开始,在步骤101获取多个台区的原始的台区线损特征数据,并对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据。

优选地,其中所述台区线损特征数据对应的特征类别,包括:台区居民用户比例、功率因数、负载率、三相不平衡度和最大负荷。

优选地,其中所述对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据,包括:

其中,n为台区总数,z

本发明实施方式的确定无源台区线损率的主影响因素的方法,通过分析低压无源台区运行情况,提取了5类影响因子作为计算线损率的特征数据。通过预处理将数据整理成标准化形式并通过Mean-shift算法聚类,采用BP神经网络模型计算无源台区线损率,并确定主影响因素。

结合图2所示,在本发明的实施方式中,首先,获取台区居民用户比例、功率因数、负载率、三相不平衡度和最大负荷;

其中,各参数可以表示为:

a)台区居民用户比例P:

其中,m为台区居民用户数,n为台区总户数。

b)负载率β:

其中,W为日用电总量,S

c)三相不平衡度ε:

其中,I

然后,将提取到的低压无源台区特征数据进行标准化处理,获取经过处理的台区线损特征数据,以消除单位以及取值范围的影响。假设共有n个样本,对于任一种特征数据,利用如下公式将其整理成标准化的形式,包括:计算出特征数据的平均值

计算出标准化的无源台区特征数据z

其中,n为台区总数,z

在步骤102,根据台区容量对多个经过处理的台区线损特征数据进行分组,并对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇。

优选地,其中利用Mean-shift算法对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇。

在本发明的所述方式中,采用Mean-shift算法对相同台区容量的无源台区特征数据进行聚类,具体计算过程如下:

1)在未被标记的特征数据样本中随机选出一个样本作为聚类的中心点o,并设定聚类半径h和阈值ε

2)将距离聚类中心距离小于h的点归类到H中,并将H中的点的访问次数加1;

3)计算中心点o到H中所有点的向量和d;

4)当|d|>ε

5)当|d|≤ε

6)重复1)-5),直到所有样本点都已经被标记过。此时,统计每个样本的访问次数,将该样本分配到被访问次数最多的类。

在步骤103,采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分。

在本发明的实施方式中,采用主成分分析法处理特征数据,具体计算过程如下:

a)首先对原始数据进行标准化处理,在这里直接采用步骤1中经过预处理得到的标准化数据z

b)计算相关系数矩阵R:

c)计算相关系数矩阵R的特征值λ,并根据|R-λE|=0求出对应的n个单位特征向量u

d)分析各成分的信息贡献率b

其中,j=1,2,…,n,将信息贡献由贡献率b

在步骤104,确定与每个主成分相关性最强的原始特征为无源台区线损率的主影响因素。

在本发明的实施方式中,选出的主成分及对应的相关系数矩阵R中的元素,找出对主成分起最大载荷的特征数据类别作为对无源台区线损率的主要影响因素。

在步骤105,基于每个经过处理的台区线损特征数据对应的簇,确定训练数据集和测试数据集,构建基于台区线损主要影响因素的用于确定无源台区线损率的神经网络初始模型,并根据所述训练数据集和测试数据集对所述用于确定无源台区线损率的神经网络初始模型进行训练和测试,以获取用于确定无源台区线损率的神经网络优化模型,根据神经网络模型计算结果对所确定的无源台区线损率主影响因素进行验证。

将主影响因素作为BP神经网络输入样本的特征,并根据训练数据集和测试数据集对所述用于确定无源台区线损率的神经网络初始模型进行训练和测试,以获取用于确定无源台区线损率的神经网络优化模型,包括。

在本发明的实施方式中,建立基于无源台区特征数据驱动的BP神经网络模型的过程如下:

a)通过主要影响因素特征数据和无源台区线损率作为样本,随机选择出1000个样本作为训练集,并随机选出100个样本作为测试集;

b)采用训练集创建基于无源台区特征数据驱动的BP神经网络无源台区线损率计算模型;

c)将测试集输入到模型中,将计算得到的线损率与实际线损率进行比较,计算相对误差,验证模型计算准确性及所确定的无源台区线损率主影响因素的合理性。

本发明实施方式的神经网络结构如图3所示。BP神经网络模型由输入层、隐含层和输出层三部分组成。确定神经网络模型的过程包括:

1)首先设定误差函数、计算精度与最大学习次数;

2)对各链接处的网络权值w

3)随机选出一个样本对作为训练集,输入为X,共有m个特征,对应的期望输出为Y,共有n个输出;

4)计算出隐藏层和输出层神经元的输出:

其中,j=1,2,…,l,k=1,2,…,n,l为隐含层神经元个数,n为输出层神经元个数,m为特征数,

计算出BP神经网络输出与期望输出的误差:

其中,y

6)将误差函数分别对输出层和隐含层的权值求偏导数

7)通过各神经元的偏导数来修正网络权值;

其中,η为学习步长,w为网络权值,δ

8)判断相对误差是否满足要求,当符合精度要求时,计算结束;否则重新确定主成分及线损率主影响因素,并基于新确定的主影响因素再次构建BP神经网络模型。

为验证本发明中方法的有效性,以浙江某容量为315KVA的低压无源台区为建模对象,选取如下特征:台区居民用户比例、功率因数、负载率、三相不平衡度和最大负荷,采用BP神经网络算法计算出的无源台区线损率与实际线损率计算结果如图4所示,相对误差为16.67%,符合研究需要。

对数据采用主成分分析方法进行降维,按照贡献率提取主成分,贡献率与相关系数矩阵元素如表1所示:

表1主成分分析结果

通过分析可知,前3个主成分累计贡献率为85.7%,因此可作为原始特征数据降维处理的结果。比较可知,在主成分1中,最大负荷具有最大正载荷,其他变量的载荷较小,因此主成分1可视为最大负荷成分。同理,主成分2和主成分3可分别视为三相不平衡度成分和负载率成分。因此可以认为对线损率影响最大的特征数据类别为最大负荷、三相不平衡度和负载率,能够为台区线损率分析计算提供指导作用。

图5为根据本发明实施方式的确定无源台区线损率的主影响因素的系统500的结构示意图。如图5所示,本发明实施方式提供的确定无源台区线损率的主影响因素的系统500,包括:台区线损特征数据处理单元501、聚类处理单元502、主成分确定单元503、主影响因素确定单元504和神经网络模型获取单元505。

优选地,所述台区线损特征数据处理单元501,用于获取多个台区的原始的台区线损特征数据,并对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据。

优选地,其中所述台区线损特征数据对应的特征类别,包括:台区居民用户比例、居民用户数、功率因数、台区容量、负载率、三相不平衡度和最大负荷。

优选地,其中所述台区线损特征数据处理单元501,对所述每个原始的台区线损特征数据进行预处理,以获取多个经过处理的台区线损特征数据,包括:

其中,n为台区总数,z

优选地,所述聚类处理单元502,用于根据台区容量对多个经过处理的台区线损特征数据进行分组,并对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇。

优选地,其中所述聚类处理单元502,利用Mean-shift算法对每组的经过处理的台区线损特征数据进行聚类处理,确定每个经过处理的台区线损特征数据对应的簇。

优选地,所述主成分确定单元503,用于采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分。

优选地,其中所述主成分确定单元503,采用主成分分析法对经过处理的台区线损特征数据进行降维处理,并根据各成分的贡献率确定至少一个主成分,包括:

利用如下公式根据经过处理的台区线损特征数据计算相关系数矩阵,包括:

其中,m为原始特征数,R为m行m列的相关系数矩阵,r

根据所述相关系数矩阵,利用如下公式计算特征值与特征向量,包括:

|R-λE|=0,

(R-λ

其中,λ为相关系数矩阵R的特征值,E为单位矩阵,λ

利用如下公式计算每个成分的信息贡献率b

其中,b

对所述贡献率进行降序排列,根据降序结果依次进行累加,并选取累计贡献率大于等于预设的累计贡献率阈值时的前预设个数a的成分为主成分;

将主成分对应的前a个特征向量u

U=[u

Y=UZ,

其中,u

优选地,所述主影响因素确定单元504,用于确定与每个主成分相关性最强的特征类别为无源台区线损率的主影响因素。

优选地,所述神经网络模型获取单元505,用于基于每个经过处理的台区线损特征数据对应的簇,确定训练数据集和测试数据集,构建基于台区线损特征数据的用于确定无源台区线损率的神经网络初始模型,并根据所述训练数据集和测试数据集对所述用于确定无源台区线损率的神经网络初始模型进行训练和测试,以准确计算无源台区线损率,并对所确定的无源台区线损率主影响因素进行验证。

已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号