法律状态公告日
法律状态信息
法律状态
2022-07-22
公开
发明专利申请公布
技术领域
本发明属于异常用电识别领域,具体为一种基于煤改电用电数据的安全负荷辨识方法,应用于对煤改电用户进行安全负荷的辨识,进行异常用电的识别。
背景技术
为贯彻落实国家大气污染防治行动计划,现在各个省、各个市都在积极响应。而其中的“煤改电”是非常重要的一项改革形式。自2016年以来,山西省太原市在积极开展“煤改电”工程,全面推进“煤改电”的改革进程,并且取得了重大的突破。根据太原市统计,截止到2017年年底,“煤改电”用于已经达到了18000 户。而随着“煤改电”用户的增多,异常用电的情况也在逐渐增多。本发明的实际意义就是建立一个能够识别异常用电的系统,优化“煤改电”情况下的用电环境,实现负荷的安全运行。
利用、积累电网存在的大量用电数据集进行用户侧的漏电、窃电等异常用电行为的分析对于电网的正常运行,以及用户侧的用电安全有着重要的意义。再加上在“煤改电”这样一个新的用电环境之下,由于从发电到用电采暖整个过程还不是很完善,所以异常用电的情况也会比传统用电、传统采暖多。
发明内容
本发明的主要目的是通过对“煤改电”用户的用电数据进行研究,通过建立异常用电识别模型来对用户的用电进行安全负荷的监测。该异常用电识别模型可通过在电网监测到的用电数据,通过简单的数据处理,然后将处理的数据传输到异常用电识别模型,对数据进行识别,从而判断出该用户的是否为异常用电。
本发明是采用如下的技术方案实现的:一种基于煤改电用电数据的安全负荷辨识方法,包括以下步骤:
在电网中提取原始用电数据并对原始用电数据进行预处理;
预处理后的部分原始用电数据进行异常化处理,得到异常用电数据,剩余原始用电数据为正常用电数据;
正常用电数据和异常用电数据进行特征提取;
基于神经网络建立异常用电识别模型,将上述提取的特征输入到异常用电识别模型对模型进行训练,训练完成后的异常用电识别模型便可用于异常用电数据识别。
上述的一种基于煤改电用电数据的安全负荷辨识方法,对部分原始用电数据按以下四种情况进行异常化处理:一日内所有数据乘以相同的随机数,即数据按固定比例减少;一日内的每个时间段内的数据乘以不同的随机数,即每天有不同比例的减少;一日内的平均值乘以一个随机因子;智能电表在某日的某一时间段内给计量平台发送是用电量为0,即表示智能电表出现故障而无法向计量平台发送数据。
上述的一种基于煤改电用电数据的安全负荷辨识方法,用电数据具体为电能量。
上述的一种基于煤改电用电数据的安全负荷辨识方法,提取的特征包括均值、极差、标准差、变异系数、偏度和峰度。
上述的一种基于煤改电用电数据的安全负荷辨识方法,利用遗传算法对神经网络参数优化。
本发明具有以下优点:
(1)在“煤改电”的用电环境下建立异常用电识别模型可以优化“煤改电”的用电环境,更是为了电力系统能够正常的运行。
(2)利用用电数据的数学特征(均值、极差、标准差、变异系数、偏度和峰度)作为异常用电识别的特征可以免受用电数据内在联系的影响,而直接反映用电数据之间直接的关系。
(3)利用BP神经网络算法作为异常用电识别模型的基础。并且,用遗传算法优化神经网络的阈值和权值参数可以提高系统的识别速度,识别的精确度。
附图说明
图1为本发明流程图。
具体实施方式
一种基于煤改电用电数据的安全负荷辨识方法,具体包括如下步骤:
(1)原始用电数据的提取、预处理
通过对太原市电网公司的调查,可以得知,用户的用电数据是以 15min为最小单位采集的,主要是电流、电压、功率以及电能量的用电数据,本发明选用电能量。本发明以太原市某些地区的用电数据为依据进行分析。由于原始数据在一定程度上存在人为因素和外部环境的影响,数据会存在缺失、重复等问题,删除原始数据中缺失、重复的数据。
原始用电数据预处理后,假设共有N户,每一户的数据记录D天,则每一个用户用电数据可以有如下表示:
x
式中:x
(2)异常用电数据的处理
通过对用电数据的分析可以得知:正常用电数据数据的样本较易获得,而异常用电数据数据的样本很少。通过文献的查询可以得知任何异常用电的行为都不是随机产生的,而是存在一定的规律性。所以利用所查阅到的异常数据的生成规律,组建出一个异常用电数据库。通过总结,大致分为以下六种异常用电的行为,用以下六种异常数据生成函数来表示:
式中:α、β、γ为0-0.8的随机数,mean()表示取平均数。这6种异常数据计算的解释为:h
(3)特征提取
正常用电数据和异常用电数据较为简单,也不能直接作为模型的输入进行异常用电识别。所以,如果直接将用电数据直接代入模型,可能会使得模型识别率较低,不能达到要求。
本发明所选取的是数学特征,如最大值、最小值、均值、方差等指标来进行表示。
①均值
均值表示了一个数据集的平均大小,即用户一天的用电量,具体表示如下所示:
②极差
极差表示了一个数据集的变异量数,具体表示如下:x
③标准差
标准差表示了一个数据集中每个数据之间的离散程度,具体表示如下:
④变异系数
变异系数表示了一个数据集中的标准差相对于均值的离中程度,具体表示如下:
⑤偏度
偏度反映了一个数据集数据分布的对称情况,具体表示如下:
⑥峰度
峰度反映了一个数据集中的数据分布形态的陡缓程度,具体表示如下:
将正常用电数据和异常用电数据处理为以上六种特征的数据之后,在进行数据的归一化处理之后,即可作为模型的输入,进行使用。
(4)模型建立
基于BP神经网络的异常用电识别模型的建立
神经网络发展到今天为止,已相当成熟,具有着学习能力强、能够并行处理、容错性高,提取特征较明显等特征。在异常用电的检测这方面,神经网络可以从先做负荷预测,再进行判断和神经网络直接进行分类预测两个方向进行。本发明用直接进行分类预测这个方面进行研究。
具体步骤如下:
①输入输出的归一化:
由于如果数据的范围过大,可能会影响神经网络的收敛情况,甚至可能造成数据不收敛的情况,所以,先把数据进行归一化处理。
②神经网络层数设计:
神经网络的层数决定了神经网络计算的复杂程度,针对本发明,3 层即可达到要求。
③隐含层节点数的选择:
隐含层的节点数决定了神经网络的收敛性。太多容易使神经网络陷入局部最小值,太少可能会造成神经网络不收敛。通过文献查阅,可用以下公式算出的结果作为参考:
h
h
式中:h
④传输函数的选取:
本发明选择Sigmoid函数作为传输函数。优点是非线性能力和可微性比较强,并且具有中间变化大、两端变化小,曲线平坦的优点。
基于遗传算法的神经网络参数优化
因为遗传算法优化的是神经网络的阈值和权值。所以,只要是神经网络的结构确定,则遗传算法所要优化的阈值和权值的个数就能够确定。由于神经网络的初始参数对于网络训练的影响非常大,引入遗传算法就是为了寻求最优的初始阈值和权值。遗传算法的优势是能够全局搜索、寻优可以并行、搜索效率高,并且遗传算法在搜索过程中自动获取和积累有关搜索空间的知识,能够自适应的控制搜索过程,从而最快地寻求到最优解。
其参数的优化过程如下:
①将待优化的阈值和权值进行初始化,然后对其进行编码,使其演变为染色体序列。
②确定遗传算法中的适应度函数,利用预测与验证数据之间方均根的差作为个体适应度的值。
③对遗传算法中的p
④以概率p
⑤以概率p
⑥计算个体适应度的值,若达到适应度的值,则跳出循环;若未达到,则跳到⑤继续原来的步骤。
⑦输出遗传算法的最优解,将其解码,得到的值作为神经网络的初始阈值和权值。
模型建立具体流程:通过电网的云端提取要调查用户的电能量数据,将数据导出之后,将数据进行原始数据到输入数据的转化。然后将数据输入到异常用电识别模型当中去,经过异常用电识别模型的识别,得出结果。最后将结果传输到可视化界面。
在建立异常用电识别模型的时候,本发明采用的是GA-BP的模型。 BP神经网络的优势是具有优异的特征学习能力,而且对所学习的特征有最本质的刻画,从而有利于模型的可视化和分类。但是,由于在神经网络中采用的是梯度下降法,此种方法无法避免收敛速度慢、容易收敛到局部最小值等问题,并且在神经网络中的阈值、权值以及隐含层的节点数通常取决于经验,所以容易收到主观因素的影响。而遗传算法由于它的进化特性,在搜索的过程当中与数据的内在性质无关,对于线性、非线性、离散、连续等能够直接处理。遗传算法优化一个最大的特点是收敛性好、鲁棒性高,而且具有良好的全局搜索能力。
本发明基于BP神经网络,首先利用GA对神经网络的初始阈值和权值进行优化处理,得到最佳的阈值和权值之后,在利用神经网络对样本进行学习、预测。遗传优化的BP神经网络的精度有显著提高,模型在异常用电的识别领域具有应用价值。
机译: 一种用于安全数据传输的基于密码的认证和会话密钥协议的方法,一种用于安全地传输数据的方法以及一种电子数据传输系统
机译: 一种用于安全数据传输的基于密码的认证和会话密钥协议的方法,一种用于安全地传输数据的方法以及一种电子数据传输系统
机译: 本申请支持交换层安全传输的数据处理方法和交换设备,于2010年12月20日提交给中国专利局,申请号为201010596665.5,发明名称支持“链路层安全传输,本申请要求基于中国专利申请是一种“数据处理方法”和“将设备切换到”,并通过公开内容整体并入本文。