技术领域
本发明属于家用电器负荷识别技术领域,涉及一种基于自适应特征选择的非侵入式家电负荷识别方法。
背景技术
随着坚强智能电网和新一轮电力体制改革的持续推进,利用非侵入式负荷监测(NILM)技术充分挖掘用电信息,对用户行为分析、用户与电网的双向实时互动具有理论指导意义。
非侵入式家电负荷识别是面向用户侧的非侵入式负荷监测技术,它的过程可以概括为四步:数据量取、事件检测、特征提取、负荷识别。在事件检测方面,以广义似然比检验(GLR)为代表的概率模型凭借其严谨的数学推导和变点检测的原理被惯用,但同时易出现误判情况,故很有必要对其进行二次判别;在特征提取方面,学者关注较少,通常根据经验主观确定特征类型,而基于最大相关与最小冗余(mRmR)的过滤式特征选择可以充分量化数据自身固有性质,具有通用性和可解释性;在负荷识别方面,研究成果诸多,其中聚类算法以其无监督而备受关注,K-means聚类算法简单快速、易于实现,kNN原理简单,在多分类问题表现效果良好。综上,针对非侵入式家电负荷识别这一问题,基于GLR与快速事件再检验的事件检测、自适应mRmR的特征选择、K-means和kNN的负荷识别亟待提出。
发明内容
本发明的目的是提供一种基于自适应特征选择的非侵入式家电负荷识别方法,解决了现有技术中存在的易出现误判情况的问题,提高识别准确度。
本发明所采用的技术方案是,一种基于自适应特征选择的非侵入式家电负荷识别方法,具体按照以下步骤实施:
步骤1、数据预处理,对选取的REDD数据集进行去噪处理;
步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测,若检测到事件则执行步骤3,否则返回步骤1;
步骤3、对检测到的事件变点,提取多维负荷特征;
步骤4、根据功率进行分段,针对步骤3得到的多维特征,用自适应mRmR算法,分别提取各区段对应特征;
步骤5、将步骤4得到的特征作为负荷印记,通过改进的K-means算法建立负荷特征库;
步骤6、根据步骤5得到的负荷特征库,使用kNN算法对用户内部家电负荷工作状态进行识别。
本发明的特点还在于:
步骤1具体按照以下步骤实施:
步骤1.1、数据集的选取,选择REDD公开数据集做测试,它包含六个家庭三个礼拜左右的数据,表现为15kHz的高频数据和1Hz的秒级低频数据;
步骤1.2、功率信号的去噪处理,由于孤立的噪声点易被事件检测算法错误识别为事件,故选取中值滤波方法,对原始的功率信号进行处理,保证其消除噪声的同时,不改变边缘信息:假设存在一个数字信号序列x
步骤2具体按照以下步骤实施:
步骤2.1、根据公式(1)计算基波有功功率P
式中,V
步骤2.2、在此时间序列内定义两个连续的窗口W
步骤2.3、将g
步骤2.4、以可疑事件点为基点,进行快速事件再检验,即利用相邻检测点之间的差值变化对可疑事件点进行二次判别;根据公式(6)、公式(7)、公式(8)计算n
δ(n
δ(n
步骤3具体按照以下步骤实施:
步骤3.1、提取变点的功率特征,具体有:有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数;
步骤3.2、提取变点处的谐波特征,具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率;电流波形特征,包括其波峰值、平均值、波峰系数;
步骤3.3、提取变点处的V-I轨迹特征,具体有:对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。
步骤4具体按照以下步骤实施:
步骤4.1、根据功率对样本进行分段,在每个功率段内,根据公式(10)计算各特征与样本标签的最大信息系数(MIC)、绝对值余弦(AC),对其根据公式(11)进行整合,再根据公式(12)分别计算各特征与样本标签的相关度D和冗余度R;
式中,I
步骤4.2、建立特征候选集H,选择最大相关度D
步骤4.3、选择H中前i个特征成为特征组H
式中,i=1,…,N代表共有N个特征;
步骤4.4、根据公式(16)计算未被选入HH的特征增益,若ΔD(H
ΔD(H
式中,|X’|为HH的已选特征属性数量,r为特征组增益标记,正为0,负为1,|r|为增益为负的特征组数量;
步骤4.5、在得到各功率区段的特征后,根据公式(18)计算得到各特征权重;
步骤5具体按照以下步骤实施:
步骤5.1、确定K-means初始聚类中心;a、计算整个功率段数据集的平均值
D
式中,k为已选择的聚类中心,ω
步骤5.2、聚类并形成负荷库;计算所有样本x
式中,mean为C’
步骤6具体按照以下步骤实施:
步骤6.1、对于待分类电器x,首先根据公式(23)判断它是否为负荷特征库内的已知电器,如果没有任何簇类满足该不等式,则直接将其归类为新出现的攻击类型,k∈[2,20],选择识别率最高的记为k值;
d(x,C
式中,maxD(C
步骤6.2、根据公式(24)、公式(25)分别计算近邻点的不同距离、不同类别对样本x类别的影响,根据公式(26)对其组合,确定kNN的最终样本权重;
式中,d为待测样本到近邻点的距离,C取0.5,d
步骤6.3、将待测样本进行分类,对同属一类的加权距离进行求和,计算每类样本的加权距离总和与类权重之和的比值,将各个分类的比值进行对比,最大比值对应的类别即为算法的识别结果,其中,加权距离为近邻样本权重Wj与其高斯距离dj的乘积。
本发明的有益效果是:本发明一种基于自适应特征选择的非侵入式家电负荷识别方法,解决了现有技术中存在的易出现误判情况的问题。能有效地减少事件错判、弱相关特征、功率重叠对负荷识别精度的影响。通过基于GLR与快速事件再检验的方法进行事件检测,可以有效减少事件的误判,正确定位变点发生时刻;针对功率重叠问题,通过自适应mRmR算法,在不同功率段的变点提取不同的特征,充分考虑特征与标签的相关性,降低特征冗余,提高识别准确度;在家电负荷识别时,结合不同特征,通过基于K-means和kNN的算法进行负荷识别,原理简单,收敛快速,易于实现,在不同场景下多电器识别中效率高。
附图说明
图1是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的流程图;
图2是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于GLR与二次判别的事件检测流程图;
图3是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于自适应mRmR的特征选择流程图;
图4是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于改进K-means的负荷特征库的流程图;
图5是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于kNN的负荷辨识流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种基于自适应特征选择的非侵入式家电负荷识别方法,如图1所示,具体按照以下步骤实施:
步骤1、数据预处理,对选取的REDD数据集进行去噪处理;
步骤1具体按照以下步骤实施:
步骤1.1、数据集的选取,选择REDD公开数据集做测试,它包含六个家庭三个礼拜左右的数据,表现为15kHz的高频数据和1Hz的秒级低频数据;
步骤1.2、功率信号的去噪处理,由于孤立的噪声点易被事件检测算法错误识别为事件,故选取中值滤波方法,对原始的功率信号进行处理,保证其消除噪声的同时,不改变边缘信息:假设存在一个数字信号序列x
步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测,若检测到事件则执行步骤3,否则返回步骤1;
如图2所示,步骤2具体按照以下步骤实施:
步骤2.1、根据公式(1)计算基波有功功率P
式中,V
步骤2.2、在此时间序列内定义两个连续的窗口W
步骤2.3、将g
步骤2.4、以可疑事件点为基点,进行快速事件再检验,即利用相邻检测点之间的差值变化对可疑事件点进行二次判别;根据公式(6)、公式(7)、公式(8)计算n
δ(n
δ(n
步骤3、对检测到的事件变点,提取多维负荷特征;
步骤3具体按照以下步骤实施:
步骤3.1、提取变点的功率特征,具体有:有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数;
步骤3.2、提取变点处的谐波特征,具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率;电流波形特征,包括其波峰值、平均值、波峰系数;
步骤3.3、提取变点处的V-I轨迹特征,具体有:对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。
部分特征的具体表达如表1所示。
步骤4、根据功率进行分段,针对步骤3得到的多维特征,用自适应mRmR算法,分别提取各区段对应特征;
如图3所示,步骤4具体按照以下步骤实施:
步骤4.1、根据功率对样本进行分段,在每个功率段内,根据公式(10)计算各特征与样本标签的最大信息系数(MIC)、绝对值余弦(AC),对其根据公式(11)进行整合,再根据公式(12)分别计算各特征与样本标签的相关度D和冗余度R;
式中,I
步骤4.2、建立特征候选集H,选择最大相关度D
步骤4.3、选择H中前i个特征成为特征组H
式中,i=1,…,N代表共有N个特征;
步骤4.4、根据公式(16)计算未被选入HH的特征增益,若ΔD(H
ΔD(H
式中,|X’|为HH的已选特征属性数量,r为特征组增益标记,正为0,负为1,|r|为增益为负的特征组数量;
步骤4.5、在得到各功率区段的特征后,根据公式(18)计算得到各特征权重;
步骤5、将步骤4得到的特征作为负荷印记,通过改进的K-means算法建立负荷特征库;
如图4所示,步骤5具体按照以下步骤实施:
步骤5.1、确定K-means初始聚类中心;a、计算整个功率段数据集的平均值
D
式中,k为已选择的聚类中心,ω
步骤5.2、聚类并形成负荷库;计算所有样本x
式中,mean为C’
步骤6、根据步骤5得到的负荷特征库,使用kNN算法对用户内部家电负荷工作状态进行识别。
如图5所示,步骤6具体按照以下步骤实施:
步骤6.1、对于待分类电器x,首先根据公式(23)判断它是否为负荷特征库内的已知电器,如果没有任何簇类满足该不等式,则直接将其归类为新出现的攻击类型,k∈[2,20],选择识别率最高的记为k值;
d(x,C
式中,maxD(C
步骤6.2、根据公式(24)、公式(25)分别计算近邻点的不同距离、不同类别对样本x类别的影响,根据公式(26)对其组合,确定kNN的最终样本权重;
式中,d为待测样本到近邻点的距离,C取0.5,d
步骤6.3、将待测样本进行分类,对同属一类的加权距离进行求和,计算每类样本的加权距离总和与类权重之和的比值,将各个分类的比值进行对比,最大比值对应的类别即为算法的识别结果,其中,加权距离为近邻样本权重Wj与其高斯距离dj的乘积。
本发明一种基于自适应特征选择的非侵入式家电负荷识别方法,解决了现有技术中存在的易出现误判情况的问题。能有效地减少事件错判、弱相关特征、功率重叠对负荷识别精度的影响。通过基于GLR与快速事件再检验的方法进行事件检测,可以有效减少事件的误判,正确定位变点发生时刻;针对功率重叠问题,通过自适应mRmR算法,在不同功率段的变点提取不同的特征,充分考虑特征与标签的相关性,降低特征冗余,提高识别准确度;在家电负荷识别时,结合不同特征,通过基于K-means和kNN的算法进行负荷识别,原理简单,收敛快速,易于实现,在不同场景下多电器识别中效率高。
机译: 非侵入式在线实时电力负荷识别方法及识别系统
机译: 非侵入式在线实时电力负荷识别方法及识别系统
机译: 高阶矩特征的非侵入式负荷功率信号识别方法及系统