公开/公告号CN112183604A
专利类型发明专利
公开/公告日2021-01-05
原文格式PDF
申请/专利号CN202011005064.2
申请日2020-09-22
分类号G06K9/62(20060101);G06Q50/06(20120101);
代理机构11689 北京智绘未来专利代理事务所(普通合伙);
代理人肖继军;王萍
地址 210019 江苏省南京市建邺区奥体大街9号
入库时间 2023-06-19 09:26:02
技术领域
本发明属于电能计量装置选型技术领域,涉及一种基于决策树的电能计量装置选型方法和系统。
背景技术
随着电力科技的发展与进步,电能计量装置正向着智能化、网络化、标准化、数字化、信息化和系统化方向迈进。电能计量装置是维护发电、供电、用电三方的稳定,便于发电、供电、用电三方的销售和买卖,在三方的联系中担任着重要的角色,合理配置电能计量装置是电网工作人员的重要工作之一。
目前电能计量装置的配置选型工作大部分由人工完成,不仅耗费大量人力,这也导致了选型过程中存在大量不可避免的主观因素,使得在装置规格选择中产生一定的误差。另一方面,电能计量装置的设计越来越繁复,给一线接线工作人员的工作增加了更大的难度,接线错误现象频繁发生,这也是近年来导致电能计量装置出现电能计量故障的主要因素。故而必须采用科学合理的方式,有效减小误差,提高准确度,才能促进电力企业的经济效益的提高,增加市场竞争力。
近年来随着电网自动化技术的发展,电能计量装置的选型方法也逐渐多样化,层次分析法、粗糙集数学方法、基于逻辑链路控制的决策分析法等都取得了一定的成果,但其智能性,通用性水平不高,离实用化具有一定的距离。
发明内容
为解决现有技术中的不足,本申请提供一种基于决策树的电能计量装置选型方法和系统,针对用户在各种不同应用和场景下进行电能计量装置选型配置的问题,基于决策树,可以降低人工选型的成本,实现装置规格精细化,满足用户的搜索需求,从而大大提高电能计量装置的选型效率。
为了实现上述目标,本发明采用如下技术方案:
一种基于决策树的电能计量装置选型方法,其特征在于:
所述方法包括以下步骤:
步骤1:根据电能计量装置选型参数数据,得到训练样本集S和测试样本集;
步骤2:计算训练样本集S中所有选型参数的信息增益率;
步骤3:根据步骤2计算得到的信息增益率,构建电能计量装置选型决策树模型;
步骤4:分别基于训练样本集S和测试样本集,对步骤3构建的选型决策树模型进行修正;
步骤5:使用步骤4修正后的电能计量装置选型决策树模型进行电能计量装置选型。
本发明进一步包括以下优选方案:
优选地,所述步骤1具体为:
从电能计量装置数据库中获取选型参数数据,将选型参数数据转换为调用决策树算法所需的数据样式,构成样本集;
将样本集划分为训练样本集S和测试样本集;
所述选型参数包括计量装置类型,计量方式,接线方式,电压等级,电能表精度,电压互感器精度,电流互感器精度,电流互感器变比。
优选地,所述步骤2具体为:
根据训练样本集S中的选型参数数据,构成选型参数集A={A
将训练样本集S按照选型参数A
将训练样本集S中的样本按信息量I(S)分类后得到
则训练样本集S中选型参数A
其中,Split(A
G(A
G(A
E(A
I(S)为选型参数A
p
优选地,步骤3包括以下步骤:
步骤3.1:选取步骤2计算得到的最大信息增益率对应的选型参数作为测试选型参数,建立选型决策树模型的根节点,从而将训练样本集S分为若干数据子集;
步骤3.2:令N的初始值为1,N为节点层数,随着决策树的不断构建而增加;
步骤3.3:根据第N层节点测试选型参数对应的分割点确定位于第N+1层的数据子集,将第N+1层的数据子集中信息增益率最大的选型参数A
所述分割点即为决策树在该层采用的特征属性;
步骤3.4:判断位于第N+1层的数据子集是否存在可分割的选型参数,若存在,则令N的值自增1,返回执行步骤3.3,若不存在则生成选型决策树模型;
其中,数据子集的特征属性不完全相同即表示存在可分割的选型参数。
优选地,所述步骤3还包括:
步骤3.5:利用剪枝算法对生成的选型决策树模型进行剪枝。
优选地,所述步骤4具体包括:
使用测试样本集,结合专家经验对选型决策树模型进行修正;
对训练数据集进行更新,重新执行步骤2和步骤3,训练电能计量装置选型决策树模型,以提高选型决策树模型的精度。
优选地,所述使用测试样本集,结合专家经验对选型决策树模型进行修正,具体为:
先按照电压等级这一特征参数的不同,将样本集划分成数个小样本集,在各个小样本集之下修正选型决策树模型。
优选地,所述对训练数据集进行更新,重新执行步骤2和步骤3,训练电能计量装置选型决策树模型,以提高选型决策树模型的精度,具体包括以下步骤:
设有m个样本的数据集
设待添加的数据样本为
则通过样本与样本之间的距离l=(S
其中训练样本集S中的中心样本为
设定相似度阈值ξ,若
优选地,所述步骤5包括以下步骤:
步骤5.1:使用步骤4修正后的电能计量装置选型决策树模型进行电能计量装置选型,并将选型结果与目标结果相比较,得到误差e;
步骤5.2:设置选型结果与目标结果的误差允许范围,当误差e在所设置的误差允许范围内时,选型结果被判断为可以接受,输出选型结果;
当误差e不在所设置的误差允许范围内时,重新修正选型决策树模型,再返回步骤5.1进行选型并计算误差,直到得到的误差在误差允许的范围内,输出最终的选型结果。
本发明还公开了一种基于上述的基于决策树的电能计量装置选型方法的电能计量装置选型系统,所述系统包括:
样本集模块,用于根据电能计量装置选型参数数据,得到训练样本集S和测试样本集;
计算模块,用于计算训练样本集S中所有选型参数的信息增益率;
构建模块,用于根据计算模块计算得到的信息增益率,构建电能计量装置选型决策树模型;
修正模块,用于分别基于训练样本集S和测试样本集,对构建模块构建的选型决策树模型进行修正;
选型模块,用于使用修正模块修正后的电能计量装置选型决策树模型进行电能计量装置选型。
本申请所达到的有益效果:
本申请利用决策树算法得到电能计量装置选型参数之间的定量关系,再与修正策略相结合,对初步的选型结果进行修正,来进行电能计量装置的选型。可以实现电能计量装置的自动选型,大大提高电网用户选择电能计量装置的智能型和通用性,较少误差,提高效率。
附图说明
图1是本申请一种基于决策树的电能计量装置选型方法逻辑图;
图2是本申请一种基于决策树的电能计量装置选型方法流程图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
如图1和2所示,本申请的一种基于决策树的电能计量装置选型方法,包括以下步骤:
步骤1:根据电能计量装置选型参数数据,得到训练样本集S和测试样本集;具体为:
从电能计量装置数据库中获取选型参数数据,将选型参数数据转换为调用决策树算法所需的数据样式,由于各选型参数类别间不具有大小关系,可以将其分割成数个小特征进行处理,然后构成样本集;
将样本集划分为训练样本集S和测试样本集;
所述选型参数包括计量装置类型,计量方式,接线方式,电压等级,电能表精度,电压互感器精度,电流互感器精度,电流互感器变比。例如计量装置类型,一共有5个取值(I型,II型,III型,IV型,V型),分割成5个特征(计量装置类型—I,计量装置类型—II,计量装置类型—III,计量装置类型—IV,计量装置类型—V),如果计量装置为I型,则特征“计量装置类型—I”的参数值为1,在特征“计量装置类型—II”,“计量装置类型—III”,“计量装置类型—IV”和“计量装置类型—V”下的参数值为0。计量方式,接线方式,电压等级这三个特征同计量装置类型一样进行处理。电能表精度,电压互感器精度,电流互感器精度,电流互感器变比不做处理。
步骤2:计算训练样本集S中所有选型参数的信息增益率,具体为:
根据训练样本集S中的选型参数数据,构成选型参数集A={A
将训练样本集S按照选型参数A
将训练样本集S中的样本按信息量I(S)分类后得到
则训练样本集S中选型参数A
其中,Split(A
G(A
G(A
E(A
I(S)为选型参数A
p
步骤3:根据步骤2计算得到的信息增益率,构建电能计量装置选型决策树模型,即调用决策树算法,根据步骤2计算得到的信息增益率确定根节点,按照选型参数的不同取值建立分支,各个分支节点根据划分后的样本数据,如果还包含不同类别的数据,则需要按照该分支下样本数据的选型参数重新计算信息增益率,执行步骤2,建立决策树各节点的分支,直到所有子集只包含同一类别的数据为止,建立电能计量装置选型决策树模型的选型模型。
包括以下步骤:
步骤3.1:选取步骤2计算得到的最大信息增益率对应的选型参数作为测试选型参数,建立选型决策树模型的根节点,从而将训练样本集S分为若干数据子集;
步骤3.2:令N的初始值为1,N为节点层数,随着决策树的不断构建而增加;
步骤3.3:根据第N层节点测试选型参数对应的分割点确定位于第N+1层的数据子集,将第N+1层的数据子集中信息增益率最大的选型参数A
所述分割点即为决策树在该层采用的特征属性;
步骤3.4:判断位于第N+1层的数据子集是否存在可分割的选型参数,若存在,则令N的值自增1,返回执行步骤3.3,若不存在则生成选型决策树模型;
其中,数据子集的特征属性不完全相同即表示存在可分割的选型参数。
步骤4:分别基于训练样本集S和测试样本集,对步骤3构建的选型决策树模型进行修正;具体包括:
使用测试样本集,结合专家经验对选型决策树模型进行修正,具体为:
考虑到具体选型过程中,电压等级这一特征极其重要,而由于样本存在一定的噪音,导致计量装置类型这一特征的影响力大于电压等级这一特征,不符合实际情况,故先按照电压等级这一特征参数的不同,将样本集划分成数个小样本集,在各个小样本集之下执行上述步骤,修正选型决策树模型。
不定期地对训练数据集进行更新,重新执行步骤2和步骤3,训练电能计量装置选型决策树模型,以提高选型决策树模型的精度,可以选择一些数据库中没有的典型样本加入训练数据集中,具体包括以下步骤:
设有m个样本的数据集
设待添加的数据样本为
则通过样本与样本之间的距离l=(S
其中训练样本集S中的中心样本为
设定相似度阈值ξ,若
步骤5:使用步骤4修正后的电能计量装置选型决策树模型进行电能计量装置选型,包括以下步骤:
步骤5.1:使用步骤4修正后的电能计量装置选型决策树模型进行电能计量装置选型,并将选型结果与目标结果相比较,得到误差e;
例如通过决策树,得到的选型结果为准确率87.3%,假如目标结果要求准确率为95%,误差允许的范围为±3%(由电力行业专家确定),误差e=95%-87.3%=7.7%>3%,则表明不可接受,需要重新修正决策树模型。
步骤5.2:根据实际问题的要求设置选型结果与目标结果的误差允许范围,当误差e在所设置的误差允许范围内时,选型结果被判断为可以接受,输出选型结果;
当误差e不在所设置的误差允许范围内时,重新修正选型决策树模型,再返回步骤5.1进行选型并计算误差,重复上述过程直到得到的误差在误差允许的范围内,输出最终的选型结果。
本申请的一种基于上述的基于决策树的电能计量装置选型方法的电能计量装置选型系统,所述系统包括:
样本集模块,用于根据电能计量装置选型参数数据,得到训练样本集S和测试样本集;
计算模块,用于计算训练样本集S中所有选型参数的信息增益率;
构建模块,用于根据计算模块计算得到的信息增益率,构建电能计量装置选型决策树模型;
修正模块,用于分别基于训练样本集S和测试样本集,对构建模块构建的选型决策树模型进行修正;
选型模块,用于使用修正模块修正后的电能计量装置选型决策树模型进行电能计量装置选型。
本申请能够有效实现电能计量装置的自动选型,并且选型结果更准确,具有实用价值。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
机译: 物联网中基于野生卡比率的决策树创建决策树的物联网方法及其系统
机译: 基于店内行为分析的分层决策树结构构建消费者决策树的方法和系统
机译: 基于canvas上基于连接的可定位元素的通信决策树的配置方法和系统