首页> 中国专利> 基于信息熵的凝聚型层次聚类算法的风电场机群聚合方法

基于信息熵的凝聚型层次聚类算法的风电场机群聚合方法

摘要

本发明公开了电力系统仿真领域的一种基于信息熵的凝聚型层次聚类算法的风电场机群聚合方法。其技术方案是,首先,根据风电场的实测运行数据,采用谱聚类算法将风电场内的风电机组划分为k个风电机群;其次,建立基于信息熵的相似性矩阵;然后,基于凝聚型层次聚类算法Cure算法的机群合并;直到将所有的机群合并为指定的等值风电机组个数。该方法面向风电场动态建模,在机群聚合过程中,借用信息论中熵的定义和性质,对数据库中关系属性之间的规则进行挖掘,引入信息熵作为合并前后聚类质量的评价指标,并向上层反馈,通过一个特定的收缩因子将样本组向聚类中心收缩,从而达到合并机群的目的,且机群聚合前后风电场的动态响应特性较接近。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-23

    未缴年费专利权终止 IPC(主分类):G06F17/00 授权公告日:20160817 终止日期:20170303 申请日:20140303

    专利权的终止

  • 2016-08-17

    授权

    授权

  • 2014-07-16

    实质审查的生效 IPC(主分类):G06Q10/06 申请日:20140303

    实质审查的生效

  • 2014-06-18

    公开

    公开

说明书

技术领域

本发明属于电力系统仿真领域,尤其涉及一种基于信息熵的凝聚 型层次聚类算法的风电场机群聚合方法。

背景技术

风力发电作为目前应用最为广泛、技术最为成熟的可再生能源发 电方式,近年来得到了迅猛发展。随着风电并网容量的快速增加,风 电的随机性、波动性对电力系统的安全、稳定、经济运行产生了诸多 不利影响。为准确分析和评价大容量风电场与电力系统之间的相互作 用和影响,研究并寻求合适的风电场等值方法对含风电场的电力系统 仿真分析具有重要意义。

传统的风电场等值方法假设场内所有风电机组输入风速相等或 相差不大,采用单机等值模型,该方法依赖于厂家提供的静态风速- 功率曲线,然而实际运行中的风电机组运行状况并不一定遵从特定运 行环境下测得的静态风速功率特性曲线。另一方面,由于大型风电场 风速分布、地形地貌、机组排列方式等诸多因素的影响,场内各机组 之间的风况及其输出功率都可能存在较大差别,使用单机等值方法通 常会存在较大误差。

近年来,许多学者以风电机组实测运行数据为基础,采用聚类算 法进行风电机组机群划分,进而建立风电场的多机等值模型。有学者 提出采用K-means聚类算法,根据某一分群指标对风电机组进行分 群,建立了风电场的等值模型。K-means聚类算法是一种最基本的聚 类方法,算法简单且能有效处理大数据集,但在该算法中,聚簇的个 数需人为的预先指定,具有一定的盲目性。因此,有学者提出基于谱 聚类算法的风电机组机群划分方法,谱聚类算法作为一类新颖且有效 的聚类算法,与传统的聚类算法相比,能在任意形状的样本空间上聚 类,且收敛于全局最优解。部分谱聚类算法能根据数据的分布情况, 自动确定聚簇的个数,如NJW谱聚类算法、Rcut谱聚类算法、非线 性降维算法和基于距离的启发式方法等。然而,对于大型风电场的机 群划分,若实测数据样本分布较分散,有可能导致自动确定的聚簇个 数较多,等值风电机组的台数过多,将会极大的增加仿真的复杂度, 不适合风电场的实际仿真分析。

发明内容

针对背景技术中提到的现有的谱聚类算法,对于大型风电场的机 群划分导致自动确定的聚簇个数较多、等值风电机组的台数过多和增 加仿真的复杂度的问题,本发明提出了一种基于信息熵的凝聚型层次 聚类算法的风电场机群聚合方法。

一种基于信息熵的凝聚型层次聚类算法的风电场机群聚合方法, 其特征在于,所述方法包括以下步骤:

步骤1:根据风电场的实测运行数据,采用谱聚类算法将风电场 内的风电机组划分为k个风电机群;

步骤2:建立风电机群基于信息熵的相似性矩阵A;

步骤3:基于凝聚型层次聚类算法Cure算法的机群合并;

步骤4:判断步骤3得到的机群数是否为设定的机群划分个数; 如果是,则机群合并结束;否则执行步骤5;

步骤5:在步骤3的基础上,重新计算每一机群的信息熵,重复 执行步骤2~4,再次进行合并;直到将所有的机群合并为设定的机群 划分个数。

所述谱聚类算法包括NJW谱聚类算法、Rcut谱聚类算法、非线 性降维算法和基于距离的启发式方法。

所述步骤2中,建立风电机群基于信息熵的相似性矩阵A的过 程为:

步骤201:在步骤1的划分结果中,记第s个机群为Cs(s=1,2,…,k), 其聚类中心为Bs(s=1,2,…,k);该机群内的风电机组实测运行数据为:

其中,Vi,j代表该机群内第i台风电机组在第j个数据采集时间点 的实测运行数据,b为机群内包含的机组个数,t表示数据采集时间 点数;

步骤202:根据该机群内的风电机组实测运行数据,计算每一风 电机群的信息熵;所述每一风电机群的信息熵的计算公式为:

H(V)=-Σj=1tΣi=1bpi,jlog2pi,j

其中,pi,j表示Vi,j在第j列中出现的概率;

步骤203:根据步骤202得到的每一风电机群的信息熵,建立基 于信息熵的相似性矩阵;

其中,Au,w=Hu+Hw-Hu,w;Hu和Hw分别代表机群Cu和Cw的信息熵 值;Hu,w表示将机群Cu和Cw合并后形成的机群Cu,w的熵值。

所述步骤3中,基于凝聚型层次聚类算法Cure算法的机群合并 的过程为:

步骤301:从信息熵的相似性矩阵A中找到最小元素,令其为Ap,q, 所对应的机群为Cp和Cq,记对应的聚类中心为Bp和Bq

步骤302:将机群Cp和Cq合并,合并后的机群记为Cp,q,计算Cp,q的聚类中心:

Bp,q=e×Bp+f×Bqe+f

其中,e和f分别为机群Cp和Cq内风电机组的台数;

步骤303:设原来机群Cp和Cq内的样本组分别为和Vhq(h=1,2,...,f);

步骤304:在合并后的机群Cp,q内,用收缩因子λ将和向聚类 中心Bp,q收缩,收缩后原来的样本组和在机群Cp,q内分别记为和其计算方法如下:

Vgp,q=Vgp+λ×(Bp,q-Vgp)

Vhp,q=Vhp+λ×(Bp,q-Vhp).

所述收缩因子λ的取值范围为0.2~0.7。

本发明提出的基于信息熵的凝聚型层次聚类算法的风电场机群 聚合方法,能有效解决采用某些谱聚类算法自动确定机群个数较多, 不适合电力系统实际仿真分析的问题,且机群聚合前后风电场的动态 响应特性较接近;所采用的风电场机群聚合方法借用信息论中的熵的 定义和性质,对数据库中关系属性之间的规则进行挖掘,引入信息熵 作为合并前后聚类质量的评价指标,并向上层反馈,从而提高聚类效 果;同时采用凝聚型层次聚类算法-Cure算法进行机群聚合,通过代 表点向机群中心点的缩进来减少聚类结果中孤立点的存在,具有很好 的处理噪声数据的能力。

附图说明

图1为本发明提供的基于信息熵的凝聚型层次聚类算法的风电 场机群聚合方法的基本步骤框图;

图2为使用本发明技术方案的某实际风电场平面图;

图3为使用本发明的CIGRE B4-39风电场并网仿真系统;

图4为阵风扰动时风电场采用NJW谱聚类算法建立的多机表征 模型(机群聚合前)和采用本发明提出的机群聚合后的等值模型时有 功出力的对比图;

图5为系统侧短路故障时,风电场采用NJW谱聚类算法建立的 多机表征模型(机群聚合前)和采用本发明提出的机群聚合后的等值 模型时有功功率对比图;

图6为系统侧短路故障时,风电场采用NJW谱聚类算法建立的 多机表征模型(机群聚合前)和采用本发明提出的机群聚合后的等值 模型时无功功率对比图;

图7为系统侧短路故障时,风电场采用NJW谱聚类算法建立的 多机表征模型(机群聚合前)和采用本发明提出的机群聚合后的等值 模型时并网点电压的对比图。

具体实施方式

下面结合附图,对优选实例作详细说明。应该强调的是下述说明 仅仅是示例性的,而不是为了限制本发明的范围及其应用。

图1为本发明提供的基于信息熵的凝聚型层次聚类算法的风电 场机群聚合方法的基本步骤框图。图1中,一种基于信息熵的凝聚型 层次聚类算法的风电场机群聚合方法,其特征主要包括以下步骤:

步骤1:根据风电场的实测运行数据,采用谱聚类算法将风电场 内的风电机组划分为k个风电机群;所述谱聚类算法包括NJW谱聚 类算法、Rcut谱聚类算法、非线性降维算法和基于距离的启发式方法;

步骤2:建立风电机群基于信息熵的相似性矩阵A;具体过程为:

步骤201:在步骤1的划分结果中,记第s个机群为Cs(s=1,2,…,k), 其聚类中心为Bs(s=1,2,…,k);该机群内的风电机组实测运行数据为:

其中,Vi,j代表该机群内第i台风电机组在第j个数据采集时间点 的实测运行数据,b为机群内包含的机组个数,t表示数据采集时间 点;

步骤202:根据该机群内的风电机组实测运行数据,计算每一风 电机群的信息熵;所述每一风电机群的信息熵的计算公式为:

H(V)=-Σj=1tΣi=1bpi,jlog2pi,j

其中,pi,j表示Vi,j在第j列中出现的概率;

步骤203:根据步骤202得到的每一风电机群的信息熵,建立基 于信息熵的相似性矩阵;

其中,Au,w=Hu+Hw-Hu,w;Hu和Hw分别代表机群Cu和Cw的信息熵 值;Hu,w表示将机群Cu和Cw合并后形成的机群Cu,w的熵值;

步骤3:基于凝聚型层次聚类算法Cure算法的机群合并;具体 过程为:

步骤301:从信息熵的相似性矩阵A中找到最小元素,令其为Ap,q, 所对应的机群为Cp和Cq,记对应的聚类中心为Bp和Bq

步骤302:将机群Cp和Cq合并,合并后的机群记为Cp,q,计算Cp,q的聚类中心:

Bp,q=e×Bp+f×Bqe+f

其中,e和f分别为机群Cp和Cq内风电机组的台数;

步骤303:设原来机群Cp和Cq内的样本组分别为和Vhq(h=1,2,...,f);

步骤304:在合并后的机群Cp,q内,用收缩因子λ将和向聚类 中心Bp,q收缩,收缩后原来的样本组和在机群Cp,q内分别记为和其计算方法如下:

Vgp,q=Vgp+λ×(Bp.q-Vgp)

Vhp.q=Vhp+λ×(Bp,q-Vhp);

根据Cure算法提出者的研究成果,收缩因子λ的取值在0.2-0.7 之间能取得较好的聚类效果;

步骤4:判断步骤3得到的机群数是否为设定的机群划分个数; 如果是,则机群合并结束;否则执行步骤5;

步骤5:在步骤3的基础上,重新计算每一机群的信息熵,重复 执行步骤2~4,再次进行合并;直到将所有的机群合并为设定的机群 划分个数。

下面通过一个实际风电场来说明本发明提出的风电场机群聚合 方法,图2为该风电场的平面图,场内共有33台风电机组,机组的 类型均为GE1.5MW,风电场总装机容量为49.5MW。选取2010年6 月1日至2010年11月30日半年内的实测风速数据进行分析,采用 NJW谱聚类算法进行机群划分,自动确定的机群个数为8,机群的划 分结果如表1所示。

表1基于NJW谱聚类算法的机群划分结果

机群号 机群内包含的风机编号 1 1#、21#、24#、28# 2 2#、3#、4#、5#、7# 3 6#、10#、16#、17#、18# 4 8#、9#、23# 5 11#、13#、25#、27#、29#、31# 6 12#、15#、19#、22# 7 14#、20#、32#、33# 8 26#、30#

采用本发明提出的方法进行机群聚合,并指定等值风电机组的台 数为3,聚合结果如表2所示。

表2机群聚合结果

机群号 机群内包含的风机编号 1 1#、12#、15#、19#、21#、22#、24#、28# 2 2#、3#、4#、5#、7#、8#、9#、11#、13#、23#、25#、27#、29#、31# 3 6#、10#、14#、16#、17#、18#、20#、26#、30#、32#、33#

采用按容量加权法分别计算机群聚合前后各等值机组的参数,分 析阵风扰动和系统侧发生短路故障时,机群聚合前后模型的动态响应 特性。

阵风扰动:设迎向风电场的阵风4s时启动,8s停止,阵风大小 为3m/s,图4为阵风扰动下风电场采用NJW谱聚类算法建立的多机 表征模型(机群聚合前)和采用本发明提出的机群聚合后的等值模型 时有功出力的对比图,其中实线表示机群聚合前风电场等值模型的有 功出力,虚线表示机群聚合后风电场等值模型的有功出力,通过对比 可以看出风速扰动下,机群聚合前后风电场的有功功率响应动态曲线 较接近。

系统侧短路故障:设CIGRE B4-39风电并网系统(如图2所示) 在t=2.0s时,母线3发生三相接地短路故障,t=2.2s时故障消除。 图5、图6、图7分别为系统侧短路故障时,风电场采用NJW谱聚类 算法建立的多机表征模型(机群聚合前)和采用本发明提出的机群聚 合后的等值模型时有功功率、无功功率和并网点电压的对比图,其中 实线表示机群聚合前风电场等值模型的有功出力、无功功率和并网点 电压,虚线表示机群聚合后风电场等值模型的有功出力、无功功率和 并网点电压,通过对比可以发现系统侧短路故障下,机群聚合前后风 电场的有功功率、无功功率、并网点电压响应动态曲线较接近。

风速扰动和系统侧短路故障扰动仿真结果说明采用本文的方法 可以达到机群合并的目的,能够减少风电场等值风电机组的台数,且 对合并前后风电场动态响应特性的影响较小。另外,采用本文提出的 凝聚型层次聚类算法-Cure算法进行机群聚合,通过代表点向机群中 心点的缩进来减少聚类结果中孤立点的存在,具有很好的处理噪声数 据的能力。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范 围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技 术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围 之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号