首页> 中国专利> 基于势博弈的微电网能量管理分布式多目标协同优化算法

基于势博弈的微电网能量管理分布式多目标协同优化算法

摘要

本发明公开了一种基于势博弈的微电网能量管理分布式多目标协同优化算法,包括步骤:1)微电网元件单元建模,包括确定决策主体与决策变量、元件约束和多目标建模;2)势博弈建模,收益函数与势函数都是向量函数;3)基于多目标优化算法的分布式博弈求解,主要采用多目标进化类算法求解收益函数的pareto最优解集,并通过分布式迭代求解纳什均衡。本发明采用分布式多主体决策优化方式,结合具有分布式特性的势博弈理论,易于实现微电网的扩展,实现本地管理和本地决策,增加了系统可靠性与灵活性,通过博弈的方式实现分布式的多目标优化,实现微电网个体既竞争又合作的关系,既保证个体利益又实现微电网整体利益的最大化。

著录项

  • 公开/公告号CN108347062A

    专利类型发明专利

  • 公开/公告日2018-07-31

    原文格式PDF

  • 申请/专利权人 华南理工大学;

    申请/专利号CN201810028818.2

  • 发明设计人 曾君;王侨侨;刘俊峰;

    申请日2018-01-12

  • 分类号H02J3/38(20060101);H02J3/32(20060101);H02J3/46(20060101);G06N3/00(20060101);G06N3/12(20060101);G06Q10/04(20120101);G06Q50/06(20120101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人冯炳辉

  • 地址 510640 广东省广州市天河区五山路381号

  • 入库时间 2023-06-19 06:30:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-12-10

    授权

    授权

  • 2018-08-24

    实质审查的生效 IPC(主分类):H02J3/38 申请日:20180112

    实质审查的生效

  • 2018-07-31

    公开

    公开

说明书

技术领域

本发明涉及微电网的运行、仿真、分析与调度的技术领域,尤其是指一种基于势博弈的微电网能量管理分布式多目标协同优化算法。

背景技术

智能电网具有灵活、清洁、安全、经济、友好等性能,是未来电网的发展方向。分布式电源(包括储能)的大量接入和充分利用以及实现需求侧管理是智能电网发展的原动力。微电网是连接分布式电源与大电网的最好桥梁,通常定义为一个包含分布式电源、储能设备和可控负荷的低压配电网或系统,既可离网(孤岛)运行,也可视为大电网的可控电源或负荷。因此,微电网也被认为是智能电网的积木。

随着信息技术与物理信息融合系统(CPS)的发展,更多不同利益主体的分布式电源与负荷会接入微电网,微电网的智能性和自利性将进一步加强。分布式和即插即用是微电网发展的必然趋势,要求微电网具备灵活的网架结构和良好的扩展性能。可以从以下三个方面考虑:1、分布式电源、储能设备和负荷作为可控的模块化元件单元接入微电网;2、物理信息深度融合将松散的模块化元件单元连接成一个有机的整体;3、分布式能量管理与优化。

目前大量研究注重微电网的集中式优化,如进化算法,随机规划方法和模型预测控制方法以及多目标优化算法。很明显,集中式优化方法需要处理大量数据,可扩展性差,不易于实现即插即用。目前关于分布式优化的研究多为多代理系统(MAS)。从根本上说,基于分布式信息和计算算法的MAS只是一种卓越的技术解决方案,并不能充分表达分布式电源或负荷的自利性。同时,微电网的运行优化是一个多目标优化问题,因而有必要设计一种考虑个体自利性的分布式多目标优化算法。具有分布式特性的势博弈理论是本发明的基础,以下作简要介绍。

策略博弈包含局中人、策略和收益函数(效用函数)三个要素。对于策略博弈Γ=<N,{Yi}i∈N,{Ui}i∈N>,N={1,2,…,n}是局中人的集合,Yi表示第i个局中人的策略集合,局中人i的收益函数是Ui:Y→R(Y=Y1×Y2×……×Yn是局中人策略组合,R是实数集)。设S是N的子集,-S是S的补集,YS表示笛卡尔乘积(Cartesian>i∈SYi。对于单一元素集合{i},Y-{i}简写为Y-i。策略组合y=(y1,y2,…,yn)简写为y=(yi,y-i),yi∈Yi,y-i∈Y-i,y∈Y。

势博弈(Monderer D.,Shapley L.S.,Potential Games[J].Games&EconomicBehavior,1996,14(1):124-143.)是非合作博弈的一种特殊形式,其定义:对于博弈Γ=<N,{Yi}i∈N,{Ui}i∈N>,若存在函数G:Y→R,对于满足:

Ui(x,y-i)-Ui(z,y-i)=G(x,y-i)-G(z,y-i),

则称博弈Γ为完全势博弈。势博弈具备有限改进属性,该属性保证了势博弈必然存在纳什均衡点。

发明内容

本发明的目的在于克服现有的微电网能量管理系统运行优化算法的缺陷与不足,特提供了一种基于势博弈的微电网能量管理分布式多目标协同优化算法,以势博弈理论建立分布式的架构,为局中人构造不同的优化目标以及不同局中人之间的协同优化目标,通过多目标优化算法为局中人找到pareto最优解集,根据支付函数选择策略,最终通过博弈找到纳什均衡点。

为实现上述目的,本发明所提供的技术方案为:基于势博弈的微电网能量管理分布式多目标协同优化算法,包括以下步骤:

1)微电网元件单元建模

考虑一个典型的微电网,由光伏阵列(PV/pv)、风力发电机(WT/wt)、柴油发电机(DE/de)、蓄电池(BA/ba)、负荷(LD/ld)以及电动汽车(EV/ev)等组成,每个元件结合相应的功率变化器、传感器、控制器和智能开关构成可控的元件单元;每个元件单元均配备一个本地管理器(LM),用于本地决策和本地管理,并且所有LM通过网络互联,相互之间可以通信以实现分布式协调控制;

1.1)决策主体与决策变量

所有元件单元组成的决策主体集合N表示如式(1);

式中,n1对应光伏阵列集合PV的数量,pvn是第n组光伏阵列,n=1,2,…,n1;n2对应风力发电机集合WT的数量,wtn是第n台风力发电机,n=1,2,…,n2;n3对应柴油发电机集合DE的数量,den是第n台柴油发电机,n=1,2,…,n3;n4对应蓄电池集合BA的数量,ban是第n组蓄电池,n=1,2,…,n4;n5对应负荷集合LD的数量,ldn是第n个负荷,n=1,2,…,n5;n6对应电动汽车集合EV的数量,evn是第n辆电动汽车,n=1,2,…,n6;

假定待优化的时间窗口包含TN个优化时段,元件单元i在t时段的输出功率或消耗功率(决策变量)用Pit表示,i∈N,t=1,2,…,TN,用正值表示输出功率,负值表示消耗功率;元件单元i的决策向量Pi表示如式(2);

1.2)元件约束

决策变量受上下限约束,如式(3)所示;

元件单元i在t时段的功率上下限分别为Pti·max和Pti·min;同时,元件单元所受的其它约束gi(Pi)如式(4)所示;

gi(Pi)≤0,i∈N(4)

所有元件单元必须满足功率平衡约束,如式(5)所示;

1.3)多目标建模

多目标函数考虑两类:自利目标与协同目标;

自利目标指的是仅与自身决策向量相关而与其它元件单元决策向量无关的目标,且该目标表明元件单元追逐自身利益最大化;此类目标数量至少一个,设以元件单元i的收益和污染物即废弃物排放为两个目标,最大化收益目标为Fi1(Pi,ρ,γi),ρt为t时段的单位电价,t=1,2,…,TN,ρ为电价向量;为t时段的单位成本系数,t=1,2,…,TN,γi成本系数向量,如式(6)所示;

最小化污染物(废弃物)排放目标为为t时段的废弃物排放系数,t=1,2,…,TN,μi为排放系数向量,如式(7)所示;

因ρ、γi和μi为非决策向量,在不产生误解的情况下,Fi1(Pi,ρ,γi)和Fi2(Pii)分别简写Fi1(Pi)为和Fi2(Pi);

协同目标指的是决策主体之间共同拥有的目标,通过相互间的信息共享实现,表征决策主体之间的互动和影响;协同目标的数量可以有一个或多个,每个协同目标至少包含两个决策主体;设以光伏-风机-负荷m个决策主体的协同为目标,目的是使负荷与可再生能源出力相一致以减小其波动性对微电网的影响,元件单元i的协同目标为元件单元j的协同目标为元件单元k的协同目标为i,j和k分别代表光伏元件、风机元件和负荷,如式(8)所示;

此m个决策主体具有相同的协同目标形式F(i,j,k)(Pi,Pj,Pk),如式(9)所示;

式中,avgτ(Pi,Pj,Pk)为从时段τ开始的Nw时间窗内i、j与k的决策变量的平均值,Nw为滑动时间窗的长度;

2)势博弈建模

以所有决策主体作为博弈局中人,局中人集合如式(1)所示;以元件单元i的决策向量Pi作为局中人的策略,如式(2)所示;满足式(3)、(4)的所有决策向量Pi的集合为局中人i的策略集即策略空间Yi,如式(10)所示;

局中人i的效用函数Ui(Ps)s∈N即支付函数是一个向量函数,Ps指对局中人i的效用函数产生影响的决策向量,如式(11)所示;

所有局中人的效用函数必须具有相同维数,但每个局中人的优化目标数量可能不同,解决的方式是:将所有优化目标分类,包括经济性目标(收入)、环境性目标(污染物排放)和光伏-风机-负荷协同目标等,在效用函数向量中依次排列,同种类型目标即具有相同量纲的放置在相同的位置,若无该类型目标则以0补齐;统一所有目标的形式,所有最小化目标按最大化其相反数处理,也能够用同样方法将所有目标转化成最小化处理;

存在势函数G(Ps)s∈N,如式(12)所示,满足势博弈定义;

至此,建立分布式多目标协同优化的势博弈模型;

3)基于多目标优化算法的分布式博弈求解

博弈求解通过以下步骤实现:

3.1)策略评估

直接使用效用函数评估策略,效用函数是一个向量函数,每个分量为一个优化目标,采用多目标优化算法求解出pareto最优解集作为候选策略集;所述的多目标优化算法包括但不限于多目标粒子群算法(MOPSO)和多目标遗传算法(NSGA,NSGA-II和NSGA-III)这些多目标进化类算法及其改进形式;

3.2)决策规则

局中人需要从候选策略集中选出一个策略作为下一步的策略,考虑全局功率平衡约束即式(5),确立如下原则:①可行解优先于不可行解;②可行解中非支配解优先;③不可行解中约束违背量小的解优先;

所述的约束违背量是指t时段的功率平衡约束违背量ΔPt如式(13)所示;

式中,ε是误差限,接近0的正数;所述的可行解满足式(13),反之为不可行解;

根据以上原则,有两种方式选择策略;方式一:随机选择,从候选策略集中随机选择一个策略作为下一步的策略;方式二:将效用函数的各个分量(归一化)线性加权组合得到决策函数Fi(Pi),使决策函数取最大值的策略Pi*作为下一步的策略,如式(14)所示,αi1,αi2分别为对应目标函数的加权系数;

3.3)调整机制(策略更新)

调整机制分为静态调整和动态调整;

所述的静态调整指的是所有局中人选定下一步的策略后并不立即更新自己的策略,待所有局中人结束本轮博弈之后再更新策略;局中人通过通信获得的其他局中人的策略均是上一轮博弈所确定的策略;

所述的动态调整指的是局中人确定下一步策略之后立即更新自己的策略,局中人通过通信获得的其他局中人的策略均是最新的策略。

本发明与现有技术相比,具有如下优点与有益效果:

1、势博弈本身具备良好的收敛属性,保证了本发明所提出的模型和算法的收敛性。

2、相较于集中式单一主体决策优化算法,本发明采用分布式多主体决策优化方式,结合具有分布式特性的势博弈理论,易于实现微电网的扩展,实现本地管理和本地决策,增加了系统可靠性与灵活性。

3、考虑微电网的自利性(逐利性)与智能性,同时考虑决策主体的多目标性,通过博弈的方式实现分布式的多目标优化。

4、设定多个决策主体之间的协同优化目标,实现微电网个体既竞争又合作的关系,既保证个体利益又实现微电网整体利益的最大化。

附图说明

图1是微电网结构图。

图2是基于势博弈的微电网能量管理分布式多目标协同优化算法流程图。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

参见图1和图2,本实施例所提供的基于势博弈的微电网能量管理分布式多目标协同优化算法,其具体情况如下:

第一步:微电网及其元件单元建模

一个包含光伏阵列(PV/pv)、风力发电机(WT/wt)、柴油发电机(DE/de)、储能设备(蓄电池,BA/ba)、负荷(LD/ld)及电动汽车(EV/ev)的典型微电网如图1所示。微电网管理器(MG Manager)接收配网管理系统(DMS)的调度,通过公共连接点(PCC)实现并网与离网的转换。光伏、风机、柴油机、蓄电池、负荷及电动汽车,各自结合相应的传感器、控制器、智能开关和功率变换器(AC/DC or AC/AC),形成可控的元件单元,本地管理器(LM)是该单元的核心。所有元件单元的本地管理器及微电网管理器通过信息网络互联,实现本地决策管理和协同优化。此外,模块化的元件单元分布在不同区域并且分属不同的所有者。

选定光伏阵列、风力发电机、柴油发电机、储能设备(蓄电池)及负荷作为决策主体,决策主体集合N表示如式(15)。以微电网的日前规划为例,优化未来24小时微电网的运行,TN=24,决策向量如式(2)所示。

N={pv,wt,de,ba,ld}(15)

光伏阵列、风力发电机、柴油发电机、蓄电池及负荷的决策向量依次为Ppv、Pwt、Pde、Pba、Pld,在t时段的输出功率或消耗功率(即决策变量)分别用表示,t=1,2,…,TN,对应的约束集分别为Ypv、Ywt、Yde、Yba和Yld。以下按照决策主体对元件单元依次建模。

1)光伏阵列

优化目标如式(16)所示;光伏阵列的收益目标为Fpv1(Ppv);无第二目标Fpv2(Ppv)和第三目标Fpv3(Ppv),故设为0;光伏的协同目标为Fpv(wt,ld)(Ppv,Pwt,Pld),风机的协同目标为Fwt(pv,ld)(Pwt,Ppv,Pld),负荷的协同目标为Fld(pv,wt)(Pld,Ppv,Pwt),光伏-风机-负荷协同目标具体形式F(pv,wt,ld)(Ppv,Pwt,Pld)如式(17);avgτ(Ppv,Pwt,Pld)为从时段τ开始的Nw时间窗内光伏、风机与负荷的决策变量的平均值;ρ为电价向量,γpv为单位维护成本系数向量,滑动时间窗的长度Nw设为4。

约束集如式(18)所示,式中Ptpv·max是由光伏最大功率预测模型计算得到的t(t=1,2,…,TN)时段最大输出功率。

2)风力发电机

优化目标如式(19)所示,风机的收益目标为Fwt1(Pwt),γwt为风机元件单位维护成本系数向量;风机无第二目标Fwt2(Pwt)和第三目标Fwt3(Pwt),故设为0;光伏-风机-负荷协同目标具体形式如式(17)。

约束集如式(20)所示,式中Ptwt·max是由风机最大功率预测模型计算得到的t(t=1,2,…,TN)时段最大输出功率。

3)柴油发电机

优化目标如式(21)所示;柴油发电机的收益目标为Fde1(Pde),γde为单位燃油成本系数向量,污染物排放目标为Fde2(Pde),μde为柴油发电机的废弃物排放系数向量,定义如式(7)所示;无第三目标Fde3(Pde)和协同目标Fde()(Pde),故设为0。

约束集如式(22)所示,Ptde·max和Ptde·min分别t时段为机械出力上下限;g1de(Pde)和g2de(Pde)是机组爬坡约束函数,Rup和Rdown分别表示机组的单位时间爬坡上升率限制和下降率限制。

4)蓄电池

优化目标如式(23)所示,蓄电池的收益目标为Fba1(Pba),γtba为蓄电池t时段单位维护成本系数;Fba3(Pba)为最小化充放电切换次数目标;无第二目标Fba2(Pba)与协同目标Fba()(Pba),故设为0。

蓄电池充放电模型如式(24),其中SOC(t)为第t个时段结束时蓄电池的荷电状态;ηc、ηd分别为蓄电池的充、放电效率;Er为蓄电池的额定容量;σ为蓄电池自放电率;Δt为充放电时间间隔。

蓄电池荷电量约束如式(25),SOCmax和SOCmin分别是荷电量上下限;约束集如式(26)所示,Ptba·max和Ptba·min分别是t时段蓄电池最大允许放电功率和最大允许充电功率。

5)负荷

优化目标如式(27)所示,负荷的收益目标为Fld1(Pld);无第二目标的收益目标为Fld2(Pld),故设为0;负荷满意度函数为F3ld(Pld),其中Ltld是t时段预测负荷需求,λ与μ是负荷满意度函数的参数,由用户确定;Ptld=Ltld,F3ld(Pld)=0,满意度参考点;|Ptld|>|Ltld|,F3ld(Pld)>0,相对满意度参考点更满意;|Ptld|<|Ltld|,F3ld(Pld)<0,相对满意度参考点欠满意。Ptld与Ltld均为负数。

约束集如式(28)所示,Ptld·max和Ptld·min分别是t时段负荷需求的上下限。

第二步:势博弈建模

局中人如式(15)所示,其效用函数如式(29)所示,光伏阵列、风力发电机、柴油发电机、蓄电池及负荷对应的效用函数分别为Upv(Ps)s∈N、Uwt(Ps)s∈N、Ude(Ps)s∈N、Uba(Ps)s∈N和Uld(Ps)s∈N,对应的策略集分别为式(18)、(20)、(22)、(26)、(28)。

势函数G(Ps)s∈N如式(30)所示,效用函数与势函数都是包含4个分量的向量函数。

第三步:基于多目标优化算法的分布式博弈求解

采用式(29)所示的收益函数作为局中人策略的评估函数,使用多目标粒子群优化(MOPSO)算法求解局中人的pareto最优解集,决策规则采用随机选择的方式,为加速收敛使用动态调整机制。

MOPSO是由Carlos A.Coello Coello等在2004年提出来的(Coello C.A.C.,Pulido G.T.,Lechuga M.S.,Handling multiple objectives with particle swarmoptimization[J].IEEE Transactions on Evolutionary Computation,2004,8(3):256-279),该算法在单目标粒子群优化(PSO)算法的基础上,引入“精英策略”保存非劣解于“存档”中,并应用自适应网格法选出全局最优粒子,引入变异机制,增加算法的局部搜索能力。MOPSO是非常成熟的多目标优化算法,此处关于MOPSO的细节不再赘述。

基于多目标优化算法的分布式博弈求解的具体描述分以下步骤:

step1.算法初始化

输入数据(微源、储能设备和负荷运行特性,环境数据,电价以及负荷预测数据);

处理数据获取光伏和风机的最大输出功率;

初始化参数(优化时段数TN,最大迭代次数MaxItr,策略精度ε1);

按照上述方法建立势博弈模型;

查找并更新局中人优先级队列,优先级从高到底如式(15)所示,设定局中人数目(|N|);

初始化迭代计数器k=1;

step2.初始化队列计数器i=1

step3.ith局中人的博弈行为

请求其他局中人的策略;

等待其他局中人回复;

接收回复;

使用收益函数评估策略并用MOPSO找出pareto最优解集;

根据决策规则决策并更新策略Pki(Pki=[Pki·1,Pki·2,…,Pki·t,…,Pki·TN],Pki·t对应局中人i第k次迭代的t时段的功率);

计算策略变化率ΔPki·t(ΔPki·t=|(Pki·t-Pk-1i·t)/Pk-1i·t|,k≥2,ΔP1i·t=0,t=1,2,…,TN);

设定收敛状态Si(Si=1,||ΔPki||≤ε1;Si=0,||ΔPki||>ε1,ΔPki=[ΔPki·1,…,ΔPki·t,…,ΔPki·TN]);

step4.判断i<|N|

若是,则返回step3;若否,则进入step5;

step5.局中人通过通信决定博弈的收敛状态,若Si=1对每个局中人i(i∈N)都成立,则博弈收敛(纳什均衡)

step6.判断是否达到纳什均衡(博弈收敛)

若是,则进入step7;

若否,则判断k≤MaxItr,即是否达到最大迭代次数

若未达到最大迭代次数,执行k=k+1,并返回step2;

若达到最大迭代次数,则进入step7;

step7.所有局中人保存博弈策略结果Pi(Pi,i∈N)

step8.输出优化结果{Pi}i∈N

以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号