法律状态公告日
法律状态信息
法律状态
2017-06-13
授权
授权
2014-12-17
实质审查的生效 IPC(主分类):G06Q10/04 申请日:20130628
实质审查的生效
2014-11-19
公开
公开
技术领域
本发明涉及电力系统气象灾害防护技术领域,特别涉及一种基于多元线性 回归算法的气象灾害预测方法。
背景技术
气象灾害是对电网造成重大影响,使得电网遭受巨大损失的重要因素之一。 我国是世界上自然灾害最为严重的国家之一,灾害种类多、分布地域广、发生 频率高、造成损失严重。并且由于我国传统电网建设过程中较多的考虑电网内 部构造的供电可靠性与整体安全性,对于外界因素对电网侵损所造成损失的预 防与控制水平还不够高,所以每当遭遇重大气象灾害时,往往会导致电网难以 正常运转,严重时还会产生系统崩溃现象。气象因子与气象灾害的成因有关, 因此建立气象因子与气象灾害之间的映射联系,根据历史数据计算气象灾害发 生的概率,是目前预测气象灾害的主要手段。
由于气象灾害种类繁多,同时气象因子对气象灾害的成因影响关系复杂, 因此如何建立气象因子与气象灾害之间的映射联系,一直是气象学中的重点和 难点问题之一。经过长期研究,目前气象学中通常采用以下三种方法建立气象 因子与气象灾害之间的映射联系:一是利用灰色预测模型中的拓扑模型,利用 绘制曲线来建立自变量(气象因子)与因变量(气象灾害)关系,从而得到与 预测未来数值的模型,但是该模型的建立对样本数据要求较高,一旦原始数据 有波动就极易产生预测坏点;二是采取平稳时间序列分析法,根据统计学统计 出的因果关系建立方程,求得相关系数,该方法的缺陷是模型一旦建立,系数 就确定不变,无法适应多变的天气现象演变规律;三是用周期叠加等非线性预 测模型建立曲线方程,通过海温格点对未来趋势进行预测,该方法预测精度较 高,但是计算复杂且需要对结果进行多次调试,在实际中难以得到较好应用。
发明内容
本发明的目的在于克服现有技术中所存在的样本数据要求高、适应能力差、 计算过程复杂等不足,提供一种基于多元线性回归算法的气象灾害预测方法, 为气象灾害防护提供很好的决策支持。
为了实现上述发明目的,本发明提供了以下技术方案:
一种基于多元线性回归算法的气象灾害预测方法,包括步骤:
(1)收集待预测区域发生各种气象灾害的历史数据,历史数据包括发生各 种气象灾害的具体时间,一段时期内发生该气象灾害的次数,以及每次发生该 气象灾害时对应的气象因子数据;
(2)进行偏相关分析,确定待预测区域某段时期可能发生的主要气象灾害;
(3)采用逐步回归法,对步骤(2)中确定的各个主要气象灾害分别建立 气象灾害与气象因子的映射关系方程式,并进行F检验,如果显著水平P不能 满足P<设定阈值,则剔除该主要气象灾害,否则保留由该主要气象灾害建立的 气象灾害与气象因子的映射关系方程式;
(4)预测待预测区域某段时期的气象因子参数值,并将预测的气象因子参 数值代入步骤(3)中保留的气象灾害与气象因子的映射关系方程式中,得出发 生相应气象灾害的概率值。
进一步的,步骤(1)中所述气象灾害包括风灾、洪涝、雷电、大雾、地质 灾害、凝冻覆冰和山火,所述气象因子包括气温、气压、湿度、风速、蒸发量、 降水和日照。
进一步的,步骤(2)中所述主要气象灾害为任意两个偏相关系数大于等于 -1且小于等于1的气象灾害。确定主要气象灾害,即是预测待预测区域某段时 期可能发生的主要气象灾害。
进一步的,所述步骤(4)中,采用弹性系数法、时间序列法或趋势外推法 预测待预测区域某段时期的气象因子参数值。
进一步的,步骤(3)中对各个主要气象灾害分别建立气象灾害与气象因子 的映射关系方程式之后,进行t检验。采用t检验代替F检验,可缩短气象灾 害与气象因子的映射关系方程式的建立时间。
进一步的,步骤(3)之后还包括步骤(3-1):采用偏相关分析方法确定引 发各个气象灾害的主要气象因子,如果在气象灾害与气象因子的映射关系方程 式中,气象因子对应的系数大于F检验参数或t检验参数、且任意两个气象因 子的偏相关系数取值在-1至1之间,则该气象因子为引发相应气象灾害的主要 气象因子。首先预测出待预测区域可能发生的主要气象灾害之后,再预测出引 发该主要气象灾害的主要气象因子,为减小甚至避免气象灾害对电网的损坏提 供更好的决策支持。
与现有技术相比,本发明的有益效果:
本发明基于多元线性回归算法的气象灾害预测方法,利用多元线 性回归算法首先确定待预测区域在某个特定时期可能发生哪些主要 气象灾害,然后建立气象因子与气象灾害的映射关系方程式,最后代 入气象因子参数值即可预测出各种气象灾害发生的概率值。本发明方 法可以预测出待预测区域在某个特定时期可能发生哪些气象灾害,以 及各气象灾害发生的概率值,根据气象灾害发生的概率值采取相应的 防护措施,为电网的安全防护提供了良好的决策支持。
本发明基于多元线性回归算法的气象灾害预测方法,将多元线性 回归算法应用于气象灾害预测技术,建立气象灾害与气象因子的映射 关系方程式。建立气象灾害与气象因子的映射关系方程式时,只需要 收集气象因子参数值,对样本数据的要求较低,克服了利用灰色预测 模型中的拓扑模型预测方法中对样本数据要求较高的缺陷;本发明方 法可应用于各种环境,根据各地区域不同的气象因子参数值得到该地 区域相应的映射关系方程式系数,适应性强;本发明方法的计算过程 相对简单且不需要反复调试,具有广泛应用价值。
附图说明:
图1为本发明基于多元线性回归算法的气象灾害预测方法流程 图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。 但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基 于本发明内容所实现的技术均属于本发明的范围。
本发明提供了一种基于多元线性回归算法的气象灾害预测方法, 首先,基于多元线性回归算法确定待预测区域特定时期的主要气象灾 害,然后分别建立各种主要气象灾害与气象因子的映射关系方程式; 最后在各种气象灾害与气象因子的映射关系方程式中带入预测的气 象因子参数值,得出相应气象灾害发生的概率值。在映射关系方程式 中带入预测的某个特定时刻的气象因子参数值,即可得出该特定时刻 气象灾害发生的概率值。特定时刻的气象因子参数值通过弹性系数 法、时间序列法,趋势外推法等经典方法计算得到。根据气象灾害发 生的概率值,采取相应的防护措施,尽可能的减小气象灾害造成的危 害与损失。气象学中,一般将气象灾害分为7类,分别是风灾、洪涝、 雷电、大雾、地质灾害、凝冻覆冰和山火,因此所述气象灾害为7类 中的一种,所述气象因子包括气温、气压、湿度、风速、蒸发量、降 水和日照。
参考图1,具体的,本发明基于多元线性回归算法的气象灾害预 测方法,包括步骤:
(1)收集待预测区域电网发生各种气象灾害的历史数据,历史 数据包括发生各种气象灾害的具体时间,一段时期内发生该气象灾害 的次数,以及每次发生该气象灾害时对应的气象因子数值。一般收集 5-10年内待预测区域电网气象灾害发生的历史数据。
(2)进行偏相关分析,提取主要因变量。
在有多个因变量的多元线性回归方程中,多个相关变量(任意两 个因变量之间存在一定的相关关系,因此在偏相关分析中,将因变量 称为相关变量)间的关系是较为复杂的,任何两个相关变量间常常存 在不同程度的简单相关关系,但是这种相关关系又包含有其他相关变 量的影响。因此简单相关分析(即直线相关分析)没有考虑其他相关 变量对这两个相关变量的影响,实际上并不能真实反映两个相关变量 间的相关关系。而只有消除了其他相关变量的影响之后,研究两个相 关变量间的相关性,才能真实地反映这两个相关变量间相关的性质与 密切程度。偏相关分析就是固定其他相关变量不变而研究某两个相关 变量间相关性的统计分析方法。
在气象灾害与气象因子的映射关系方程式中,气象因子为自变 量,气象灾害为因变量。本发明方法中,主要因变量的含义是:7个 气象灾害中,两个气象灾害之间的偏相关系数取值在-1至1之间, 则称这两个气象灾害为主要因变量。
提取主要因变量的过程是:
①根据收集的历史数据建立观测数据表,如表1所示。表1中, x1、x2、…、xm分别表示某种气象灾害自有统计以来累计发生的总次 数,本实施例中,m=7,即x1、x2、…、xm分别表示7种气象灾害中的一 种气象灾害自有统计以来累计发生的总次数,例如 x1=x11+x12+…+x1n。n为序号,表示有n组观测数据,每组数据是在 一个特定时期采集所得。xmn表示在统计的一个特定时期发生某种气 象灾害的次数,例如x11,假设x1为统计的洪涝灾害累计发生的总次数, 序号1表示采集的2005年6月的气象灾害数据,则x11表示2005年6 月发生洪涝灾害的次数。
表1
②计算两个相关变量的偏相关系数,其计算方法如下:
首先计算简单相关系数,即直线相关系数rij:其 中:i=1、2、…、m,j=1、2、…、m,
则相关变量xi与xj的偏相关系数rij'的计算公式为:
只要rij'取值在-1至1之间,则两个因变量xi与xj为主要因变量, 其余为次要因变量。
(3)采用逐步回归法,对步骤(2)中确定的各个主要因变量分 别建立气象灾害与气象因子的映射关系方程式, y=b0+b1x1+b2x2+…+bmxm,并进行F检验,如果显著水 平P不能满足P<0.01的要求,则该主要因变量建立的映射关系方 程式不符合要求,剔除该主要因变量,否则保留该主要因变量建立的 气象灾害与气象因子的映射关系方程式。其中,m≤7,x1、x2、…、xm分别表示自变量,即分别表示气象因子,y表示主要因变量,即主要 气象灾害,y为7种气象灾害(风灾、洪涝、雷电、大雾、地质灾害、 凝冻覆冰、山火)中的一种,b0为参考常数,b1、b2、…、bm为回归 系数。
建立气象灾害与气象因子的映射关系方程式时,输入收集的历史 数据中特定时期发生各气象灾害时对应的气象因子数值,采用SPSS 建模工具即可完成映射关系方程式的建立。由于建立气象灾害与气象 因子的映射关系方程式时,只需要输入收集的历史数据中气象因子参 数值,对样本数据的要求较低,克服了利用灰色预测模型中的拓扑模 型预测方法中对样本数据要求较高的缺陷。同时,根据各地区域不同 的气象因子参数值可得到该地区域相应的映射关系方程式系数,适应 于不同区域不同时期气象因子的多变性,适应性强。
显著水平P是多元线性回归算法中的常见参数,显著水平P由F 检验参数查表所得,F检验参数由计算所得。多元线性回归算法是数 学理论研究中常用到的一种算法,本发明方法中F检验方法、显著水 平P计算和F检验参数计算与多元线性回归算法中的相应计算方式一 致,均为现有技术,此处不作赘述。
t检验是多元线性回归算法中显著性检验的一种,在普通二乘法 下F检验可以和t检验等效。如表2所示,通过试验,采用相同的历 史数据,采用t检验建立气象灾害与气象因子的映射关系方程式所需 的时间少于采用F检验建立映射关系方程式所需的时间,因此,作为 一种优选方式,建立气象灾害与气象因子的映射关系方程式时采用t 检验。
表2
(4)用偏相关分析方法进一步分析步骤(3)中保留的各个气象 灾害与气象因子的映射关系方程式,确定各个气象灾害与气象因子的 映射关系方程式中的主要自变量,然后将主要自变量全部保留于气象 灾害与气象因子的映射关系方程式中。偏相关分析方法同步骤(2) 中的步骤②,只是计算使用的数据由气象灾害换作为气象因子。偏相 关系数取值在-1至1之间且映射关系方程式中回归系数大于F检验 参数或t检验参数的自变量为主要自变量。
(5)气象灾害与气象因子的映射关系方程式建立完成后,在该 映射关系方程式中代入通过弹性系数法、时间序列法,趋势外推法等 经典方法预测的特定时刻的气象因子参数值,即可求出该特定时刻发 生相应气象灾害的概率值。
本发明基于多元线性回归算法的气象灾害预测方法,将多元线性 回归算法与气象灾害建模相结合,只需要收集气象因子参数值,即可 完成气象灾害与气象因子的映射关系方程式的建立,对样本数据的要 求不高,而且可根据各区域不同的气象因子值得到不同的映射关系方 程式系数,可应用于各种环境,适应性强。此外,本发明方法的计算 过程相对简单且不需要反复调试,具有广泛应用价值。
下面以洪涝气象灾害为例,对本发明方法中针对具体的气象灾 害,建立气象灾害与气象因子的映射关系方程式,以及预测发生该气 象灾害的概率值的过程进行更详细的阐述。
(1)收集历史数据,如表3所示(仅收集了待预测区域2005年 至2012年间特定时期各气象因子的平均数值)。
表3
(2)利用SPSS建模工具,输入上述表3所示的数据,建立洪涝 灾害与气象因子的映射关系方程式,为 y=0.551+0.132x1+0.004x2+0.622x3+0.561x4+0.231x5+0.832x6+0.417x7,其中,x1至x7分别依次表示气温、气压、湿度、风速、蒸发量、降 水和日照。由于气象因子x3,x4,x6,x7对应的系数值都大于F检验参 数0.407(在确定洪涝灾害为主要因变量的过程中,已计算出F检验 的参数为0.407),因此可知湿度、风速、降水和日照为主要气象因 子,即湿度、风速、降水和日照为待预测区域发生洪涝灾害的主要影 响因素。由于降水气象因子对应的系数值最大,因此降水为影响洪涝 灾害的最大气象因子。
(3)采用弹性系数法预测待预测区域特定时刻各气象因子参数 值。例如预测2013年5月该待预测区域的气温。采用(收集的历史 数据中)最近年份和最远年份的数据计算弹性系数ET,ET=log (19.5/18.4)/(2012.42/2005.5)=1.06,在根据有 1.06=(T2/19.5)/[(2013.42/2012.42)*0.58],T2=20.68,即预测的2013 年5月该待预测区域的气温为20.68摄氏度。
(4)将预测的所有气象因子的参数值代入映射关系方程式 y=0.551+0.132x1+0.004x2+0.622x3+0.561x4+0.231x5+0.832x6+0.417x7中,即可计算出待预测区域在特定时期发生洪涝灾害的概率值。
机译: 基于SDAE-DBN算法的部件表面粗糙度的在线预测方法
机译: 基于遗传算法的机器学习逆预测方法
机译: 基于观察评级和相似性图的推荐算法评级预测方法