首页> 中国专利> 基于多元线性回归算法的气象灾害预测方法

基于多元线性回归算法的气象灾害预测方法

摘要

本发明公开了一种基于多元线性回归算法的气象灾害预测方法。本发明方法首先根据历史数据确定待预测区域特定时期的主要气象灾害,然后分别建立各种主要气象灾害与气象因子的映射关系方程式;最后在各种气象灾害与气象因子的映射关系方程式中带入预测的气象因子参数值,得出相应气象灾害发生的概率值。本发明方法将多元线性回归算法应用于气象灾害预测技术,建立气象灾害与气象因子的映射关系方程式,只需要收集气象因子参数值,对样本数据的要求不高;本发明方法可应用于各种环境,根据各地不同的气象因子值得到不同的映射关系方程式系数,适应性强;本发明方法的计算过程相对简单且不需要反复调试,具有广泛应用价值。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-06-13

    授权

    授权

  • 2014-12-17

    实质审查的生效 IPC(主分类):G06Q10/04 申请日:20130628

    实质审查的生效

  • 2014-11-19

    公开

    公开

说明书

技术领域

本发明涉及电力系统气象灾害防护技术领域,特别涉及一种基于多元线性 回归算法的气象灾害预测方法。

背景技术

气象灾害是对电网造成重大影响,使得电网遭受巨大损失的重要因素之一。 我国是世界上自然灾害最为严重的国家之一,灾害种类多、分布地域广、发生 频率高、造成损失严重。并且由于我国传统电网建设过程中较多的考虑电网内 部构造的供电可靠性与整体安全性,对于外界因素对电网侵损所造成损失的预 防与控制水平还不够高,所以每当遭遇重大气象灾害时,往往会导致电网难以 正常运转,严重时还会产生系统崩溃现象。气象因子与气象灾害的成因有关, 因此建立气象因子与气象灾害之间的映射联系,根据历史数据计算气象灾害发 生的概率,是目前预测气象灾害的主要手段。

由于气象灾害种类繁多,同时气象因子对气象灾害的成因影响关系复杂, 因此如何建立气象因子与气象灾害之间的映射联系,一直是气象学中的重点和 难点问题之一。经过长期研究,目前气象学中通常采用以下三种方法建立气象 因子与气象灾害之间的映射联系:一是利用灰色预测模型中的拓扑模型,利用 绘制曲线来建立自变量(气象因子)与因变量(气象灾害)关系,从而得到与 预测未来数值的模型,但是该模型的建立对样本数据要求较高,一旦原始数据 有波动就极易产生预测坏点;二是采取平稳时间序列分析法,根据统计学统计 出的因果关系建立方程,求得相关系数,该方法的缺陷是模型一旦建立,系数 就确定不变,无法适应多变的天气现象演变规律;三是用周期叠加等非线性预 测模型建立曲线方程,通过海温格点对未来趋势进行预测,该方法预测精度较 高,但是计算复杂且需要对结果进行多次调试,在实际中难以得到较好应用。

发明内容

本发明的目的在于克服现有技术中所存在的样本数据要求高、适应能力差、 计算过程复杂等不足,提供一种基于多元线性回归算法的气象灾害预测方法, 为气象灾害防护提供很好的决策支持。

为了实现上述发明目的,本发明提供了以下技术方案:

一种基于多元线性回归算法的气象灾害预测方法,包括步骤:

(1)收集待预测区域发生各种气象灾害的历史数据,历史数据包括发生各 种气象灾害的具体时间,一段时期内发生该气象灾害的次数,以及每次发生该 气象灾害时对应的气象因子数据;

(2)进行偏相关分析,确定待预测区域某段时期可能发生的主要气象灾害;

(3)采用逐步回归法,对步骤(2)中确定的各个主要气象灾害分别建立 气象灾害与气象因子的映射关系方程式,并进行F检验,如果显著水平P不能 满足P<设定阈值,则剔除该主要气象灾害,否则保留由该主要气象灾害建立的 气象灾害与气象因子的映射关系方程式;

(4)预测待预测区域某段时期的气象因子参数值,并将预测的气象因子参 数值代入步骤(3)中保留的气象灾害与气象因子的映射关系方程式中,得出发 生相应气象灾害的概率值。

进一步的,步骤(1)中所述气象灾害包括风灾、洪涝、雷电、大雾、地质 灾害、凝冻覆冰和山火,所述气象因子包括气温、气压、湿度、风速、蒸发量、 降水和日照。

进一步的,步骤(2)中所述主要气象灾害为任意两个偏相关系数大于等于 -1且小于等于1的气象灾害。确定主要气象灾害,即是预测待预测区域某段时 期可能发生的主要气象灾害。

进一步的,所述步骤(4)中,采用弹性系数法、时间序列法或趋势外推法 预测待预测区域某段时期的气象因子参数值。

进一步的,步骤(3)中对各个主要气象灾害分别建立气象灾害与气象因子 的映射关系方程式之后,进行t检验。采用t检验代替F检验,可缩短气象灾 害与气象因子的映射关系方程式的建立时间。

进一步的,步骤(3)之后还包括步骤(3-1):采用偏相关分析方法确定引 发各个气象灾害的主要气象因子,如果在气象灾害与气象因子的映射关系方程 式中,气象因子对应的系数大于F检验参数或t检验参数、且任意两个气象因 子的偏相关系数取值在-1至1之间,则该气象因子为引发相应气象灾害的主要 气象因子。首先预测出待预测区域可能发生的主要气象灾害之后,再预测出引 发该主要气象灾害的主要气象因子,为减小甚至避免气象灾害对电网的损坏提 供更好的决策支持。

与现有技术相比,本发明的有益效果:

本发明基于多元线性回归算法的气象灾害预测方法,利用多元线 性回归算法首先确定待预测区域在某个特定时期可能发生哪些主要 气象灾害,然后建立气象因子与气象灾害的映射关系方程式,最后代 入气象因子参数值即可预测出各种气象灾害发生的概率值。本发明方 法可以预测出待预测区域在某个特定时期可能发生哪些气象灾害,以 及各气象灾害发生的概率值,根据气象灾害发生的概率值采取相应的 防护措施,为电网的安全防护提供了良好的决策支持。

本发明基于多元线性回归算法的气象灾害预测方法,将多元线性 回归算法应用于气象灾害预测技术,建立气象灾害与气象因子的映射 关系方程式。建立气象灾害与气象因子的映射关系方程式时,只需要 收集气象因子参数值,对样本数据的要求较低,克服了利用灰色预测 模型中的拓扑模型预测方法中对样本数据要求较高的缺陷;本发明方 法可应用于各种环境,根据各地区域不同的气象因子参数值得到该地 区域相应的映射关系方程式系数,适应性强;本发明方法的计算过程 相对简单且不需要反复调试,具有广泛应用价值。

附图说明:

图1为本发明基于多元线性回归算法的气象灾害预测方法流程 图。

具体实施方式

下面结合试验例及具体实施方式对本发明作进一步的详细描述。 但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基 于本发明内容所实现的技术均属于本发明的范围。

本发明提供了一种基于多元线性回归算法的气象灾害预测方法, 首先,基于多元线性回归算法确定待预测区域特定时期的主要气象灾 害,然后分别建立各种主要气象灾害与气象因子的映射关系方程式; 最后在各种气象灾害与气象因子的映射关系方程式中带入预测的气 象因子参数值,得出相应气象灾害发生的概率值。在映射关系方程式 中带入预测的某个特定时刻的气象因子参数值,即可得出该特定时刻 气象灾害发生的概率值。特定时刻的气象因子参数值通过弹性系数 法、时间序列法,趋势外推法等经典方法计算得到。根据气象灾害发 生的概率值,采取相应的防护措施,尽可能的减小气象灾害造成的危 害与损失。气象学中,一般将气象灾害分为7类,分别是风灾、洪涝、 雷电、大雾、地质灾害、凝冻覆冰和山火,因此所述气象灾害为7类 中的一种,所述气象因子包括气温、气压、湿度、风速、蒸发量、降 水和日照。

参考图1,具体的,本发明基于多元线性回归算法的气象灾害预 测方法,包括步骤:

(1)收集待预测区域电网发生各种气象灾害的历史数据,历史 数据包括发生各种气象灾害的具体时间,一段时期内发生该气象灾害 的次数,以及每次发生该气象灾害时对应的气象因子数值。一般收集 5-10年内待预测区域电网气象灾害发生的历史数据。

(2)进行偏相关分析,提取主要因变量。

在有多个因变量的多元线性回归方程中,多个相关变量(任意两 个因变量之间存在一定的相关关系,因此在偏相关分析中,将因变量 称为相关变量)间的关系是较为复杂的,任何两个相关变量间常常存 在不同程度的简单相关关系,但是这种相关关系又包含有其他相关变 量的影响。因此简单相关分析(即直线相关分析)没有考虑其他相关 变量对这两个相关变量的影响,实际上并不能真实反映两个相关变量 间的相关关系。而只有消除了其他相关变量的影响之后,研究两个相 关变量间的相关性,才能真实地反映这两个相关变量间相关的性质与 密切程度。偏相关分析就是固定其他相关变量不变而研究某两个相关 变量间相关性的统计分析方法。

在气象灾害与气象因子的映射关系方程式中,气象因子为自变 量,气象灾害为因变量。本发明方法中,主要因变量的含义是:7个 气象灾害中,两个气象灾害之间的偏相关系数取值在-1至1之间, 则称这两个气象灾害为主要因变量。

提取主要因变量的过程是:

①根据收集的历史数据建立观测数据表,如表1所示。表1中, x1、x2、…、xm分别表示某种气象灾害自有统计以来累计发生的总次 数,本实施例中,m=7,即x1、x2、…、xm分别表示7种气象灾害中的一 种气象灾害自有统计以来累计发生的总次数,例如 x1=x11+x12+…+x1n。n为序号,表示有n组观测数据,每组数据是在 一个特定时期采集所得。xmn表示在统计的一个特定时期发生某种气 象灾害的次数,例如x11,假设x1为统计的洪涝灾害累计发生的总次数, 序号1表示采集的2005年6月的气象灾害数据,则x11表示2005年6 月发生洪涝灾害的次数。

表1

②计算两个相关变量的偏相关系数,其计算方法如下:

首先计算简单相关系数,即直线相关系数rij:其 中:i=1、2、…、m,j=1、2、…、m,SPij=Σ(xi-xi)(xj-xj),SSi=Σ(xi-xi)2,SSj=Σ(xj-xj)2,其中,xi与xj分别表示i 和j所代表的气象灾害自有统计资料以来累计发生的总次数,和分别表示对应的气象灾害的年平均发生次数。由简单相关系数rij组成 相关系数矩阵R:R=r11r12···r1mr21r22···r2m············rm1rm2···rmm,然后求相关系数矩阵R 的逆矩阵C:

C=R-1=c11c12···c1mc21c22···c2m············cm1cm2···cmm

则相关变量xi与xj的偏相关系数rij'的计算公式为:

rij,=-cijciicjj,i=1、2、…、m;j=1、2、…、m;i≠j

只要rij'取值在-1至1之间,则两个因变量xi与xj为主要因变量, 其余为次要因变量。

(3)采用逐步回归法,对步骤(2)中确定的各个主要因变量分 别建立气象灾害与气象因子的映射关系方程式, y=b0+b1x1+b2x2+…+bmxm,并进行F检验,如果显著水 平P不能满足P<0.01的要求,则该主要因变量建立的映射关系方 程式不符合要求,剔除该主要因变量,否则保留该主要因变量建立的 气象灾害与气象因子的映射关系方程式。其中,m≤7,x1、x2、…、xm分别表示自变量,即分别表示气象因子,y表示主要因变量,即主要 气象灾害,y为7种气象灾害(风灾、洪涝、雷电、大雾、地质灾害、 凝冻覆冰、山火)中的一种,b0为参考常数,b1、b2、…、bm为回归 系数。

建立气象灾害与气象因子的映射关系方程式时,输入收集的历史 数据中特定时期发生各气象灾害时对应的气象因子数值,采用SPSS 建模工具即可完成映射关系方程式的建立。由于建立气象灾害与气象 因子的映射关系方程式时,只需要输入收集的历史数据中气象因子参 数值,对样本数据的要求较低,克服了利用灰色预测模型中的拓扑模 型预测方法中对样本数据要求较高的缺陷。同时,根据各地区域不同 的气象因子参数值可得到该地区域相应的映射关系方程式系数,适应 于不同区域不同时期气象因子的多变性,适应性强。

显著水平P是多元线性回归算法中的常见参数,显著水平P由F 检验参数查表所得,F检验参数由计算所得。多元线性回归算法是数 学理论研究中常用到的一种算法,本发明方法中F检验方法、显著水 平P计算和F检验参数计算与多元线性回归算法中的相应计算方式一 致,均为现有技术,此处不作赘述。

t检验是多元线性回归算法中显著性检验的一种,在普通二乘法 下F检验可以和t检验等效。如表2所示,通过试验,采用相同的历 史数据,采用t检验建立气象灾害与气象因子的映射关系方程式所需 的时间少于采用F检验建立映射关系方程式所需的时间,因此,作为 一种优选方式,建立气象灾害与气象因子的映射关系方程式时采用t 检验。

表2

  F检验 t检验 建模时间(S) 2.14 1.825

(4)用偏相关分析方法进一步分析步骤(3)中保留的各个气象 灾害与气象因子的映射关系方程式,确定各个气象灾害与气象因子的 映射关系方程式中的主要自变量,然后将主要自变量全部保留于气象 灾害与气象因子的映射关系方程式中。偏相关分析方法同步骤(2) 中的步骤②,只是计算使用的数据由气象灾害换作为气象因子。偏相 关系数取值在-1至1之间且映射关系方程式中回归系数大于F检验 参数或t检验参数的自变量为主要自变量。

(5)气象灾害与气象因子的映射关系方程式建立完成后,在该 映射关系方程式中代入通过弹性系数法、时间序列法,趋势外推法等 经典方法预测的特定时刻的气象因子参数值,即可求出该特定时刻发 生相应气象灾害的概率值。

本发明基于多元线性回归算法的气象灾害预测方法,将多元线性 回归算法与气象灾害建模相结合,只需要收集气象因子参数值,即可 完成气象灾害与气象因子的映射关系方程式的建立,对样本数据的要 求不高,而且可根据各区域不同的气象因子值得到不同的映射关系方 程式系数,可应用于各种环境,适应性强。此外,本发明方法的计算 过程相对简单且不需要反复调试,具有广泛应用价值。

下面以洪涝气象灾害为例,对本发明方法中针对具体的气象灾 害,建立气象灾害与气象因子的映射关系方程式,以及预测发生该气 象灾害的概率值的过程进行更详细的阐述。

(1)收集历史数据,如表3所示(仅收集了待预测区域2005年 至2012年间特定时期各气象因子的平均数值)。

表3

(2)利用SPSS建模工具,输入上述表3所示的数据,建立洪涝 灾害与气象因子的映射关系方程式,为 y=0.551+0.132x1+0.004x2+0.622x3+0.561x4+0.231x5+0.832x6+0.417x7,其中,x1至x7分别依次表示气温、气压、湿度、风速、蒸发量、降 水和日照。由于气象因子x3,x4,x6,x7对应的系数值都大于F检验参 数0.407(在确定洪涝灾害为主要因变量的过程中,已计算出F检验 的参数为0.407),因此可知湿度、风速、降水和日照为主要气象因 子,即湿度、风速、降水和日照为待预测区域发生洪涝灾害的主要影 响因素。由于降水气象因子对应的系数值最大,因此降水为影响洪涝 灾害的最大气象因子。

(3)采用弹性系数法预测待预测区域特定时刻各气象因子参数 值。例如预测2013年5月该待预测区域的气温。采用(收集的历史 数据中)最近年份和最远年份的数据计算弹性系数ET,ET=log (19.5/18.4)/(2012.42/2005.5)=1.06,在根据有 1.06=(T2/19.5)/[(2013.42/2012.42)*0.58],T2=20.68,即预测的2013 年5月该待预测区域的气温为20.68摄氏度。

(4)将预测的所有气象因子的参数值代入映射关系方程式 y=0.551+0.132x1+0.004x2+0.622x3+0.561x4+0.231x5+0.832x6+0.417x7中,即可计算出待预测区域在特定时期发生洪涝灾害的概率值。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号