首页> 中国专利> 基于多元线性回归算法的气象灾害预测方法

基于多元线性回归算法的气象灾害预测方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于多元线性回归算法的气象灾害预测方法。本发明方法首先根据历史数据确定待预测区域特定时期的主要气象灾害，然后分别建立各种主要气象灾害与气象因子的映射关系方程式；最后在各种气象灾害与气象因子的映射关系方程式中带入预测的气象因子参数值，得出相应气象灾害发生的概率值。本发明方法将多元线性回归算法应用于气象灾害预测技术，建立气象灾害与气象因子的映射关系方程式，只需要收集气象因子参数值，对样本数据的要求不高；本发明方法可应用于各种环境，根据各地不同的气象因子值得到不同的映射关系方程式系数，适应性强；本发明方法的计算过程相对简单且不需要反复调试，具有广泛应用价值。

著录项

公开/公告号CN104156775A

专利类型发明专利
公开/公告日2014-11-19

原文格式PDF
申请/专利权人贵州电网公司电力调度控制中心;四川大学;
展开▼

申请/专利号CN201310270367.0
发明设计人苏华英;汪明清;张勇;田年杰;朱椤方;黄晓旭;林成;周步祥;舒勤;陈实;滕欢;刘念;李华强;邱晓燕;
展开▼

申请日2013-06-28
分类号G06Q10/04(20120101);
代理机构51221 四川力久律师事务所;
代理人熊晓果;王芸
地址 550002 贵州省贵阳市解放路251号
入库时间 2023-12-17 03:14:26

法律信息

法律状态公告日

法律状态信息

法律状态
2017-06-13

授权

授权
2014-12-17

实质审查的生效 IPC(主分类):G06Q10/04 申请日:20130628

实质审查的生效
2014-11-19

公开

公开

说明书

技术领域

本发明涉及电力系统气象灾害防护技术领域，特别涉及一种基于多元线性回归算法的气象灾害预测方法。

背景技术

气象灾害是对电网造成重大影响，使得电网遭受巨大损失的重要因素之一。我国是世界上自然灾害最为严重的国家之一，灾害种类多、分布地域广、发生频率高、造成损失严重。并且由于我国传统电网建设过程中较多的考虑电网内部构造的供电可靠性与整体安全性，对于外界因素对电网侵损所造成损失的预防与控制水平还不够高，所以每当遭遇重大气象灾害时，往往会导致电网难以正常运转，严重时还会产生系统崩溃现象。气象因子与气象灾害的成因有关，因此建立气象因子与气象灾害之间的映射联系，根据历史数据计算气象灾害发生的概率，是目前预测气象灾害的主要手段。

由于气象灾害种类繁多，同时气象因子对气象灾害的成因影响关系复杂，因此如何建立气象因子与气象灾害之间的映射联系，一直是气象学中的重点和难点问题之一。经过长期研究，目前气象学中通常采用以下三种方法建立气象因子与气象灾害之间的映射联系：一是利用灰色预测模型中的拓扑模型，利用绘制曲线来建立自变量（气象因子）与因变量（气象灾害）关系，从而得到与预测未来数值的模型，但是该模型的建立对样本数据要求较高，一旦原始数据有波动就极易产生预测坏点；二是采取平稳时间序列分析法，根据统计学统计出的因果关系建立方程，求得相关系数，该方法的缺陷是模型一旦建立，系数就确定不变，无法适应多变的天气现象演变规律；三是用周期叠加等非线性预测模型建立曲线方程，通过海温格点对未来趋势进行预测，该方法预测精度较高，但是计算复杂且需要对结果进行多次调试，在实际中难以得到较好应用。

发明内容

本发明的目的在于克服现有技术中所存在的样本数据要求高、适应能力差、计算过程复杂等不足，提供一种基于多元线性回归算法的气象灾害预测方法，为气象灾害防护提供很好的决策支持。

为了实现上述发明目的，本发明提供了以下技术方案：

一种基于多元线性回归算法的气象灾害预测方法，包括步骤：

（1）收集待预测区域发生各种气象灾害的历史数据，历史数据包括发生各种气象灾害的具体时间，一段时期内发生该气象灾害的次数，以及每次发生该气象灾害时对应的气象因子数据；

（2）进行偏相关分析，确定待预测区域某段时期可能发生的主要气象灾害；

（3）采用逐步回归法，对步骤（2）中确定的各个主要气象灾害分别建立气象灾害与气象因子的映射关系方程式，并进行F检验，如果显著水平P不能满足P＜设定阈值，则剔除该主要气象灾害，否则保留由该主要气象灾害建立的气象灾害与气象因子的映射关系方程式；

（4）预测待预测区域某段时期的气象因子参数值，并将预测的气象因子参数值代入步骤（3）中保留的气象灾害与气象因子的映射关系方程式中，得出发生相应气象灾害的概率值。

进一步的，步骤（1）中所述气象灾害包括风灾、洪涝、雷电、大雾、地质灾害、凝冻覆冰和山火，所述气象因子包括气温、气压、湿度、风速、蒸发量、降水和日照。

进一步的，步骤（2）中所述主要气象灾害为任意两个偏相关系数大于等于 -1且小于等于1的气象灾害。确定主要气象灾害，即是预测待预测区域某段时期可能发生的主要气象灾害。

进一步的，所述步骤（4）中，采用弹性系数法、时间序列法或趋势外推法预测待预测区域某段时期的气象因子参数值。

进一步的，步骤（3）中对各个主要气象灾害分别建立气象灾害与气象因子的映射关系方程式之后，进行t检验。采用t检验代替F检验，可缩短气象灾害与气象因子的映射关系方程式的建立时间。

进一步的，步骤（3）之后还包括步骤（3-1）：采用偏相关分析方法确定引发各个气象灾害的主要气象因子，如果在气象灾害与气象因子的映射关系方程式中，气象因子对应的系数大于F检验参数或t检验参数、且任意两个气象因子的偏相关系数取值在-1至1之间，则该气象因子为引发相应气象灾害的主要气象因子。首先预测出待预测区域可能发生的主要气象灾害之后，再预测出引发该主要气象灾害的主要气象因子，为减小甚至避免气象灾害对电网的损坏提供更好的决策支持。

与现有技术相比，本发明的有益效果：

本发明基于多元线性回归算法的气象灾害预测方法，利用多元线性回归算法首先确定待预测区域在某个特定时期可能发生哪些主要气象灾害，然后建立气象因子与气象灾害的映射关系方程式，最后代入气象因子参数值即可预测出各种气象灾害发生的概率值。本发明方法可以预测出待预测区域在某个特定时期可能发生哪些气象灾害，以及各气象灾害发生的概率值，根据气象灾害发生的概率值采取相应的防护措施，为电网的安全防护提供了良好的决策支持。

本发明基于多元线性回归算法的气象灾害预测方法，将多元线性回归算法应用于气象灾害预测技术，建立气象灾害与气象因子的映射关系方程式。建立气象灾害与气象因子的映射关系方程式时，只需要收集气象因子参数值，对样本数据的要求较低，克服了利用灰色预测模型中的拓扑模型预测方法中对样本数据要求较高的缺陷；本发明方法可应用于各种环境，根据各地区域不同的气象因子参数值得到该地区域相应的映射关系方程式系数，适应性强；本发明方法的计算过程相对简单且不需要反复调试，具有广泛应用价值。

附图说明：

图1为本发明基于多元线性回归算法的气象灾害预测方法流程图。

具体实施方式

下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例，凡基于本发明内容所实现的技术均属于本发明的范围。

本发明提供了一种基于多元线性回归算法的气象灾害预测方法，首先，基于多元线性回归算法确定待预测区域特定时期的主要气象灾害，然后分别建立各种主要气象灾害与气象因子的映射关系方程式；最后在各种气象灾害与气象因子的映射关系方程式中带入预测的气象因子参数值，得出相应气象灾害发生的概率值。在映射关系方程式中带入预测的某个特定时刻的气象因子参数值，即可得出该特定时刻气象灾害发生的概率值。特定时刻的气象因子参数值通过弹性系数法、时间序列法，趋势外推法等经典方法计算得到。根据气象灾害发生的概率值，采取相应的防护措施，尽可能的减小气象灾害造成的危害与损失。气象学中，一般将气象灾害分为7类，分别是风灾、洪涝、雷电、大雾、地质灾害、凝冻覆冰和山火，因此所述气象灾害为7类中的一种，所述气象因子包括气温、气压、湿度、风速、蒸发量、降水和日照。

参考图1，具体的，本发明基于多元线性回归算法的气象灾害预测方法，包括步骤：

（1）收集待预测区域电网发生各种气象灾害的历史数据，历史数据包括发生各种气象灾害的具体时间，一段时期内发生该气象灾害的次数，以及每次发生该气象灾害时对应的气象因子数值。一般收集 5-10年内待预测区域电网气象灾害发生的历史数据。

（2）进行偏相关分析，提取主要因变量。

在有多个因变量的多元线性回归方程中，多个相关变量（任意两个因变量之间存在一定的相关关系，因此在偏相关分析中，将因变量称为相关变量）间的关系是较为复杂的，任何两个相关变量间常常存在不同程度的简单相关关系，但是这种相关关系又包含有其他相关变量的影响。因此简单相关分析（即直线相关分析）没有考虑其他相关变量对这两个相关变量的影响，实际上并不能真实反映两个相关变量间的相关关系。而只有消除了其他相关变量的影响之后，研究两个相关变量间的相关性，才能真实地反映这两个相关变量间相关的性质与密切程度。偏相关分析就是固定其他相关变量不变而研究某两个相关变量间相关性的统计分析方法。

在气象灾害与气象因子的映射关系方程式中，气象因子为自变量，气象灾害为因变量。本发明方法中，主要因变量的含义是：7个气象灾害中，两个气象灾害之间的偏相关系数取值在-1至1之间，则称这两个气象灾害为主要因变量。

提取主要因变量的过程是：

①根据收集的历史数据建立观测数据表，如表1所示。表1中， x₁、x₂、…、x_m分别表示某种气象灾害自有统计以来累计发生的总次数，本实施例中，m=7，即x₁、x₂、…、x_m分别表示7种气象灾害中的一种气象灾害自有统计以来累计发生的总次数，例如 x₁=x₁₁+x₁₂+…+x_1n。n为序号，表示有n组观测数据，每组数据是在一个特定时期采集所得。x_mn表示在统计的一个特定时期发生某种气象灾害的次数，例如x₁₁，假设x₁为统计的洪涝灾害累计发生的总次数，序号1表示采集的2005年6月的气象灾害数据，则x₁₁表示2005年6 月发生洪涝灾害的次数。

表1

②计算两个相关变量的偏相关系数，其计算方法如下：

首先计算简单相关系数，即直线相关系数r_ij：其中：i=1、2、…、m，j=1、2、…、m， ${SP}_{ij} = Σ (x_{i} - {\overline{x}}_{i}) (x_{j} - {\overline{x}}_{j}),$ ${SS}_{i} = Σ {(x_{i} - {\overline{x}}_{i})}^{2},$ ${SS}_{j} = Σ {(x_{j} - {\overline{x}}_{j})}^{2},$ 其中，x_i与x_j分别表示i 和j所代表的气象灾害自有统计资料以来累计发生的总次数，和分别表示对应的气象灾害的年平均发生次数。由简单相关系数r_ij组成相关系数矩阵R： $R = (\begin{matrix} r_{11} & r_{12} & \cdot \cdot \cdot & r_{1 m} \\ r_{21} & r_{22} & \cdot \cdot \cdot & r_{2 m} \\ \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot \cdot \cdot & \cdot \\ \cdot & \cdot & \cdot \\ r_{m 1} & r_{m 2} & \cdot \cdot \cdot & r_{mm} \end{matrix}),$ 然后求相关系数矩阵R 的逆矩阵C：

$C = R^{- 1} = (\begin{matrix} c_{11} & c_{12} & \cdot \cdot \cdot & c_{1 m} \\ c_{21} & c_{22} & \cdot \cdot \cdot & c_{2 m} \\ \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot \cdot \cdot & \cdot \\ \cdot & \cdot & \cdot \\ c_{m 1} & c_{m 2} & \cdot \cdot \cdot & c_{mm} \end{matrix})$

则相关变量x_i与x_j的偏相关系数_rij'的计算公式为：

${r_{ij}}^{,} = \frac{- c_{ij}}{\sqrt{c_{ii} c_{jj}}},$ i=1、2、…、m;j=1、2、…、m;i≠j

只要r_ij'取值在-1至1之间，则两个因变量x_i与x_j为主要因变量，其余为次要因变量。

（3）采用逐步回归法，对步骤（2）中确定的各个主要因变量分别建立气象灾害与气象因子的映射关系方程式， y=b₀+b₁x₁+b₂x₂+…+b_mx_m，并进行F检验，如果显著水平P不能满足P<0.01的要求，则该主要因变量建立的映射关系方程式不符合要求，剔除该主要因变量，否则保留该主要因变量建立的气象灾害与气象因子的映射关系方程式。其中，m≤7，x₁、x₂、…、x_m分别表示自变量，即分别表示气象因子，y表示主要因变量，即主要气象灾害，y为7种气象灾害（风灾、洪涝、雷电、大雾、地质灾害、凝冻覆冰、山火）中的一种，b₀为参考常数，b₁、b₂、…、b_m为回归系数。

建立气象灾害与气象因子的映射关系方程式时，输入收集的历史数据中特定时期发生各气象灾害时对应的气象因子数值，采用SPSS 建模工具即可完成映射关系方程式的建立。由于建立气象灾害与气象因子的映射关系方程式时，只需要输入收集的历史数据中气象因子参数值，对样本数据的要求较低，克服了利用灰色预测模型中的拓扑模型预测方法中对样本数据要求较高的缺陷。同时，根据各地区域不同的气象因子参数值可得到该地区域相应的映射关系方程式系数，适应于不同区域不同时期气象因子的多变性，适应性强。

显著水平P是多元线性回归算法中的常见参数，显著水平P由F 检验参数查表所得，F检验参数由计算所得。多元线性回归算法是数学理论研究中常用到的一种算法，本发明方法中F检验方法、显著水平P计算和F检验参数计算与多元线性回归算法中的相应计算方式一致，均为现有技术，此处不作赘述。

t检验是多元线性回归算法中显著性检验的一种，在普通二乘法下F检验可以和t检验等效。如表2所示，通过试验，采用相同的历史数据，采用t检验建立气象灾害与气象因子的映射关系方程式所需的时间少于采用F检验建立映射关系方程式所需的时间，因此，作为一种优选方式，建立气象灾害与气象因子的映射关系方程式时采用t 检验。

表2

F检验 t检验建模时间(S) 2.14 1.825

（4）用偏相关分析方法进一步分析步骤（3）中保留的各个气象灾害与气象因子的映射关系方程式，确定各个气象灾害与气象因子的映射关系方程式中的主要自变量，然后将主要自变量全部保留于气象灾害与气象因子的映射关系方程式中。偏相关分析方法同步骤（2）中的步骤②，只是计算使用的数据由气象灾害换作为气象因子。偏相关系数取值在-1至1之间且映射关系方程式中回归系数大于F检验参数或t检验参数的自变量为主要自变量。

（5）气象灾害与气象因子的映射关系方程式建立完成后，在该映射关系方程式中代入通过弹性系数法、时间序列法，趋势外推法等经典方法预测的特定时刻的气象因子参数值，即可求出该特定时刻发生相应气象灾害的概率值。

本发明基于多元线性回归算法的气象灾害预测方法，将多元线性回归算法与气象灾害建模相结合，只需要收集气象因子参数值，即可完成气象灾害与气象因子的映射关系方程式的建立，对样本数据的要求不高，而且可根据各区域不同的气象因子值得到不同的映射关系方程式系数，可应用于各种环境，适应性强。此外，本发明方法的计算过程相对简单且不需要反复调试，具有广泛应用价值。

下面以洪涝气象灾害为例，对本发明方法中针对具体的气象灾害，建立气象灾害与气象因子的映射关系方程式，以及预测发生该气象灾害的概率值的过程进行更详细的阐述。

（1）收集历史数据，如表3所示（仅收集了待预测区域2005年至2012年间特定时期各气象因子的平均数值）。

表3

（2）利用SPSS建模工具，输入上述表3所示的数据，建立洪涝灾害与气象因子的映射关系方程式，为 y=0.551+0.132x₁+0.004x₂+0.622x₃+0.561x₄+0.231x₅+0.832x₆+0.417x₇，其中，x₁至x₇分别依次表示气温、气压、湿度、风速、蒸发量、降水和日照。由于气象因子x₃,x₄,x₆,x₇对应的系数值都大于F检验参数0.407（在确定洪涝灾害为主要因变量的过程中，已计算出F检验的参数为0.407），因此可知湿度、风速、降水和日照为主要气象因子，即湿度、风速、降水和日照为待预测区域发生洪涝灾害的主要影响因素。由于降水气象因子对应的系数值最大，因此降水为影响洪涝灾害的最大气象因子。

（3）采用弹性系数法预测待预测区域特定时刻各气象因子参数值。例如预测2013年5月该待预测区域的气温。采用（收集的历史数据中）最近年份和最远年份的数据计算弹性系数ET，ET=log （19.5/18.4）/(2012.42/2005.5)=1.06,在根据有 1.06=(T₂/19.5)/[(2013.42/2012.42)*0.58],T₂=20.68，即预测的2013 年5月该待预测区域的气温为20.68摄氏度。

（4）将预测的所有气象因子的参数值代入映射关系方程式 y=0.551+0.132x₁+0.004x₂+0.622x₃+0.561x₄+0.231x₅+0.832x₆+0.417x₇中，即可计算出待预测区域在特定时期发生洪涝灾害的概率值。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于多元线性回归算法的气象灾害预测方法 [P] . 中国专利： CN104156775B . 2017.06.13
2. 基于多元线性回归算法的气象灾害预测方法 [P] . 中国专利： CN104156775A . 2014-11-19
3. ON-LINE PREDICTION METHOD OF SURFACE ROUGHNESS OF PARTS BASED ON SDAE-DBN ALGORITHM [P] . US2021287098A1 . 2021-09-16

机译：基于SDAE-DBN算法的部件表面粗糙度的在线预测方法
4. Machine Learning Inverse Prediction Method Using Genetic Algorithm [P] . KR20210136332A . 2021-11-17

机译：基于遗传算法的机器学习逆预测方法
5. Rating Prediction Method for Recommendation Algorithm Based on Observed Ratings and Similarity Graphs [P] . KR102323424B1 . 2021-11-09

机译：基于观察评级和相似性图的推荐算法评级预测方法