首页> 中国专利> 基于多元周期平稳时序分析及灰色理论的水华预测及因素分析方法

基于多元周期平稳时序分析及灰色理论的水华预测及因素分析方法

摘要

本发明公开了一种基于多元周期平稳时序分析及灰色理论的水华预测及因素分析方法,属于环境工程技术领域。所述方法包括进行监测数据采集及预处理;特征因素筛选;特征因素时序建模;特征因素时序预测和特征因素分析的步骤。本发明解决了多元时序的多元周期平稳性检验问题;给出了水华特征因素的筛选方法,为水华特征因素多元时序的合理建模提供了必要的条件,也为水华特征因素的因素分析提供了基础。本发明对多特征因素的水华形成过程描述更加全面,从而提高了水华预测结果的准确度、可信度。根据本发明方法给出的水华预测结果与实测数据的误差,可以得到各影响因素与水华发生现象联系的密切程度。

著录项

  • 公开/公告号CN103049669A

    专利类型发明专利

  • 公开/公告日2013-04-17

    原文格式PDF

  • 申请/专利权人 北京工商大学;

    申请/专利号CN201310004851.9

  • 发明设计人 王立;刘载文;

    申请日2013-01-07

  • 分类号G06F19/00;

  • 代理机构北京永创新实专利事务所;

  • 代理人姜荣丽

  • 地址 100048 北京市海淀区阜成路33号

  • 入库时间 2024-02-19 18:33:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-09-23

    授权

    授权

  • 2013-05-15

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20130107

    实质审查的生效

  • 2013-04-17

    公开

    公开

说明书

技术领域

本发明涉及一种水华预测及因素分析方法,属于环境工程技术领域。

背景技术

水华是指出现在富营养化水体中,当具备适宜的光照、水温、气候及水文等有利于藻类 生长和聚集的环境条件时,藻类爆发性繁殖聚集并达到一定浓度的一种现象。大规模的水华 危害很大,它不仅会破坏水体生态系统的结构和功能,危害人类健康,而且还会降低水资源 利用效能,威胁水资源的可持续开发和利用,造成巨大的经济损失。从总体上看,目前还缺 少能在短期内有效治理水华的技术和手段。因此在水华未得到有效治理之前,对水华的发生 进行准确预测便于有关部门采取应对措施,降低危害,因此,水华防治具有重要的科学意义 和应用价值。

在水华的防治工作中,水华预测一直都是一个难点,这是因为水华形成的随机过程是一 个复杂的物理、化学和生物综合反应过程,与水华形成有关的特征因素较多,相互作用关系 密切,构成一个复杂的水生生态系统,由于生态过程内在机制的复杂性、人类活动的影响及 水质信息自动测报、接收等条件的限制,目前对水华形成机理和爆发的成因还没有完全清楚, 因而直接建立水华机理生态模型比较困难。随着水华预测研究的深入,部分学者尝试建立精 确可靠的数学模型来对水华形成的随机过程进行预测,取得了一定的进展。然而,现有的水 华预测方法仍存在预测精度不高,预测步长较短的问题。

此外,不同特征因素与水华形成的相关程度也不尽相同,因此水华形成的因素分析也是 水华防治工作中的一项重要任务。

时间序列分析是一种研究随机过程的重要数学预测工具。传统一元时间序列预测的基本 假设是可利用的信息都包含在历史数据中,历史数据决定了未来时间序列的变化,但是这种 假设过多的依赖于时间序列历史数据,而忽略了事物之间的关联性,也忽略了外部因素对时 间序列走势的影响。而多元时间序列的建模和预测则不仅考虑了时间序列历史数据对未来的 影响,更多的考虑到多元协方差和相关系数在建模过程中的重要作用,比一元时间序列建模 和预测更具备应用潜力,是一种适于描述和预测在多种特征因素作用下水华形成随机过程的 方法。因此采用多元时序分析方法,对水华形成的特征因素多元时序建模,从而进行水华预 测为一种有效途径。

然而,时序分析方法虽然可以充分挖掘数据中的随机性信息,该方法存在预测精度的保 证依赖于大样本量的局限。若采用常规的直接预测方法进行时序模型预测,则预测精度难以 保证,从而降低了水华预测结果的可信度。灰色理论是研究少数据不确定性的理论,即研究 在少数据不确定性的背景下,数据的处理、现象的分析、模型的建立、发展趋势的预测、事 物的决策以及系统的控制与状态的评估。采用灰色理论预测多元时序模型,可以在保留时序 建模优点的基础上,很好地克服时序模型预测的局限性,提高模型的预测精度。

另外,多元时序分析不仅适于建模预测,也是一种因素分析的有效工具。因此可利用多 元时序分析预测结果对水华形成过程中的各种特征因素进行因素分析。

应用多元时序分析及灰色理论进行水华预测及因素分析还需要解决以下问题:

1.由于水华的发生具有随机性,描述水华形成过程中各特征因素的随机性波动,不但需要考 虑了同一时刻多个特征因素之间的互相关性,还要考虑各特征因素在不同时刻的自相关性。

2.水华的发生与季节变化相关,因而水华的发生还具有周期性,描述水华形成过程中各特征 因素的周期性波动,不仅需要考虑周期性的环境季节变化对水华形成过程的影响,还要考虑 不同特征因素间多重周期性变化的交互影响。

3.水华形成过程中特征因素的随机性和周期性波动在不同特征因素间的交互影响也是需要考 虑的问题。

4.如何将适用于少数据预测灰色理论方法与所建的时序模型相结合,从而提高所建时序模型 的预测精度,需要具体研究。

5.如何基于所建的时序模型预测结果来进行水华特征因素分析。

发明内容

本发明的目的是为了解决现有的水华预测结果不够准确,水华形成过程中多种特征因素 间的交互影响建模困难,以及不同特征因素与水华发生的相关性程度的判定问题,采取基于 多元周期平稳时序分析以及灰色理论的技术手段,达到通过对水华形成过程中的特征因素时 序建模分析得到与实际情况更为相符的水华预测效果以及因素分析结果。

为便于说明,本说明书中所有未经解释的名词及字母含义均由下述假设解释:与水华现 象有关的特征因素分为两种:一种是影响水华发生的特征因素,例如氮、磷、pH值、溶解氧、 水温、光照度等,以下叫做影响因素;另一种是表征水华发生的特征因素,例如叶绿素浓度、 藻密度等,以下叫做表征因素。以Yt表示t时刻的特征因素向量;以yit表示第i个特征因素 在t时刻的量值,总采样时间为N,t=1,2,…,N,共有n个特征因素,i=1,2,…,n。

本发明提供的基于多元周期平稳时序分析及灰色理论的水华预测及因素分析方法主要包 括以下五个步骤:

步骤一、监测数据采集及预处理;

对可能影响或表征水华发生的多个特征因素进行监测。由监测设备采集到的多个特征因 素的监测数据随时间变化而变化,因此为多元时间序列。通常情况下,原始特征因素监测数 据包含有异常采样点、均值漂移以及部分采样点数据缺失等等现象,难以直接对其进行时序 分析。为消除这些现象对时序分析造成的影响,提高特征因素时序模型的拟合精度,并且统 一原始特征因素时序的初值,应对每个特征因素原始时序分别作预处理。

步骤二、特征因素筛选;

水华的发生具有随机性,并且与季节变化相关,因而水华的发生还具有周期性,因此其 特征因素的多元时序在自然界中呈现随机性、周期性变化,但其多个特征因素之间的变化机 理是相对稳定的,不会随时间变化,即特征因素的多元时序的方差不随时间而变化,因此特 征因素时序应为多元周期平稳时序。

为此需要对预处理后的特征因素多元时序进行多元周期平稳性检验,并根据多元周期平 稳性检验结果进行特征因素筛选,只有多元周期平稳性检验通过的特征因素才适合采用本发 明方法。本发明基于延迟交叉相关矩阵法给出多元周期平稳性检验方法,可见具体实施方式 中的步骤二。本发明的特征因素筛选方法如下:

1、每个特征因素的一元周期平稳性分析。由于一元周期平稳是多元周期平稳的必要条件, 因此首先对每个特征因素的一元周期时序进行一元周期平稳性检验。采用自相关函数检验方 法。将一元周期平稳性检验不通过的特征因素剔除;

2、对一元周期平稳性检验通过的所有表征因素,例如叶绿素浓度、藻密度等,采用本发 明给出的多元周期平稳性检验方法检验,找出能够通过多元周期平稳性检验的包含最多表征 因素的组合;

3、对通过多元周期平稳性检验的表征因素组合,加入尽可能多的通过一元周期稳定性检 验的影响因素,以组成新的特征因素组合,直至新组成的特征因素组合不能通过多元周期平 稳性检验或包含全部影响因素为止。

这样,根据特征因素筛选结果,对符合多元周期平稳条件的特征因素组合进行以下步骤 三和步骤四。

步骤三、特征因素时序建模;

1、确定特征因素时序结构;

水华特征因素的多元时序在自然界中呈现随机性、周期性变化,但不存在趋势性变化, 因此将t时刻的特征因素向量Yt分解为周期项Ct和随机项Rt的叠加,

Yt=Ct+Rt    (1)

Yt=y1ty2t...ynt,Ct=c1tc2t...cnt,Rt=r1tr2t...rnt

其中cit为第i个特征因素的周期项,rit为第i个特征因素的随机项,i=1,2,…,n,其中n为特 征因素的个数。

2、建立特征因素时序周期项模型;

由于多个特征因素之间周期性变化存在交互性影响,周期项Ct若采用一元周期模型描述 则无法反映这种交互性影响,本发明采用适用于挖掘数据潜在周期性规律以及反映多重周期 间交互性影响的多重潜周期模型描述,即

其中C(t)为多重潜周期模型的多重潜周期函数,q为潜周期角频率个数,ωj为第j个角频率, aij为多重潜周期模型的第i个特征因素的第j个角频率对应的幅值,为多重潜周期模型的 第i个特征因素的第j个角频率对应的相位,i=1,2,…,n。

3、建立特征因素时序随机项模型;

从Yt减去Ct后,对随机项,即Yt的平稳随机性部分Rt采用应用最广泛、建模简单且适 于预测的多元自回归模型描述,即

Rt=Σj=1pHjRt-j+Et---(3)

Et=ϵ1tϵ2t...ϵnt

其中p为多元自回归阶数,Hj为n×n多元自回归系数矩阵,Rt-j为在t-j时刻下的随机项,Et为n维白噪声向量,ηikj为第i个特征因素对第k个特征因素的多元自回归系数,εit为第i个 特征因素的白噪声,i,k=1,2,…,n。

4、建立特征因素多元周期平稳时序模型。

将周期项Ct的多重潜周期模型公式(2)与随机项Rt的多元自回归模型公式(3)结合。由于 水华形成过程机理复杂,其特征因素的随机性和周期性变化之间也可能存在交互影响,因此 随机项Rt和周期项Ct之间也可能具有相关性,若仅将二者的模型简单相加,则会忽略这种相 关性。为此,为了提高模型拟合精度,本发明将周期项多重潜周期模型代入随机项多元自回 归模型进行迭代运算,提出特征因素的多重潜周期多元自回归混合模型

Yt=Σj=1pHjYt-j+C*(t)+Et---(4)

其中Yt-j为在t-j时刻下的特征因素向量,C*(t)=Σj=1qb1jcos(ωjt+φ1j)Σj=1qb2jcos(ωjt+φ2j)...Σj=1qbnjcos(ωjt+φnj)为多重潜周期多元自回 归混合模型的多重潜周期函数,bij为多重潜周期多元自回归混合模型的第i个特征因素的第j 个角频率对应的幅值,φij为多重潜周期多元自回归混合模型的第i个特征因素的第j个角频 率对应的相位,i=1,2,…,n,其计算方法见具体实施方式步骤三。

步骤四、特征因素时序预测;

1、特征因素多重潜周期多元自回归混合模型预测;

根据最佳预测原理(即最小均方误差预测原理),本发明给出特征因素多重潜周期多元自 回归混合模型在t时刻向前预测l步的最佳预测值Yt+l计算公式:

Yt+l=Σj=1pHjYt+l-j+C*(t+l)---(5)

2、多重潜周期多元自回归混合模型灰色预测。

对于特征因素多重潜周期多元自回归混合模型,若用基于监测数据处理检验后得到的待 预测时序直接对未来预测,由于监测数据样本大小的限制,其精度往往不理想。灰色理论中 的系统灰色预测嵌套法,是针对某种构造的系统灰色预测模型,将GM(1,1)模型嵌入GM (1,N)模型求解,以获得各行为变量的预测值。本发明基于系统灰色预测嵌套法,将特征 因素多重潜周期多元自回归混合模型每一步预测值作为待预测时序的最后一个数据,并删去 待预测时序中第一个数据,再重新建立特征因素多重潜周期多元自回归混合模型,使模型时 刻得到修正,以此类推,直至预测到所要求的步数为止,这种嵌套预测法让待预测时序得以 吐故纳新,通常要比直接预测精度高。

步骤五、特征因素分析;

多元时序分析不仅适于预测,也是一种因素分析的有效工具。本发明利用前面的多元时 序分析预测结果给出水华特征因素的因素分析方法。

1、预测误差计算;

根据步骤二的特征因素筛选结果,对符合多元周期平稳条件的特征因素组合的多元周期 平稳时序采用本发明中的步骤三和步骤四建立多重潜周期多元自回归混合模型并进行灰色预 测后,将表征因素的预测数据与实测数据比较可得到预测误差,预测误差的计算方法见具体 实施方式中的步骤五。

2、因素分析;

因素分析的原则为:

(1)表征因素预测误差越小的特征因素组合,其组合内影响因素与表征因素的相关性越高, 反之则越低;

(2)在一个特征因素组合中,若加入一个或多个影响因素后,其表征因素预测误差与加入 前相比显著变小,则说明加入的影响因素与表征因素显著相关,其显著性判断标准见具体实 施方式中的步骤五;

(3)在一个特征因素组合中,若加入一个或多个影响因素后,其表征因素预测误差与影响 因素加入前相比未显著变小,则说明加入的影响因素与表征因素基本无关。

通过这种因素分析,可以定性地得到水华特征因素中各影响因素与表征因素的相关程度, 即各影响因素与水华发生现象联系的密切程度。

本发明的优点在于:

1.本发明提出了基于延迟交叉相关矩阵法的多元周期平稳性检验方法,解决了多元时序 的多元周期平稳性检验问题。

2.本发明根据所提出的多元周期平稳性检验方法,给出了水华特征因素的筛选方法,为 水华特征因素多元时序的合理建模提供了必要的条件,也为水华特征因素的因素分析提供了 基础。

3.本发明采用多重潜周期模型描述水华形成过程中各特征因素的周期性波动,考虑了周 期性的环境季节变化对水华形成过程的影响,其与一元潜周期模型相比,还考虑了不同特征 因素间多重周期性变化的交互影响。

4.本发明采用多元自回归模型描述水华形成过程中各特征因素的随机性波动,其与一元 自回归模型相比,不但考虑了同一时刻多个特征因素之间的互相关性,同时考虑了各特征因 素在不同时刻的自相关性。

5.本发明提出了水华特征因素的多重潜周期多元自回归混合模型,该模型将多重潜周期 模型代入多元自回归模型的迭代运算,并对两种模型参数联合求解,从而考虑了水华形成过 程中特征因素的随机性和周期性波动在不同特征因素间的交互影响,与仅将两种模型简单相 加的方法相比,本发明对多特征因素的水华形成过程描述更加全面,从而提高了水华预测结 果的准确度。

6.本发明提出了多重潜周期自回归模型的灰色预测方法,克服了多重潜周期多元自回归 混合模型预测精度依赖于大样本量的局限,提高了模型的预测精度,从而提高了水华预测结 果的可信度。

7.本发明提出了基于多元时序分析的水华特征因素分析方法,根据本发明方法给出的水 华预测结果与实测数据的误差,可以得到各影响因素与水华发生现象联系的密切程度。

附图说明

图1是本发明基于多元周期平稳时序及灰色理论的水华预测及因素分析方法的流程图;

图2是本发明多重潜周期多元自回归混合模型灰色预测的流程图;

图3是本发明特征因素组合的因素分析的流程图;

图4是实施例1中pH值的原始时序及预处理后时序;

图5是实施例1中耗氧量的原始时序及预处理后时序;

图6是实施例1中水温的原始时序及预处理后时序;

图7是实施例1中浊度的原始时序及预处理后时序;

图8是实施例1中氨氮的原始时序及预处理后时序;

图9是实施例1中总氮的原始时序及预处理后时序;

图10是实施例1中总磷的原始时序及预处理后时序;

图11是实施例1中溶解氧的原始时序及预处理后时序;

图12是实施例1中叶绿素的原始时序及预处理后时序;

图13是实施例1中藻密度的原始时序及预处理后时序;

图14是实施例1中采用四种方法对叶绿素的预测数据及实测数据;

图15是实施例1中采用四种方法对藻密度的预测数据及实测数据;

图中曲线编号分别为:1-实施例1中各相应特征因素的原始时序,2-实施例1中各相 应特征因素的预处理后时序,3-实施例1中各相应表征因素的实测数据,4-实施例1中各 相应表征因素采用一元周期平稳时序分析的预测数据,5-实施例1中各相应表征因素采用一 元周期平稳时序分析及灰色理论的预测数据,6-实施例1中各相应表征因素采用多元周期平 稳时序分析的预测数据,7-实施例1中各相应表征因素采用多元周期平稳时序分析及灰色理 论的预测数据。

具体实施方式

下面将结合附图和实施例1对本发明作进一步的详细说明。

本发明是一种基于多元周期平稳时序分析及灰色理论的水华预测及因素分析方法。

为便于说明,本说明书中所有未经解释的名词及字母含义均由下述假设解释:与水华现 象有关的特征因素分为两种:一种是影响水华发生的特征因素,例如氮、磷、pH值、溶解氧、 水温、光照度等,以下叫做影响因素;另一种是表征水华发生的特征因素,例如叶绿素浓度、 藻密度等,以下叫做表征因素。以Yt表示t时刻的特征因素向量;以yit表示第i个特征因素 在t时刻的量值,共有n个特征因素,i=1,2,…,n。

具体方法实施流程如图1所示,通过如下步骤实现:

步骤一、监测数据采集及预处理;

对可能影响或表征水华发生的多个特征因素进行监测。通常情况下,由监测设备采集到 的原始特征因素监测数据包含有异常采样点、均值漂移以及部分采样点数据缺失等等现象, 应对每个特征因素原始时序分别作预处理。本发明特征因素监测数据预处理方法为:

1、去除异常采样点,本发明去除绝对值大于3倍原始时序标准差的异常采样点。

2、去除均值漂移,本发明将原始时序减去其均值,使去除后的时序均值为零。

3、填补缺失数据,本发明以缺失数据的采样点前一个采样数据和缺失数据的采样点后一 个采样数据的均值来代替缺失数据的采样点。

步骤二、特征因素筛选;

对预处理后的特征因素多元时序进行多元周期平稳性检验,并根据多元周期平稳性检验 结果进行特征因素筛选。其多元周期平稳性检验方法如下:

记一组待检验的特征因素向量时序Yt,t=1,2,…,N的协方差矩阵为

Γ0=E[(Yt-E(Yt))(Yt-E(Yt))T]

则Γ0为n×n方阵。Yt的交叉相关矩阵为

y0=D-1Γ0D-1

其中由Γ0的对角元素(Γ11(0),…,Γnn(0))组成。则y0中元素可 表示为

yij(0)=Γij(0)Γii(0)Γjj(0),i,j=1,2,···,n

其中Γij(0)表示Γ0中第i行第j列元素。

将Yt的延迟k阶的协方差矩阵记为

Γk=E[(Yt-E(Yt))(Yt-k-E(Yt))T],t=1,2,…,N

其中Yt-k表示t-k时刻的特征因素向量。Γk同样为n×n方阵。Yt的延迟k阶交叉相关矩阵为

yk=D-1ΓkD-1

则yk中元素为

yij(k)=Γij(k)Γii(0)Γjj(0),i,j=1,2,···,n

其中,Γij(k)表示Γk中第i行第j列元素。

Γk可由

Γk=1N-kΣt=k+1N(Yt-Y)(Yt-k-Y)T

近似估计。其中Y=1NΣt=k+1NYt.

当Yt为多元周期性时序时,设其周期为Ti,i=1,2,…,q,则有

Yt=Yt+Ti

则Yt的延迟k+Ti阶的协方差矩阵为

Γk+Ti=E[(Yt-E(Yt))(Yt-(k+Ti)-E(Yt))T]=E[(Yt-E(Yt))(Yt-k-E(Yt))T]=Γk

可知,当Yt为多元周期性时序时,其延迟k阶的协方差矩阵Γk也具有周期性。

因此若前k个y=(y0,y1,…,yk),k≤N-1具有周期性波动的性质,则Yt的多元周期平稳性 检验通过。

步骤三、特征因素时序建模;

1、确定特征因素时序结构;

将t时刻的特征因素向量Yt按公式(1)分解为周期项Ct和随机项Rt的叠加。

2、建立特征因素时序周期项模型;

本发明采用多重潜周期模型公式(2)描述特征因素时序周期项Ct

3、建立特征因素时序随机项模型;

从Yt减去Ct后,对随机项即Yt的平稳随机性部分Rt采用多元自回归模型公式(3)描述。

4、建立特征因素多元周期平稳时序模型;

将周期项Ct的多重潜周期模型公式(2)与随机项Rt的多元自回归模型公式(3)结合为多重 潜周期多元自回归混合模型公式(4)。其结合方法如下:

设矩阵系数多项式

H(z)=I-Σj=1pHjzj

其中z为矩阵系数多项式的根,I为n×n单位阵。

则根据公式(3),有

H(B)Rt=(I-Σj=1pHjBj)Rt=Rt-Σj=1pHjRt-j=Et

其中B为时间t的向后推移算子。

上式两边同乘H-1(B),则随机项Rt可表示为

Rt=H-1(B)Εt

且有

det(I-Σj=1pHjzj)0,|z|1

将周期项Ct的多重潜周期模型的实值形式公式(2)写成复值的形式

Ct=C(t)=Σj=12qα1jexp(iλjt)Σj=12qα2jexp(iλjt)...Σj=12qαnjexp(iλjt)=Σj=12qαjexp(iλjt)---(6)

其中αkj为多重潜周期模型复值形式的第k个特征因素的第j个角频率对应的幅值,λj为多重 潜周期模型复值形式的第j个角频率,αj=α1jα2j...αnj.

利用公式(6)可将公式(1)写成

Yt=Ct+Rt=Σj=12qα1jexp(iλjt)Σj=12qα2jexp(iλjt)...Σj=12qαnjexp(iλjt)+H-1(B)Et=Σj=12qαjexp(iλjt)+H-1(B)Et---(7)

在上式(7)两边同时乘上H(B),取Η0=-I,得到

H(B)Yt=Σj=12qH(B)αjexp(iλjt)+Et

=-Σj=12q(Σl=0pHlαjexp(iλj(t-l)))+Et

=Σj=12q(-Σl=0pHlαjexp(iλjl))exp(iλjt)+Et

=Σj=12qβjexp(iλjt)+Et

其中

βkj≠0,k=1,2,…,n表示多重潜周期多元自回归混合模型复值形式的第k个特征因素的第j个 角频率对应的幅值。

于是,可以将公式(7)写成

Yt=Σj=1pHjYt-j+Σj=12qβjexp(iλjt)+Et---(8)

公式(8)是多重潜周期多元自回归混合模型的复值形式。其对应的实值形式即为多重潜周期多 元自回归混合模型公式(4)。

实值形式的多重潜周期多元自回归混合模型的幅值bij和相位φij,i=1,2,…,n,j=1,2,…,q的 估计为:

如果λq=π,取biq=βiqiq=0,ωq=π,

如果λj∈(0,π),取bij=2|βij|,ωj=λjij=arg(βij)。

步骤四、特征因素时序预测;

1、特征因素多元周期平稳时序模型预测;

根据最小均方误差预测原理,得到特征因素多重潜周期多元自回归混合模型在t时刻向 前预测l步的最小均方误差预测公式(5)。

2、特征因素多元周期平稳时序灰色预测;

采用系统灰色预测嵌套法对特征因素多元周期平稳时序预测的流程如图2所示,具体步 骤如下:

(1)设定预测总步数H,令u=1,2,…,H表示预测的步数。

(2)设{Yut},t=1,2,…,N表示第u步预测时一组待预测的特征因素多元周期平稳时序,建 立多重潜周期模型

其中Cut,Cu(t),qu,auijuj,i=1,2,…,n为进行第u步预测时的周期项、多重潜周期模型的多 重潜周期函数及相应的模型参数。

(3)从Yut中减去周期项Cut,对剩余的数据建立多元自回归模型

Rut=Σj=1puHujRu(t-j)+Eut---(10)

其中Rut,Ru(t-j),puuj为第u步预测时的随机项及相应的模型参数。Εut为第u步预测时的白 噪声。

(4)建立多重潜周期多元自回归混合模型

Yut=Σj=1puHujYu(t-j)+Cu*(t)+Eut---(11)

其中puuj,为第u步预测时的模型参数及多重潜周期多元自回归混合模型的多重潜周 期函数。

(5)采用多重潜周期多元自回归混合模型的最小均方误差预测公式(5)对YuN进行向前一步 预测

Yu(N+1)=Σj=1puHujYu(N+1-j)+Cu*(N+1)=YN+u---(12)

其中YN+u为N+u时刻特征因素向量。至此完成特征因素多元周期平稳时序的一步预测。

(6)去掉该组时序的第一个数据Yu1,加入时序的一步预测值Yu(N+1),得到一组新的时序 {Yut},t=2,3,…,N+1,将该时序作为第u+1步预测时的待预测时序{Y(u+1)t},t=1,2,…,N。

(7)令u=u+1,则待预测时序表示为{Yut},t=1,2,…,N,重复上述步骤(2)~(6),可逐次预测 出特征因素多元时序{YN+u},u=1,2,…,H。

步骤五、特征因素分析;

1、预测误差计算;

根据步骤二的特征因素筛选结果,对符合多元周期平稳条件的特征因素组合的多元周期 平稳时序采用本发明中的步骤三和步骤四建立多重潜周期多元自回归混合模型并进行灰色预 测后,将表征因素的预测数据与其同时刻的实测数据比较可得到预测误差,预测误差的表示 方式为平均误差绝对值,即

其中,H为预测数据总个数。

2、因素分析;

特征因素组合的因素分析的流程如图3所示,具体步骤为:

(1)计算表征因素预测误差,将表征因素组合作为已分析组合。

(2)从特征因素组合中任意选取一个未分析过的影响因素加入到已分析组合中,再对已分 析组合中的表征因素计算预测误差,若与加入前相比误差显著变小,则说明该影响因素与表 征因素相关性高,将其保留在已分析组合。否则说明该影响因素与表征因素相关性低,将其 从已分析组合中剔除。其显著性判断标准为

加入该影响因素后预测误差减小量≥加入该影响因素前预测误差的1%

若特征因素组合中含有多个表征因素,则以多个表征因素预测误差之和来进行显著性判断。

(3)重复上述步骤(2),直至特征因素组合中所有影响因素均被分析过一遍,则已分析组合 中所保留的影响因素即为与表征因素或与水华发生关联密切的影响因素,将已分析组合中的 影响因素按其加入对表征因素预测误差改变的大小排序,定性地得到各影响因素与表征因素 的相关程度。

实施例1:

步骤一、特征因素监测数据采集及预处理;

对江苏省太湖2009年6月至2012年6月的10个水华特征因素进行监测,具体见表1。

表1水华特征因素监测名单

  名称   pH值   耗氧量   水温   浊度   氨氮   总氮   总磷   溶解氧   叶绿素   藻密度   单位   无   mg/L   ℃   NTU   mg/L   mg/L   mg/L   mg/L   mg/L   个/L

其中叶绿素和藻密度这两个特征因素为表征因素,其余的8个特征因素为影响因素。监 测设备一共记录了1104天的水华特征因素数据,其10个特征因素原始时序分别见图4至图 13中的灰色曲线1。对每个特征因素的原始时序分别作去除异常采样点、去除均值漂移以及 填补缺失数据的采样点的预处理,预处理后的特征因素时序见图4至图13中的黑色曲线2。

步骤二、特征因素筛选;

对预处理后的特征因素多元时序进行多元周期平稳性检验,并根据多元周期平稳性检验 结果进行特征因素筛选。特征因素筛选结果如下:

1、对所有特征因素采用自相关函数检验方法进行一元周期平稳性检验,可知浊度、氨氮、 总磷这三个特征因素的一元周期平稳性检验不通过,故应将其去掉不予考虑。

2、对一元周期平稳性检验通过的表征因素,即叶绿素浓度和藻密度,采用本发明给出的 多元周期平稳性检验方法,这两种表征因素的组合通过检验。

3、对表征因素的组合,分别加入通过一元周期稳定性检验的影响因素,即pH值、耗氧 量、水温、总氮、溶解氧这5个影响因素以组成新的特征因素组合,经检验可知由这5个影 响因素和2个表征因素组成的特征因素组合可以通过多元周期平稳性检验。

步骤三、特征因素时序建模;

取前1095天的特征因素时序用于建模,从而可根据前1095天数据对第1096天至第1104 天这9天的数据进行预测。

1、确定特征因素时序结构;

将特征因素时序按公式(1)分解为周期项和随机项的叠加。

2、建立特征因素时序周期项模型;

采用多重潜周期模型公式(2)描述特征因素时序周期项。

3、建立特征因素时序随机项模型;

从特征因素时序减去周期项后,对随机项采用多元自回归模型公式(3)描述。

4、建立特征因素多元周期平稳时序模型;

将周期项的多重潜周期模型与随机项的多元自回归模型结合为多重潜周期多元自回归混 合模型公式(4)。

步骤四、水华特征因素多元时序预测;

1、特征因素多元周期平稳时序模型预测;

根据最小均方误差预测原理,得到特征因素多重潜周期多元自回归混合模型的最小均方 误差预测公式(5)。

2、特征因素多元周期平稳时序灰色预测;

采用系统灰色预测嵌套法对前1095天的特征因素时序预测到第1104天的9步预测具体 步骤如下:

(1)设定预测总步数9,令u=1,2,…,9表示预测的步数。

(2)设{Yut},t=1,2,…,1095表示第u步预测时一组待预测的特征因素多元周期平稳时序, 建立多重潜周期模型公式(9)。

(3)从Yut中去掉周期项Cut,对剩余的数据建立多元自回归模型公式(10)。

(4)建立多重潜周期多元自回归混合模型公式(11)。

(5)采用多重潜周期多元自回归混合模型的最小均方误差预测公式(5)对Yu1095进行向前一 步预测公式(12),得到第1095+u天的特征因素时序预测值Y1095+u。至此完成特征因素时序的 一步预测。

(6)去掉该组时序的第一个数据Yu1,加入时序的一步预测值Yu1096,得到一组新的时序 {Yut},t=2,3,…,1096,将该时序作为第u+1步预测时的待预测时序{Y(u+1)t},t=1,2,…,1095。

(7)令u=u+1,则待预测时序表示为{Yut},t=1,2,…,1095,重复上述步骤(2)~(6),可逐次预 测出特征因素多元时序{Y1095+u},u=1,2,…,9,即第1096天至第1104天的特征因素数据。

步骤五、特征因素分析;

1、预测误差计算;

根据步骤二的特征因素筛选结果,对符合多元周期平稳条件的特征因素组合采用本发明 方法建模预测后,其表征因素预测数据与实测数据比较可得到相应的预测误差。

2、因素分析如表2所示。

表2表征因素预测平均误差绝对值

从表2中可知,叶绿素和藻密度这两个表征因素的预测误差分别为0.3857和1.3910,预 测误差之和为1.7767;当加入影响因素溶解氧后,两个表征因素的预测误差分别为0.3055和 1.3153,其预测误差之和相比加入前减小了0.1559,减小量大于加入前预测误差之和的1%, 故可保留;当加入影响因素pH值后,表征因素预测误差之和相比加入前反而增加了0.0038, 故应剔除;当加入影响因素水温后,表征因素预测误差之和相比加入前总共减小了0.4398, 减小量大于加入前预测误差之和的1%,故可保留;当加入影响因素总氮后,表征因素预测误 差之和相比加入前总共减小了0.3191,减小量大于加入前预测误差之和的1%,故可保留;当 加入影响因素耗氧量后,表征因素预测误差之和相比加入前总共减小了0.04,减小量不到加 入前预测误差之和的1%,故应剔除。

因此,最终保留的影响因素为溶解氧、水温、总氮,说明这三个影响因素与叶绿素和藻 密度这两个表征因素的相关程度较高,即这三个影响因素与水华发生的关系最密切,而这三 个影响因素按其预测误差减小量从大到小,也即与水华发生的密切程度从高到低排序依次为 水温、总氮、溶解氧。

此外,为更直观地说明本发明采用多元周期平稳时序分析及灰色理论对水华预测的优势, 本发明另给出采用一元周期平稳时序分析、一元周期平稳时序分析及灰色理论、多元周期平 稳时序分析对水华特征因素多元时序的预测结果,以与本发明方法结果进行比较。

采用四种方法对第1096天至第1104天的水华特征因素多元时序进行预测,其2个表征 因素预测数据与实测数据分别如图14和图15所示,其7个特征因素的预测平均误差绝对值 如表3所示。

表3四种方法预测平均误差绝对值

可见,基于本发明方法的水华特征因素多元时序预测结果相比其它三种方法与实测结果更相 符、预测平均误差绝对值更小。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号