首页> 中国专利> 基于相空间重构和集合经验模态分解的预测方法及装置

基于相空间重构和集合经验模态分解的预测方法及装置

摘要

本发明公开了一种基于相空间重构和集合经验模态分解的预测方法,步骤包括:通过采样器获取样本数据后,对所述样本数据进行集合经验模态分解;对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构;将相空间重构后的数据输入至神经网络计算模块进行计算,得到若干个子序列的预测结果;将所有子序列的预测结果传输至数据中心处理器进行叠加,得到总预测结果。本发明提供了一种基于相空间重构和集合经验模态分解的预测方法及装置,能够提高计算机的数据处理能力,提高短期预测准确率。

著录项

  • 公开/公告号CN112215404A

    专利类型发明专利

  • 公开/公告日2021-01-12

    原文格式PDF

  • 申请/专利权人 广州大学;

    申请/专利号CN202011005487.4

  • 申请日2020-09-22

  • 分类号G06Q10/04(20120101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44202 广州三环专利商标代理有限公司;

  • 代理人郭浩辉;麦小婵

  • 地址 510006 广东省广州市番禺广州大学城外环西路230号

  • 入库时间 2023-06-19 09:32:16

说明书

技术领域

本发明涉及计算机应用技术领域,尤其是涉及一种基于相空间重构和集合经验模态分解的预测方法及装置。

背景技术

目前,随着计算机计算能力大幅提升,人们对计算机的应用场景抱有更高的期望,例如,人们希望利用计算机的数据处理能力处理数据库保存的历史数据以预测短期内未来发生的现象。根据现有的技术方案,人们已经可以利用计算机实现气象预测、股市指数涨跌预测、短期电力负荷预测等等,未来人们将在更多技术领域、更多应用场景运用计算机强大的预测能力。

但是,目前计算机的预测能力还不够强大,预测准确率尚待提高。例如,现有的技术方案采用了传统的时间序列预测方法,却不能利用时间序列中包含的丰富信息,因此预测结果的准确率不高。另外,现有的技术方案采用基于简单遗传算法的神经网络,存在训练速度慢、易陷入局部极值等缺点。若要提高计算机的数据处理能力以让人们运用计算机技术在更多领域实现短期预测,人们还需要投入更多时间、资源做研究。

发明内容

针对上述技术问题,本发明提供了一种基于相空间重构和集合经验模态分解的预测方法及装置,能够提高计算机的数据处理能力,提高短期预测准确率。所述技术方案如下:

第一方面,本发明实施例提供了一种基于相空间重构和集合经验模态分解的预测方法,步骤包括:

通过采样器获取样本数据后,对所述样本数据进行集合经验模态分解;

对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构;

将相空间重构后的数据输入至神经网络计算模块进行计算,得到若干个子序列的预测结果;

将所有子序列的预测结果传输至数据中心处理器进行叠加,得到总预测结果。

在本发明第一方面的第一种可能的实现方式中,所述通过采样器获取样本数据后,还包括:

解析所述样本数据得到时间序列;

对所述时间序列进行相空间重构,得到相点序列;

计算所述相点序列的最大Lyapunov指数;

若所述最大Lyapunov指数大于零则判定所述时间序列为混沌系统且可进行短期预测。

在本发明第一方面的第二种可能的实现方式中,所述最大Lyapunov指数的计算方法的步骤包括:

对获取到的时间序列进行傅里叶变换,并计算出平均周期;

在所述平均周期内,对应所述相点序列中每一相点搜索出与该相点距离最近的邻点;

计算每一所述邻点经过若干个离散时间步长后的距离d

计算距离d

其中,q是非零d

利用最小二乘法生成平均值y(i)的回归直线,计算出的斜率即为最大Lyapunov指数。

在本发明第一方面的第三种可能的实现方式中,所述相空间重构的优选方式具体为:

利用关联积分算法同时估算出延迟时间和延迟时间窗口;

基于所述延迟时间和所述延迟时间窗口计算出嵌入维数;

以进行相空间重构的相点数为行数,同时以所述嵌入维数为列数,在相空间构造出相型分布矩阵。

在本发明第一方面的第四种可能的实现方式中,在所述将相空间重构后的数据输入至神经网络计算模块进行计算的步骤中,神经网络的构建方法具体为:

将神经网络的输入层神经元数对应设置为相空间重构的嵌入维数,神经网络的输出层神经元数对应设置为1;

选择由学习样本构成的训练集对所述神经网络进行训练。

在本发明第一方面的第五种可能的实现方式中,对所述样本数据进行集合经验模态分解,优选实施方式为:

从所述样本数据中分解出包括原始数据在内的所有局部极大值和局部极小值;

根据每一所述局部极大值和所述局部极小值分别连接形成上包络线和下包络线,并计算上包络线和下包络线的均值;

计算所述均值与所述原始数据的差值,并且判断所述差值是否满足预设的筛选条件;

若所述差值满足预设的筛选条件,则根据所述差值筛选出差值信号,并且将所述差值信号替代所述原始数据重复进行计算,直至计算出原始数据的残差分量。

在本发明第一方面的第六种可能的实现方式中,在进行集合经验模态分解时,还包括步骤:

在原始数据中加入幅值相同的白噪声;

根据设定的迭代次数对加入白噪声的原始数据执行多次经验模态分解,得到若干个IMF分量;

计算所有IMF分量的平均值。

在本发明第一方面的第七种可能的实现方式中,在获得样本数据后,采用线性插值法对所述样本数据进行补充,t+j时刻的缺失值为:

其中,x

在本发明第一方面的第八种可能的实现方式中,在所述对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构的步骤之后还包括:

采用线性归一化函数对相空间重构后的数据进行归一化处理,并且将相空间重构后的数据压缩在区间[0,1]内。

第二方面,本发明实施例提供了一种基于相空间重构和集合经验模态分解的预测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于相空间重构和集合经验模态分解的预测方法。

相比于现有技术,本发明实施例具有如下有益效果:

本发明提供了一种基于相空间重构和集合经验模态分解的预测方法及装置,由本技术方案可知,在获取样本数据后,对所述样本数据进行集合经验模态分解。由于经验模态分解不需要选定任何定义好的函数作为基函数,仅根据信号自身的时间尺度特征进行信号分解,对于样本数据,尤其非线性、非平稳的电力负荷序列数据具有良好的适应性;经过集合经验模态分解,能够为神经网络提供更有效的输入数据,有利于提高神经网络的预测能力。除此之外,对序列数据进行EMD分解后的子序列分别进行相空间重构并使用神经网络进行预测,从而利用神经网络的学习能力和数据处理能力实现短期负荷预测,而且有效降低建模难度和提高预测精度。

附图说明

图1是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的步骤流程图;

图2是本发明实施例中的一种包括时间序列混沌性判定的基于相空间重构和集合经验模态分解的预测方法的步骤流程图;

图3是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的时间序列混沌性判定的流程图;

图4是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的EMD分解流程图;

图5是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的GRU神经网络结构示意图;

图6是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的C-C方法计算黄金期货交易金额序列统计量Smean示意图;

图7是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的C-C方法计算黄金期货交易金额序列统计量deltaSmean示意图;

图8是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的C-C方法计算黄金期货交易金额序列统计量Scor示意图;

图9是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的基于小数据量法的最大Lyapunov指数的曲线图;

图10是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的最终得预测结果的曲线图;

图11是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的最终得预测结果误差值的曲线图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参见图1,本发明提供一种示例性实施例,一种基于相空间重构和集合经验模态分解的预测方法,步骤包括:

S101、通过采样器获取样本数据后,对所述样本数据进行集合经验模态分解;

S102、对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构;

S103、将相空间重构后的数据输入至神经网络计算模块进行计算,得到若干个子序列的预测结果;

S104、将所有子序列的预测结果传输至数据中心处理器进行叠加,得到总预测结果。

请参见图2,本发明还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法还包括时间序列混沌性判定的步骤,即所述通过采样器获取样本数据后,还包括:

解析所述样本数据得到时间序列;

对所述时间序列进行相空间重构,得到相点序列;

计算所述相点序列的最大Lyapunov指数;

若所述最大Lyapunov指数大于零则判定所述时间序列为混沌系统且可进行短期预测。

请参见图3,具体地,根据最大Lyapunov指数,

当Lyapunov指数λ<0时,系统相对稳定,对初值的敏感性较差,长期行为将收敛到一个平衡点;

当Lyapunov指数λ=0时,系统对初值不敏感,呈现周期性运动;

当Lyapunov指数λ>0时,系统对初值敏感,系统是混沌的。

所述相空间重构的优选方式具体为:

利用关联积分算法同时估算出延迟时间和延迟时间窗口;

基于所述延迟时间和所述延迟时间窗口计算出嵌入维数;

以进行相空间重构的相点数为行数,同时以所述嵌入维数为列数,在相空间构造出相型分布矩阵。

本实施例还提供一种优选的实施方式,在获得样本数据后,考虑到数据是离线状态获得的,对数据的预处理主要集中在对缺失数据进行补充。对于缺失数据前后时间间隔不大的情况,采用线性插值对其补充,即数据预处理方式具体为:采用线性插值法对所述样本数据进行补充,t+j时刻的缺失值为:

其中,x

具体地,本方案提供一个具体的实施例以说明相空间重构。相空间重构将低维时间序列映射到高维相空间中并保持微分同胚的特性,将混沌吸引子恢复出来。

将要进行相空间重构的时间序列为x={x

X

嵌入时间序列的关联积分定义为:

其中,r为控制半径,i、j为重构的相空间中任意两个相点,d

将序列x={x

当N→∞时,

如果序列是独立同分布的,对于固定的m、t,当N→∞时,对于所有的r,S(m,r,t)≡0;但是实际的序列是有限长的,并且序列的元素间可能相关,此时S(m,r,t)一般不等于0;半径r的最大偏差为:

ΔS(m,t)=max{S(m,r

根据BDS统计对N、m和r进行恰当的估计,取m=2,3,4,5;j=1,2,3,4,得到三个统计量的计算公式:

其中,

设x={x

其中,X是维数为M×m的矩阵,τ为时间延迟,m为嵌入维数,M为相点个数,且M=N-(m-1)τ。

优选地,本方案提供一种优选的最大Lyapunov指数计算方法,步骤包括:

对获取到的时间序列进行傅里叶变换,并计算出平均周期;

在所述平均周期内,对应所述相点序列中每一相点搜索出与该相点距离最近的邻点;

计算每一所述邻点经过若干个离散时间步长后的距离d

计算距离d

其中,q是非零d

利用最小二乘法生成平均值y(i)的回归直线,计算出的斜率即为最大Lyapunov指数。

具体地,Lyapunov指数刻画了混沌运动的局部特征;最大Lyapunov指数计算方法的数学表示方式如下:

对于一维动力系统

x

λ为平均每次迭代引起的指数分离的指数,称为原动力系统的Lyapunov指数,初始距离为ε的两点经过n次后的距离为:

取极限ε→0,n→∞

在n维动力系统中,可以计算得到n个Lyapunov指数,最小的Lyapunov指数决定轨道收缩的快慢,最大的Lyapunov指数决定轨道发散的快慢,即覆盖到整个混沌吸引子的快慢。在实际应用中并不需要计算出所有的Lyapunov指数,仅仅通过最大Lyapunov指数就可以判断一个时间序列是否为混沌系统。最大Lyapunov指数的计算步骤如下:

对序列x={x

根据C-C方法计算得到的延迟时间τ和嵌入维数m,对序列进行相空间重构得到相点序列X={X

对于相空间的点X

对相空间的每个点X

d

对每个i,计算所有j的lnd

其中,q是非零d

利用最小二乘法生成y(i)的回归直线,其斜率为序列的最大Lyapunov指数。

请参见图4,本方案还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法还包括集合经验模态分解算法,具体如下:

从所述样本数据中分解出包括原始数据在内的所有局部极大值和局部极小值;

根据每一所述局部极大值和所述局部极小值分别连接形成上包络线和下包络线,并计算上包络线和下包络线的均值;

计算所述均值与所述原始数据的差值,并且判断所述差值是否满足预设的筛选条件;其中,所述筛选条件包括:

(1)穿零点和极值点的数量需要相同或最大相差1;

(2)由局部极大值所构成的包络线以及由局部极小值所构成的包络线的平均值为零。

可以理解的是,条件(1)类似于平稳高斯过程的窄带要求,条件(2)将全局条件修改为局部条件,解决了因波形不对称而产生瞬时频率波动的现象。

若所述差值满足预设的筛选条件,则根据所述差值筛选出差值信号,并且将所述差值信号替代所述原始数据重复进行计算,直至计算出原始数据的残差分量。

所述集合经验模态分解算法通过计算方式表示如下:

把原始数据x(t)作为待处理信号,找到所有局部极大值点和极小值点,并分别连接形成上下包络线e

计算m

h

判断h

将c

从时域上来看,通过EMD分解得到的IMF分量的特征时间尺度由小逐渐到大;从频域上来看,IMF分量的频率从高频逐渐到低频。各个IMF分量代表信号不同频率段的成分,每个频率段包含的频率均不相同。在同一个IMF分量中,不同时刻的瞬时频率是不相同的,不同频率成分的局部时间分布是随着信号本身的变化而变化的。

经验模态分解不需要选定任何定义好的函数作为基函数,仅根据信号自身的时间尺度特征进行信号分解,克服了基函数无适应性的问题,对非线性、非平稳的信号和线性、平稳的信号均具有良好的适应性。

由于集合经验模态分解易出现模态混叠的问题,因此本方案还提供一种优选实施例以解决模态混叠的问题。

在所述优选实施例中,所述基于相空间重构和集合经验模态分解的预测方法,在进行集合经验模态分解时,还包括步骤:

在原始数据中加入幅值相同的白噪声;

根据设定的迭代次数对加入白噪声的原始数据执行多次经验模态分解,得到若干个IMF分量;

计算所有IMF分量的平均值。

由上述可得,集合经验模态分解算法通过将高斯白噪声添加到信号中,进行多次EMD分解,使得得到的每个分量都都包含了有限幅值的白噪声,最后通过对多次的EMD分解结果取均值,抑制甚至消除掉加入的白噪声对分解结果的影响。计算方式表示如下:

(1)在原始信号中加入幅值相同的白噪声:

s

(2)对s

(3)重复步骤(1)~(2),对M次分解得到的每一个分量进行集成平均:

其中,c

可以理解的是,上述计算过程需要设定的两个重要参数:

信号中添加的白噪声序列幅值系数k和算法执行EMD的总次数M;

噪声对于分解结果的影响e与M、k有下列关系:

k越小,越有利于分解精度的提高,但是当k小到一定程度时,有可能不足以引起信号局部极值点的变化,从而不能改变信号的局部时间跨度,就达不到多次试验应有的从尽可能多的尺度了解信号的目的。同时,M越大,e也会减小甚至忽略不计,但计算负担又会增加。根据经验,建议在M=100时,k取为0.01~0.5倍信号的标准偏差较为适宜。

为了避免数据湮灭以及降低奇异数据对算法的敏感度,本方案还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法,在所述对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构的步骤之后还包括:

采用线性归一化函数对相空间重构后的数据进行归一化处理,并且将相空间重构后的数据压缩在区间[0,1]内。

具体地,所述归一化处理的数学表示方式为:

其中,x′为归一化后某一时刻的值,x为该一时刻的值,x

本方案还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法,在所述将相空间重构后的数据输入至神经网络计算模块进行计算的步骤中,神经网络的构建方法具体为:

将神经网络的输入层神经元数对应设置为相空间重构的嵌入维数,神经网络的输出层神经元数对应设置为1;

选择由学习样本构成的训练集对所述神经网络进行训练。

请参见图5,所示神经网络为GRU网络,其中的r

r

z

y

本发明还提高一种示例性实施例,一种基于相空间重构和集合经验模态分解的预测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于相空间重构和集合经验模态分解的预测方法。

本发明还提供一种基于相空间重构和集合经验模态分解的预测方法的具体实施例。以2011年1月3日至2013年5月20日股市交易日内采样时间间隔为12小时的1200个黄金期货每盎司交易金额为例,将前1100个采样点作为训练集,后100个采样点作为测试集,进行单点单步的黄金期货交易金额预测。

请参见图6、7、8,首先通过C-C方法计算得出三个统计量

请参见图9,通过对黄金期货每盎司交易金额时间序列进行仿真,从图7中可以看出,通过最小二乘法拟合得到的直线斜率λ>0。根据混沌理论,该黄金期货交易金额序列具有短期可预测性。

对黄金期货每盎司交易金额的时间序列进行EEMD分解,得到了9个IMF分量(IMF1至IMF9)和1个残差分量(res),将其视为交易金额受到不同因素影响的振荡特征和趋势特征。

对各个分量计算相空间重构参数,如表1所示:

表1各个分量的时间延迟τ和嵌入维数m

选择嵌入维数m作为GRU神经网络的输入神经元个数,将经过归一化处理的各分量序列输入到GRU神经网络中进行预测。

请参见图10,将各分量的预测结果叠加得到最终预测结果;请参见图11,最终预测结果的误差值如图所示。

本实施例还对最终预测结果的预测效果进行评价,评价方式如下所示:

采用拟合度(Equalization Coefficient,EC)、平均绝对误差(Mean AbsoluteError,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、均方误差(MeanSquaredError,MSE)来评价模型的预测效果。

其中,Y

为了验证提出的EEMD-GRU混合模型的有效性,对黄金期货交易金额序列数据经过相空间重构后分别使用反向传播(Back Propagation,BP)神经网络、径向基函数(RadialBasis Function,RBF)神经网络、小波神经网络(Wavelet Neural Network,WNN)、GRU神经网络进行预测,除此之外,对黄金期货交易金额序列数据进行EMD分解,对分解后的子序列分别进行相空间重构后使用GRU神经网络进行预测。表2为经过多次实验取均值后,各类模型对黄金期货交易金额序列的预测结果的性能对比。各模型的拟合度EC均达到了0.9以上,具有较高的可用性,EEMD-GRU模型的拟合度EC高于其他各类模型,达到了0.9954;平均绝对误差MAE相比于其他模型降低了30.3%到90.3%;平均绝对百分比误差MAPE和均方误差MSE相比于其他模型降低了0.2到2个数量级。实验证明,EEMD-GRU模型能够有效降低建模难度和提高预测精度。

表2各类模型预测性能对比

此外,本发明还提供一种基于相空间重构和集合经验模态分解的预测方法的具体实施例。以PJM网站美国伊利诺伊州2016年3月1日至5月7日采样时间间隔为1小时的1632个电力负荷数据为例,将前31天1464个采样点作为训练集,后7天共168个采样点作为测试集,进行单点单步的电力负荷预测。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号