法律状态公告日
法律状态信息
法律状态
2019-04-19
授权
授权
2017-07-14
实质审查的生效 IPC(主分类):G06F19/00 申请日:20170220
实质审查的生效
2017-06-20
公开
公开
技术领域
本发明涉及相似性度量技术领域,具体地说,是一种面向海洋领域的多元时间序列相似性度量方法。
背景技术
21世纪是海洋世纪,在面临可持续发展大课题的新时代,海洋的地位及开发价值日益为人们所重视。我国作为一个发展中的沿海国家,毋庸置疑,海洋对我国的发展也将发挥越来越重要的作用。然而,近几十年来,在促进经济发展的同时,各类海洋灾害随之而来,海洋灾害有许多类,其引发的因素也各不相同。主要有灾害性海冰、赤潮、风暴潮和海啸等等,与大气相关的灾害现象还有台风等,其中,我国是受台风影响最严重的国家之一。因此能够有效描述海洋灾害并进行灾害预报、发展趋势分析具有重要意义。
台风具有动态性、空间性、可预测性等特点,动态性是指其强度在不断变化;空间性是指在不同区域其强度不同或者具有相同强度但不发生在同一个区域;可预测性是指其发生过程具有规律性。台风数据库中记载了已发生台风的发生时间、结束时间、经纬度、等级、速度、移动速度、移动方向以及压强等信息,台风数据具有多属性,需要利用多元时间序列进行研究。目前,对于台风数据的描述、定量分析还不是很完善。
中国发明专利CN201610811178.3,公开日为2017.02.08,公开了一种交通流相似性的判别方法。但是该方法得到的相似性精确度不如本发明方法高。
中国发明专利CN201610264725.0,公开日为2016.08.31,公开了一种基于大数据的趋势曲线局部特征的匹配方法。但是该方法进行二次筛选,数据处理量增大,处理速度较慢。
因此,亟需一种准确描述台风数据、进行台风相似性度量的加权DTW度量方法,而目前关于这种相似性度量方法还未见报道。
发明内容
本发明的目的是针对现有技术中的不足,提供一种面向海洋领域的多元时间序列相似性度量方法。
为实现上述目的,本发明采取的技术方案是:
一种面向海洋领域的多元时间序列相似性度量方法,所述的相似性度量方法包括以下步骤:
S1:收集台风数据;
S2:对台风数据进行预处理;
S3:对台风数据进行描述;
S4:对台风数据进行相似性度量;
S5:输出相似台风;
其中,所述的步骤S2包括筛选台风属性、补充数据,所述的步骤S3包括移动方向表示、台风时间序列表示,所述的步骤S4包括台风属性权重计算、W-DTW距离计算、W-DTW距离判断。
所述的步骤S1收集台风数据包括收集现有台风原始数据、收集数据库中台风数据。
所述的步骤S2对台风原始数据进行预处理的步骤如下:
S21:筛选台风属性
选择需要考虑的台风属性,所属的台风属性包括强度L、风速V、移动方向MD、移动速度MV、压强P;
S22:补充数据
将筛选出的台风属性值为null的字段根据前后数据进行补充。
所述的步骤S3对台风数据进行描述的步骤如下:
S31:移动方向表示
由于台风的移动方向采用十六风向图表示,对其进行数值化,即台风数据中的移动方向共有16种,用0-15表示,以正北为0,顺时针旋转,依次是1,2,……,15,对于未采用十六风向图表示的,也对其进行数值化表示;
S32:台风时间序列表示
设台风强度L=[L1,L2,……,Ln]T,风速V=[V1,V2,……,Vn]T,移动方向MD=[MD1,MD2,……,MDn]T,移动速度MV=[MV1,MV2,……,MVn]T,压强P=[P1,P2,……,Pn]T,则台风时间序列A为:
其中,n表示时间点数,第一行的元素表示该台风在时刻1时的强度、风速、移动方向、移动速度、压强的相关记录,依此类推,最后一行表示该台风在时刻n时的强度、风速、移动方向、移动速度、压强的相关记录。
所述的步骤S4对台风数据进行相似性度量的步骤如下:
S41:台风属性权重计算
利用层次构造法构造判断矩阵,获取台风属性权重,其步骤如下:
S411:设台风的强度、风速、移动方向、移动速度、压强的属性权重分别为W1、W2、W3、W4、W5;
S412:构造判断矩阵
利用层次构造法构造判断矩阵,所得矩阵如下:
S413:对判断矩阵进行近似解计算
S4131:计算判断矩阵各行各元素乘积Mi,计算公式为
Mi=Li×Vi×MVi×MDi×Pi(i∈[1,5]);
S4132:计算Mi的n次方根Wi′,计算公式为
S4133:归一化处理,得到权重Wi,计算公式为
S4134:计算判断矩阵的最大特征值λmax;
S4135:进行一致性检验,计算公式为
CR=CI/RI
其中,CR是检验系数,CI是一致性指标,RI是随机一致性指标,若CR<0.1,则通过一致性检验,则表明权重符合要求;若CR>0.1,则一致性检验不通过,需重新进行权重计算;
S42:W-DTW距离计算
W-DTW距离为加权的DTW距离,其计算步骤如下:
S421:选择现有台风的时间序列和数据库中任一台风的时间序列,分别设为X、Y,则X、Y分别为
S422:计算基距离d(xi,yj),计算公式为
其中,i∈[1,m],j∈[1,n];
S423:计算时间序列X与Y的W-DTW距离,计算公式为
其中,r(i,j)表示r(X(1:i),Y(1:j)),i∈[1,m],j∈[1,n];
S424:重复步骤S421-S423,获得现有台风与数据库中每一个台风的W-DTW距离;
S43:W-DTW距离判断
将所有的W-DTW距离进行两两对比,获得一个最小的W-DTW距离。
所述的步骤S5输出相似台风为输出与现有台风W-DTW距离最小的数据库中的台风。
所述的步骤S413,近似解计算还包括和法计算、幂法计算。
本发明优点在于:
1、判断具有动态性、空间性、可预测性以及多属性的两个海洋时间序列是否相似;
2、根据已发生的海洋事件来判断当前海洋事件的发展趋势;
3、对于海洋灾害,可以为相关部门提供便捷的辅助决策,做好防护措施,减少其带来的经济损失和人员伤亡。
附图说明
附图1是本发明的一种面向海洋领域的多元时间序列相似性度量方法的流程图。
附图2是台风移动方向数值化表示参照图。
附图3是重要性等级及其赋值参照图。
附图4是随机一致性指标值参照图。
具体实施方式
下面结合附图对本发明提供的具体实施方式作详细说明。
实施例1
参照图1,本发明的一种面向海洋领域的多元时间序列相似性度量方法的步骤如下:
S1:收集台风数据;
S2:对台风数据进行预处理;
S3:对台风数据进行描述;
S4:对台风数据进行相似性度量;
S5:输出相似台风;
其中,所述的步骤S2包括筛选台风属性、补充数据,所述的步骤S3包括移动方向表示、台风时间序列表示,所述的步骤S4包括台风属性权重计算、W-DTW距离计算、W-DTW距离判断。
实施例2
本发明的一种面向海洋领域的多元时间序列相似性度量方法的具体工作步骤如下:
S1:收集台风数据
收集台风数据包括收集现有台风原始数据、收集数据库中台风数据。
S2:对台风原始数据进行预处理
S21:筛选台风属性
选择需要考虑的台风属性,所属的台风属性包括强度L、风速V、移动方向MD、移动速度MV、压强P;
S22:补充数据
将筛选出的台风属性值为null的字段根据前后数据进行补充。
S3:对台风数据进行描述
S31:移动方向表示
由于台风的移动方向采用十六风向图表示,对其进行数值化,参照图2,即台风数据中的移动方向共有16种,用0-15表示,以正北为0,顺时针旋转,依次是1,2,……,15,对于未采用十六风向图表示的,也对其进行数值化表示;
S32:台风时间序列表示
设台风强度L=[L1,L2,……,Ln]T,风速V=[V1,V2,……,Vn]T,移动方向MD=[MD1,MD2,……,MDn]T,移动速度MV=[MV1,MV2,……,MVn]T,压强P=[P1,P2,……,Pn]T,则台风时间序列A为:
其中,n表示时间点数,第一行的元素表示该台风在时刻1时的强度、风速、移动方向、移动速度、压强的相关记录,依此类推,最后一行表示该台风在时刻n时的强度、风速、移动方向、移动速度、压强的相关记录;
S4:对台风数据进行相似性度量
S41:台风属性权重计算
利用层次构造法构造判断矩阵,获取台风属性权重,其步骤如下:
S411:设台风的强度、风速、移动方向、移动速度、压强的属性权重分别为W1、W2、W3、W4、W5;
S412:构造判断矩阵
利用层次构造法构造判断矩阵,所得矩阵如下:
S413:对判断矩阵进行近似解计算
近似解计算包括根法计算、和法计算、幂法计算,本步骤利用根法进行近似解计算,其步骤如下:
S4131:计算判断矩阵各行各元素乘积Mi,计算公式为
Mi=Li×Vi×MVi×MDi×Pi(i∈[1,5]);
S4132:计算Mi的n次方根Wi′,计算公式为
S4133:归一化处理,得到权重Wi,计算公式为
S4134:计算判断矩阵的最大特征值λmax;
S4135:进行一致性检验,计算公式为
CR=CI/RI
其中,CR是检验系数,CI是一致性指标,RI是随机一致性指标,若CR<0.1,则通过一致性检验,则表明权重符合要求;若CR>0.1,则一致性检验不通过,需重新进行权重计算;
S42:W-DTW距离计算
W-DTW距离为加权的DTW距离,其计算步骤如下:
S421:选择现有台风时间序列和数据库中任一台风时间序列,分别设为X、Y,则X、Y分别为
S422:计算基距离d(xi,yj),计算公式为
其中,i∈[1,m],j∈[1,n];
S423:计算时间序列X与Y的W-DTW距离,计算公式为
其中,r(i,j)表示r(X(1:i),Y(1:j)),i∈[1,m],j∈[1,n];
S424:重复步骤S421-S423,获得现有台风与数据库中每一个台风的W-DTW距离;
S43:W-DTW距离判断
将所有的W-DTW距离进行两两对比,获得一个最小的W-DTW距离;
S5:输出相似台风
输出与现有台风W-DTW距离最小的数据库中的台风。
本发明的一种面向海洋领域的多元时间序列相似性度量方法的优点在于,判断具有动态性、空间性、可预测性以及多属性的两个海洋时间序列是否相似;根据已发生的海洋事件来判断当前海洋事件的发展趋势;对于海洋灾害,可以为相关部门提供便捷的辅助决策,做好防护措施,减少其带来的经济损失和人员伤亡。
实施例3
本发明的一种面向海洋领域的多元时间序列相似性度量方法的应用实施例如下:
S1:收集台风数据
收集台风数据包括收集现有台风原始数据1、收集数据库中台风数据2、3。
S2:对台风原始数据进行预处理
S21:筛选台风属性
选择需要考虑的台风属性,所属的台风属性包括强度L、风速V、移动方向MD、移动速度MV、压强P;
S22:补充数据
将筛选出的台风属性值为null的字段根据前后数据进行补充。
S3:对台风数据进行描述
S31:移动方向表示
由于台风的移动方向采用十六风向图表示,对其进行数值化,参照图2,即台风数据中的移动方向共有16种,用0-15表示,以正北为0,顺时针旋转,依次是1,2,……,15,对于未采用十六风向图表示的,也对其进行数值化表示;
S32:台风时间序列表示
设台风强度L=[L1,L2,……,Ln]T,风速V=[V1,V2,……,Vn]T,移动方向MD=[MD1,MD2,……,MDn]T,移动速度MV=[MV1,MV2,……,MVn]T,压强P=[P1,P2,……,Pn]T,则台风时间序列A为:
其中,n表示时间点数,第一行的元素表示该台风在时刻1时的强度、风速、移动方向、移动速度、压强的相关记录,依此类推,最后一行表示该台风在时刻n时的强度、风速、移动方向、移动速度、压强的相关记录。
获得台风1-3的时间序列,如下
S4:对台风数据进行相似性度量
S41:台风属性权重计算
利用层次构造法构造判断矩阵,获取台风属性权重,其步骤如下:
S411:设台风的强度、风速、移动方向、移动速度、压强的属性权重分别为W1、W2、W3、W4、W5;
S412:构造判断矩阵
利用层次构造法并参照图3构造判断矩阵,所得矩阵如下:
S413:对判断矩阵进行近似解计算
本步骤利用根法进行近似解计算,其步骤如下:
S4131:计算判断矩阵各行各元素乘积Mi,计算公式为
Mi=Li×Vi×MVi×MDi×Pi(i∈[1,5]);
S4132:计算Mi的n次方根Wi′,计算公式为
S4133:归一化处理,得到权重Wi,计算公式为
S4134:计算判断矩阵的最大特征值λmax;
S4135:进行一致性检验,计算公式为
CR=CI/RI
其中,CR是检验系数,CI是一致性指标,RI是随机一致性指标,RI的值参照图4,若CR<0.1,则通过一致性检验,则表明权重符合要求;若CR>0.1,则一致性检验不通过,需重新进行权重计算;
得到权重W,权重W如下,
S42:W-DTW距离计算
W-DTW距离为加权的DTW距离,其计算步骤如下:
S421:选择时间序列1、2,分别设为X、Y,则X、Y分别为
S422:计算基距离d(xi,yj),计算公式为
其中,i∈[1,m],j∈[1,n];
取i=8,j=9,并代入相应的W值,则d(x8,y9)=1.673;
S423:计算时间序列X与Y的W-DTW距离,计算公式为
其中,r(i,j)表示r(X(1:i),Y(1:j)),i∈[1,m],j∈[1,n]。
将d(x8,y9)=1.673代入计算得r(8,9)=17.297;
S424:重复步骤S421-S423,获得时间序列1与3的W-DTW距离,r(8,9)=340.928;
S43:W-DTW距离判断
将所有的W-DTW距离进行对比,获得一个最小的W-DTW距离,即17.297;
S5:输出相似台风
输出与台风1相似的台风2。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
机译: 一种相似性计算装置,一种副作用确定装置以及一种计算药物之间相似性并使用相似性进行外推效应的系统
机译: 多元时间序列数据的同步方法及处理多元时间序列数据的装置
机译: 多元时间序列数据同步方法及多元时间序列数据处理装置