公开/公告号CN114841226A
专利类型发明专利
公开/公告日2022-08-02
原文格式PDF
申请/专利权人 南京信息工程大学;江苏省气象信息中心;
申请/专利号CN202210015337.4
申请日2022-01-07
分类号G06K9/62(2022.01);G06F17/16(2006.01);
代理机构南京经纬专利商标代理有限公司 32200;
代理人曹芸
地址 210032 江苏省南京市江北新区宁六路219号
入库时间 2023-06-19 16:12:48
法律状态公告日
法律状态信息
法律状态
2022-08-19
实质审查的生效 IPC(主分类):G06K 9/62 专利申请号:2022100153374 申请日:20220107
实质审查的生效
2022-08-02
公开
发明专利申请公布
技术领域
本发明涉及一种江淮地区强降水中心场的提取方法,属于计算机客观天气分型技术领域。
背景技术
我国江淮地处雨量丰沛的南方和干旱少雨的北方过渡地带,降水的年际和季节变率都很大,影响因素复杂,旱涝和台风等气象灾害频频发生,因此出于研制更加先进的预报方法,从而更好的防灾减灾的需要,对江淮地区的强降水天气进行天气分型是十分必要的。
天气分型的原理是根据客观或主观的方法分析特定的气象要素来识别出若干种出现频次较高的天气类型,从而将气象场分类为这些天气类型的方法。相对于主观天气分型,客观天气分型采用数理统计、数值分析等方法实现,从而更加的客观全面,其常用的方法包括空间天气分类法(Spatial Synoptic Classification,SSC)、经验正交函数分析法(Empirical Orthogonal Function,EOF)、小波分析(wavelet analysis)、k均值(k-means)、层次聚类法等。在这些方法中往往需要先提取出各天气类型的中心场,如SSC的滑动种子日,对比文件:Sheridan S C,2002.The redevelopment of a weather-typeclassification scheme for north America(北美天气分型计划的再发展)、k均值的簇心,对比文件:张鸿雁,2021.基于密度加权的分裂式K均值聚类算法、EOF的典型模态,对比文件:秦岭,2020.全球春-秋季风降水的年际变化主模态时空特征,然后再得到分类结果,但这些方法都要指定中心场的数量,且其中滑动种子日需要人为主观的定义;簇心的选择在k-means的改进算法下遵循一定的规则但仍具有随机性,或为了消除随机性而增加预定义参数,同时k-means簇心的选择也不适用于非凸形状的簇;EOF采用求特征值和特征向量的方法提取典型模态,但受限于数据空间变换的局限性,对于非凸形状的气象场分布情况不具有适用性。
鉴于上述现有技术的不足之处,需要建立一种新型的气象场典型模态提取方法用于获取江淮地区的强降水中心场。
发明内容
本发明提出了一种江淮地区强降水中心场的提取方法,将一种新型的气象场典型模态提取方法应用到江淮地区的强降水中心场获取上,以便于后期对强降水天气进行天气分型。该方法只需要单一的预定义参数,且运行结果没有随机性,并能准确提取出分布呈现非凸形状的强降水量场集合的中心场。
本发明为解决其技术问题采用如下技术方案:
一种江淮地区强降水中心场的提取方法,包括如下步骤:
步骤1)收集待分析区域的逐日降水量站点数据并将其转换成格点数据,筛选其中的强降水日数据、建立表示强降水量场集合的数据集;
步骤2)计算强降水量场的距离矩阵,查找每个强降水量场的κ邻域强降水量场,其中κ邻域为预定义参数;
步骤3)求每个强降水量场在κ邻域范围内的密度指标;
步骤4)以每个强降水量场为原点,计算其和κ邻域范围内所有的k(k-1)/2对强降水量场形成的空间线段的夹角弧度值,其中一对强降水量场为两个强降水量场,并筛选得到k-1个相邻的最小夹角弧度值的集合,以此计算每个原点强降水量场的分布指标;
步骤5)计算每个强降水量场的密度指标和分布指标的几何平均值,即为中心强降水量场的判定初值,简称中心场的判定初值,然后在其κ邻域范围内进行比较,如果某个强降水量场的中心场判定初值小于其κ邻域范围内任意一个强降水量场的中心场判定初值,则该强降水量场的中心场判定值设置为0,否则设置为原来的判定初值,得到每个强降水量场的中心场判定值;
步骤6)从中心场判定值中选取大于0的值对应的降水量场日期和降水量格点值,即为强降水类型的中心场的出现日期及降水量。
步骤1)中所述降水量站点数据先转换成格点数据,然后再筛选其中的强降水日格点数据建立强降水量场数据集,其表现形式为二维数组
步骤2)中所述距离矩阵以DATA中任意两日的强降水量场的欧氏距离组成,表现形式为二维数组
步骤3)中所述密度指标的计算方法使用公式
步骤4)所述k-1个相邻的最小夹角弧度值集合的获取方法如下:首先,选取原点强降水量场的κ邻域范围内所有的成对强降水量场为DDS
其次,计算原点强降水量场i和DDS
最后,筛选出k-1个相邻的最小夹角弧度值,即先找出RDS
步骤原理说明:
步骤3)密度指标刻画的是每个强降水量场的密度属性,因为如果某个强降水量场是中心强降水量场(中心场),则必然和其最接近的κ邻域内强降水量场的欧氏距离都很小,即其密度函数
步骤4)分布指标刻画的是每个强降水量场的分布属性,其作用是弥补密度属性在描述中心场方面的不足之处,即在密度指标相同的情况下,中心场κ邻域内数据点分布的间隔弧度越大越均匀其分布指标值就越高,就越应该是中心场。此外选择MRD
总之,密度指标的构成要素是距离,分布指标的构成要素是弧度,两者组成了一个完整的极坐标系统,因此可以全面的刻画出中心场的特性。
步骤5)由于每个强降水量场的中心场判定初值表示的是该强降水量场成为中心场的可能性,即判定初值越大则越有可能是中心场,但是由于缺乏阈值标准所以判定初值无法准确的表示某个强降水量场是否是中心场,因此考虑用另一个思路解决上述问题,即引入一个中心场的判断原则——某强降水量场判定初值必须大于等于其κ邻域范围内所有的强降水量场判定初值,才能认为其判定初值是有效的而予以保留,否则最终的中心场判定值为零。这个判断原则基于的原理是数据集中各类别数据点的中心点在其局部范围(κ邻域)内的判定初值是最高的,而在中心点周边的数据点由于其κ邻域内必然有靠向中心点的一部分数据点判定初值更高,所以中心周边数据点的最终判定值会被设置为零,同理离群数据点由于其κ邻域内必然有靠向中心周边的一部分数据点判定初值更高,所以离群数据点的最终判定值也会被设置为零,这样就滤除了中心周边数据点和离群数据点,只留下中心点为判定值大于零的数据点。
本发明的有益效果如下:
1、单一预定义参数提取中心场,且结果稳定没有随机性
本发明仅使用表示κ邻域的k值作为参数,而无需指定中心场数量。本发明通过计算每个强降水量场的密度指标和分布指标,然后转化为中心场判定初值,再依据判断原则(某强降水量场判定初值必须大于等于其κ邻域范围内所有的强降水量场判定初值才判定为中心场),获得中心场判定结果,技术方案中没有随机性内容,因此结果稳定没有随机性。
2、能准确提取出分布呈现非凸形状的强降水量场集合的中心场
附图说明
图1为相同密度指标数据的不同分布指标对比图。
图2为模拟数据集图。
图3为EOF方法获取的2个类别中心示意图。
图4为本发明方法获取的2个类别中心示意图。
图5为本发明的强降水中心场提取流程图。
图6(a)为1981-2015年中国江淮地区第一种强降水中心场(2002年7月21日)示意图;图6(b)为1981-2015年中国江淮地区第二种强降水中心场(2004年6月14日)示意图;图6(c)为1981-2015年中国江淮地区第三种强降水中心场(2003年7月1日)示意图;图6(d)为1981-2015年中国江淮地区第四种强降水中心场(2007年7月3日)示意图;图6(e)为1981-2015年中国江淮地区第五种强降水中心场(1998年6月20日)示意图。
具体实施方式
下面结合附图对本发明创造做进一步详细说明。
图1是说明分布指标意义的实例,分布指标刻画的是每个强降水量场的分布属性,其作用是弥补密度属性在描述中心场方面的不足之处,如图1所示的两个分布的对比可以看出,右上圆圈内圆心(中心场)的κ邻域值k=12,左下圆圈内圆心的κ邻域值也是k=12,且其两个圆心到κ邻域点的欧氏距离都是对应相等的,所以两个分布的密度指标相等,但是右上的圆圈内数据点(强降水量场)分布较均匀,所以其圆心比左下的圆心更加应该是中心场,因此右上圆心分布函数
由于江淮地区强降水量场的格点数量也就是数据维度很高无法用图形直观表示,因此采用简化的二维数据集证明本发明在非凸形状强降水量场分布情况下的有益效果。如图2所示的模拟数据集有240个二维数据,分为两个类别,其中类别1为凸形状,类别2为非凸形状,所以应有两个中心点(即中心场)分别位于类别1和类别2的中心位置。
比较EOF方法和本发明方法可以发现,EOF方法如图3所示,其典型模态数量=2,将类别1和类别2的中心标识在了数据的边界位置,这是因为其在进行数据的空间变换计算特征值和特征向量时使用的是线性变换(或有限制的非线性变换)的方法,因此对于数据分布比较复杂,比如模拟数据集这样存在非凸形状类别且2个类别边界相接触的情况,就无法通过空间变换得到正交方向上的大方差值了,从而导致EOF方法标识数据类别中心的效果很差。相较之下本发明方法如图4所示,其k=78,无需进行空间变换,而是通过数据的密度指标和分布指标进行类别中心的自动化评价与判断,因此可以准确地找出模拟数据集的2个类别中心。
本发明的流程图如图5,使用1981-2015年中国江淮地区(北纬26°-36°、东经110°-123°)逐日00时(世界时)的24小时累计降水量站点数据作为降水量站点数据集。
首先,对降水量站点数据集进行站点数据到格点数据的转换,使用NCAR CommandLanguage(NCL)语言的obj_anal_ic_Wrap函数实现,得到降水量格点数据集。其中该函数的传入参数设置为zlon=江淮地区694个站点的经度;zlat=江淮地区694个站点的纬度;z=江淮地区694个站点的降水量;glon=江淮地区格点经度序列(格点范围110-123、格点间距1);glat=江淮地区格点纬度序列(格点范围26-36、格点间距1);rscan=影响的连续半径([10,5,3]);option=不做局部平滑(False),返回的降水量格点数据是在上述格点范围内的逐个格点间距的共计154个格点的降水量值。
其次,强降水日数据的筛选标准为:基于降水量格点数据集,客观识别出成片暴雨(大雨)区(24小时累计降水量达到暴雨(大雨)以上量级(≥50mm(25mm))的格点数≥15个且相连成片),“相连成片”指该区域内的每一格点都至少有另一个格点与之相连(含对角相连)。以成片暴雨(大雨)区出现的降水量格点数据为强降水日数据,得到表示强降水量场集合的数据集。
最后,使用强降水量场数据集和预定义参数k=15,通过本发明中计算密度指标、分布指标、中心场判定值的方法,得到中心场判定值>0的若干个强降水量场为若干种强降水类型的中心场,其输出结果如图6(a)至图6(e)。
由图6(a)-(e)可以看出,1981-2015年中国江淮地区强降水中心场共有五种,对应五种强降水天气分型,其中第一种(图6(a))表现为江淮区域降水整体一致偏多的特征,东北部和东南部降水较少;第二种(图6(b))呈现江淮中部降水多、南北降水偏少的特征,降水大值中心位于江淮中部;第三四种(图6(c)(d))均表现出江淮降水北部多、南部少的空间分布特征,但第三种(图6(c))整个江淮北部均包含在降水大值中心内,而第四种(图6(d))降水中心主要位于江淮北部偏东的沿海地区,西北部降水偏少;第五种(图6(e))与第三四种的分布特征相反,呈现江淮南部降水多、北部降水少的特征,降水大值中心位于江淮东南部。
机译: 用于检测区域中移动昆虫的电磁天线组件;用于提取近场或远场信号的信号处理器一种从信号中提取相干空间信息的方法。
机译: 用于检测区域中移动昆虫的电磁天线组件;用于提取近场或远场信号的信号处理器一种从信号中提取相干空间信息的方法。
机译: 通过计算流场中的最佳路径提取医学图像中血管结构中心线表示的方法和系统