首页> 中国专利> 一种基于香农熵的GIIRS观测区大气廓线集采样方法

一种基于香农熵的GIIRS观测区大气廓线集采样方法

摘要

本发明公开了一种基于香浓熵的GIIRS观测区大气廓线集采样方法,包括以下步骤:S1:构建GIIRS观测区基础大气数据集;S2:将GIIRS观测区的地表分为若干个不同的地表类型,根据地表类型将GIIRS观测区基础数据集相应的划分成不同的大气数据集;S3:将步骤S2中得到的每个数据集分月划分成大气子数据集;S4:从每个子数据集中随机挑选h根廓线,构建GIIRS观测区初始采样廓线集;S5:利用GIIRS观测区初始廓线集构建GIIRS观测区优化廓线集;S6:对步骤S5中的优化廓线集进行统计检验。本发明在结合地表类型和大气月变化的因素的基础上,应用香农熵采样方法构建GIIRS观测区廓线数据集,解决了目前公开发布的廓线数据库难以准确表征红外高光谱GIIRS观测区大气变化特征的问题。

著录项

说明书

技术领域

本发明涉及廓线集采样方法领域,具体涉及一种基于香农熵的GIIRS观测区大气廓线集采样方法。

背景技术

中国新一代静止气象卫星风云4A上的静止干涉式红外探测仪(GIIRS)是第一台在静止卫星轨道平台上的红外高光谱仪器,能够在区域尺度上高频次获取大气三维信息,实现连续监测大气垂直结构、捕捉强影响天气事件水平和垂直方向发展状态。与国际上极轨气象卫星探测区域覆盖全球的大气红外探测器(AIRS)、红外大气探测干涉仪(IASI)以及跨轨道扫描红外大气探测仪(CrIS)仪器等不同,静止卫星上的GIIRS仪器仅探测中国及周边地区的大气动态信息。利用红外高光谱数据的进行数值模拟计算过程中,构造代表性的大气廓线集对于红外高光谱仪器的辐射传输模拟等算法至关重要的。

构建一个代表性大气廓线数据集,使其对于空间分布和参数变化范围具有异构性和多样性,需要借助一种面向目标的采样方法。一般来说,大气廓线数据的采样过程中主要存在两个挑战。第一个挑战是大气具有多变量特征(例如温度、湿度和2米地表温度等),这使得采样过程复杂,例如,同时考虑多个大气气压层的各种变量,会导致采用算法输入变量的维数高达数百。第二个挑战是大气变量的取值从大气低层到高层变化巨大,而且不同变量之间存在单位和变化范围的差异。

针对不同的应用需求,目前国际上公开发布了一些包含不同廓线数量和不同变量类型的全球大气廓线数据集。动态气象学实验室开发的热力学初始猜测反演(TIGR)廓线集是当前应用最为广泛的一种全球大气廓线数据集,早期发布的版本在采样过程中对于变量的选择只考虑温度变量的影响,而最新发布的版本在采样过程中考虑了温度和湿度两个变量的影响。欧洲中期天气预报中(ECMWF)从大气数值预报在分析数据产品中进行采样,依据数据分布的大气层数不同构造了不同的版本全球大气廓线集,包含了数值模式预报产品对应的多种变量信息,在采样过程中对于变量的选择同时考虑多种变量的影响。对于廓线空间分布,TIGR和ECMWF系列廓线数据集的采样过程中主要基于廓线分布的地址位置之间的距离,而仅仅依赖距离很难衡量两种大气环境之间变量垂直空间取值代表性差异等特征。这些全球覆盖的数据集,不能准确反应GIIRS探测区域的大气变化特征。此外,还有一些用于快速辐射传输模型训练的小数据集,如马里兰大学巴尔的摩县(UMBC)-48数据集,这些数据集样本不足,无法应用于构造GIIRS观测区大气廓线集。狄迪从威斯康星大学空间科学与工程中心开发的第5版SeeBor廓线库和ECMWF全球廓线集中采样了70根廓线,构成了中国红外高光谱GIIRS仪器观测区的局部廓线集集,但是采样过程中对于廓线空间分布应用欧式距离原理,没有考虑地表类型等因素的影响。2010年国专家尝试利用香农熵从红外大气探测干涉仪(IASI)2级产品中提取出10000根大气廓线构造全球廓线集,研究结果表明基于香浓熵的方法能够在采样过程中融合考虑不同变量和变量取值变化范围的影响,该方法具有通用性强、采样均匀性好等优点。目前公开发布的成果显示香浓熵采样方法尚未应用于构造中国风云静止卫星红外高光谱GIIRS仪器观测区大气廓线集。构造适用于中国特有静止卫星红外高光谱GIIRS仪器观测区局地廓线集,在采样过程中可以兼顾地表、月份的影响因素,应用香浓熵采样方法,形成更能体现GIIRS观测区大气变化特征的廓线集。

发明内容

针对上述存在的问题,本发明旨在提供一种基于香农熵的GIIRS观测区大气廓线集采样方法,针对风云4A静止卫星红外高光谱GIIRS仪器观测区大气廓线进行采样,该方法以欧洲中期天气预报中心2019年第五代再分析数据集为廓线样本数据库为基础,在考虑了GIIRS观测区地表类型因素和大气月份变化特征的基础上,应用香浓熵方法依据多个大气变量对信息熵增量的贡献,从廓线样本库中进行廓线采样,构造GIIRS观测区大气廓线集,为红外高光谱GIIRS的数值模拟的辐射传输等计算模块提供准确的廓线数据库。

为了实现上述目的,本发明所采用的技术方案是:

一种基于香浓熵的GIIRS观测区大气廓线集采样方法,其特征在于,包括以下步骤:

S1:构建GIIRS观测区基础大气数据集;

S2:将GIIRS观测区的地表分为若干个不同的地表类型,根据地表类型将GIIRS观测区基础数据集相应的划分成不同类型的大气数据集;

S3:将步骤S2中得到的每个数据集分月划分成大气子数据集;

S4:从每个子数据集中随机挑选h根廓线,构建GIIRS观测区初始采样廓线集;

S5:利用GIIRS观测区初始廓线集构建GIIRS观测区优化廓线集;

S6:对步骤S5中的优化廓线集进行统计检验。

进一步的,步骤S1的具体操作包括,从欧洲中期天气预报中心再分析数据集中,选定风云4A卫星红外高光谱GIIRS仪器观测区域的再分析数据,构建GIIRS观测区的基础大气数据集D。

进一步的,步骤S2的具体操作包括以下步骤,

S21:根据地形高度和表面类型,将GIIRS观测区的地表划分为6种典型的地表类型;

S22:根据步骤S21中划分出来的6种地表类型,将步骤S1中的基础大气数据集D相应的划分成六种地表类型大气数据集D

进一步的,步骤S3的具体操作包括:将步骤S2中划分出来的六种地表类型大气数据集D

进一步的,步骤S4的具体操作包括以下步骤,

S41:针对GIRS观测区的每个大气子数据集D

S42:针对GIIRS观测区的每个大气子数据集D

进一步的,步骤S41中所述的关键大气廓线变量包括大气温度T、比湿WV和2米地表温度TS。

进一步的,步骤S5的具体操作包括,

S51:从每一个数据子集D

S52:将大气温度T、比湿WV和2米温度TS三个要素作为香浓熵的输入变量,每替换1根廓线后,对更新的廓线子集B

S53:当廓线子集B

进一步的,步骤S52中每替换1根廓线时,对更新的廓线子集B

设数据子集D

第一层循环:在初始采样廓线集Z

第二层循环:从剩余的a-h根廓线中选择1根廓线,替换初始采样廓线集Z

进一步的,香农熵的计算方法为

式中,L

进一步的,步骤S6的具体操作包括:对比步骤S4构建的初始采样廓线集Z

本发明具有如下有益效果:

1、本发明中提出的针对风云4A静止卫星红外高光谱GIIRS仪器观测区大气廓线集的采样方法,以欧洲中期天气预报中心2019年第五代再分析数据集为廓线样本数据库为基础,在考虑了GIIRS观测区地表类型因素和大气月份变化特征的基础上,应用香浓熵方法依据多个大气变量对信息熵增量的贡献,从廓线样本库中进行廓线采样构造GIIRS观测区大气廓线集,所采样的廓线样本之间差异更大,能更好体现GIIRS观测区内大气的变化特征,为红外高光谱GIIRS的数值模拟的辐射传输等计算模块提供准确的廓线数据库,为研究中国静止卫星红外高光谱GIIRS观测数据在数值天气预报中的应用软件开发提供基础支撑廓线数据集。

2、通过与ECMWF大气数据集的比较,本发明基于香农熵方法采样的GIIRS观测区廓线集在大气温度、大气湿度和地表温度等多个变量的变化范围内保持了样本分布的均匀性。

附图说明

图1是基于香浓熵的GIIRS观测区大气廓线集采样方法的流程图;

图2为本发明中六类数据集的地形高度和表面类型信息;

图3为本发明中2月份初始廓线集和新的3类GIIRS观测区优化廓线集在每个气压层之间20个取值等分区间内样本分布概率差异;

图4为本发明中2月份初始廓线集与3类GIIRS观测区优化廓线集之间的统计差异;

图5为本发明中第1类廓线集4个月的大气温度对比情况;

图6为本发明中第1类廓线集4个月的大气湿度对比情况;

图7为本发明中8月份六类地表湿度的概率分布情况;

图8为本发明中2月初GIIRS观测区优化廓线集和原始ERA5数据集之间的变量统计结果;

图9为本发明中2月份,5月份,8月份和11月份GIIRS观测区优化廓线集的空间分布情况。

具体实施方式

为了使本领域的技术人员能更好地理解本发明的技术内容,特举具体实施例并配合所附图式说明如下。本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。

为了构建一个中国风云四4A静止卫星红外高光谱(GeosychronousInterferometric Infrared Sounder,GIIRS)仪器观测区大气廓线数据集,促进GIIRS仪器数值模拟应用中辐射传输模式开发或者反演算法的开发,以欧洲中期天气预报中心(European Center for Medium-Range Weather Forecasts,ECMWF)的第五版(ERA5)再分析数据集为样本数据集,在考虑地表和大气月变化的基础上,利用基于香农熵采样方法从样本数据集中采样构造GIIRS观测区优化廓线集,由此实现本发明方法的实施,具体采样方法如附图1所示。

具体的,一种基于香浓熵的GIIRS观测区大气廓线集的采样方法,包括以下步骤:

S1:构建GIIRS观测区基础大气数据集;

为了促进风云4A卫星上红外高光谱GIIRS仪器的数值模拟应用,依据GIIRS仪器观测的区域(约为:10°N-53°N,70°E-144°E),从欧洲中期天气预报中心的第五代再分析数据集中,选定该区域的再分析数据构建GIIRS观测区的基础大气数据集D,该数据子集包含的每个元素为一根大气廓线。

S2:将GIIRS观测区的地表分为若干个不同的地表类型,根据地表类型将GIIRS观测区基础数据集相应的划分成不同类型的大气数据集;

不同地表高度和地表类型上的大气具有明显的差异,根据地形高度和表面类型,将GIIRS观测区的地表划分为6种典型的地表类型,依据地表类型的不同,将GIIRS观测区基础大气数据集D相应划分为六种地表类型大气数据集D

表1地形高度和地表类型分类的详细信息

在附图2中,(a)为地形高度和表面类型,(b)为相应的月平均地表气压,从附图2中可以看出,地形高度和月平均地表气压的分布具有一致性。

进一步的,步骤S3:将步骤S2中得到的每个数据集分月划分成大气子数据集;

大气在每个月具有明显的变化特征,依据月份的不同,将步骤S2中划分出来的六种地表类型大气数据集D

进一步的,步骤S4:从每个子数据集中随机挑选h根廓线,构建GIIRS观测区初始采样廓线集;

针对GIRS观测区的每个大气子数据集D

针对GIIRS观测区的每个大气子数据集D

表2六类原始数据集每月采样量(h)

进一步的,步骤S5:利用GIIRS观测区初始廓线集构建GIIRS观测区优化廓线集;

具体的,S51:从每一个数据子集D

S52:将大气温度T、比湿WV和2米温度TS三个要素作为香浓熵的输入变量,每替换1根廓线后,对更新的廓线子集B

每替换1根廓线时,对更新的廓线子集B

设数据子集D

第一层循环:在初始采样廓线集Z

第二层循环:从剩余的a-m根廓线中选择1根廓线,替换初始采样廓线集Z

进一步的,香农熵的计算方法为

式中,L

S53:当廓线子集B

进一步的,步骤S6:对步骤S5中的优化廓线集进行统计检验;

对比步骤S4构建的初始采样廓线集Z

采样结果:

利用本发明中的采样方法采样出来的GIIRS观测区优化廓线集与初始廓线集相比,最终的GIIRS观测区优化廓线集F

从附图3中可以看出,三个变量在其变化范围内都呈现出均匀分布成都较高的特征,特别是大气温度和2米地表温度两端值的比例增加;与大气温度相比,比湿分布变化相对较小,其原因可能是对于每一个选定的气压层,比湿在最小值和最大值之间存在较大的差异,而初始廓线集中的大多数比湿分布都包含在前几个值域间隔中。因此,在迭代过程中熵的增加主要取决于采样过程中的大气温度和2米地表温度,大气温度分布均匀,而比湿的分布相对均匀性略小。

附图4为2月份初始廓线集与3类GIIRS观测区优化廓线集之间的统计差异,其中(a)为大气温度差异,(b)为比湿;从附图4中可以看出,大气温度的最小值、最大值和平均值变化不大;而对于比湿来说,大多数气压层的平均值和最大值都增加了。GIIRS观测区优化廓线集中大气温度和比湿的标准差(std)明显大于初始廓线集,表明GIIRS观测区优化廓线集中两个变量之间的差异性较初始廓线集集有所增加,廓线数据更具有代表性。

进一步的,采样过程中还考虑了季节变化因素,六类廓线集每月独立采样x个样本。附图5和附图6分别显示了第4类廓线集4个月(即2月、5月、8月、11月)的大气温度和比湿的比较。其中,附图5(a)为2月份大气温度廓线,与5月份大气温度廓线(附图5(b))、8月份大气温度廓线(附图5(c))和11月份大气温度廓线(附图5(d))相比,2月和11月的大气温度廓线变化范围更广,差异更大。

附图6(a)为2月份比湿,与5月份比湿(附图6(b))、8月份比湿(附图6(c))和11月份比湿(附图6(d))相比,8月的比湿范围更广,比湿只有一小部分在548.0321hPa以下,比其他3个月要小,大部分情况在548.0321hPa以上比其他3个月大。

由于地形高度引起的垂直气压结构差异,为六类原始大气数据集建立六类GIIRS观测区优化廓线,这六类GIIRS观测区优化廓线集也分别代表了各自不同的气象特征,以比湿为例,附图7显示了8月份六类地表比湿的概率分布,其中,(a)代表的是第一类海洋,(b)-(f)分别代表第二类至第六类,从附图6中可以看出,海洋环境的水气比其他类别的水气分布范围要广;随着地形高度的增加,各气压层的大气湿度均显著降低。

附图8还比较了2月初GIIRS观测区优化廓线集和原始ERA5数据集之间的变量统计结果。第一行表示2月1日第一类廓线集的统计比较结果,其中,(a)为GIIRS观测区优化廓线集的大气温度情况,(b)为原始ERA5数据集的大气温度情况;第二行表示第二类廓线集的统计比较结果,其中,(c)为GIIRS观测区优化廓线集的比湿情况,(d)为原始ERA5数据集的比湿情况。结果表明,GIIRS观测区优化廓线集的大气温度具有与原始ERA5数据集特别相似的统计分布,而廓线集中的比湿在大多数气压层上的平均值和变化范围比原始ERA5数据集稍小。

附图9显示了四个月的GIIRS观测区优化廓线集的空间分布情况,其中(a)为2月份,(b)为5月份,(c)为8月份,(d)为11月份,在采样过程中不包含空间信息,但迭代过程之前的随机操作可能会对分散情况造成很大影响。然后在采样过程中,进一步改变了分布情况。从附图9中可以清楚地看到,8月份的样本更多地集中在中高纬度地区,而2月份集中在低纬度地区。

综上所述,利用本发明中的采样方法建立的GIIRS观测区优化大气廓线集,可用于中国同步地球卫星FY4A上新的红外高光谱探测仪,该数据集基于香农熵方法从ERA5 2019数据集中采样,由于研究区域地形和气候的多样性导致垂直气压结构的变化,GIIRS观测区优化廓线集按地形高度分为六类,GIIRS观测区优化廓线集的优点包括:

(1)GIIRS观测区优化廓线集在多变量的空间覆盖和变化范围上都呈现出均匀分布的特征;

(2)GIIRS观测区优化廓线集能清晰显示大气变量的季节变化;

(3)对6个不同地形高度的数据集进行独立采样,这种分类方法为研究人员在目标区域建立更精确的大气透过率系数提供了基础支撑。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号