公开/公告号CN114841449A
专利类型发明专利
公开/公告日2022-08-02
原文格式PDF
申请/专利权人 江苏科技大学;
申请/专利号CN202210529735.8
申请日2022-05-16
分类号G06Q10/04(2012.01);G06Q50/26(2012.01);G06K9/62(2022.01);G06N3/04(2006.01);G06N3/08(2006.01);
代理机构南京创略知识产权代理事务所(普通合伙) 32358;
代理人刘文艳
地址 212000 江苏省镇江市梦溪路2号
入库时间 2023-06-19 16:14:25
法律状态公告日
法律状态信息
法律状态
2022-08-19
实质审查的生效 IPC(主分类):G06Q10/04 专利申请号:2022105297358 申请日:20220516
实质审查的生效
技术领域
本发明涉及太阳活动预报技术领域,具体涉及一种基于太阳观测数据空间特征信息的太阳活动预报方法。
背景技术
“万物生长靠太阳”,太阳永不停歇地释放着光和热,为人类及地球上存在的其他所有生命提供了生存所必需的适当环境和能量来源。正因为它与人类的生产和生活密不可分,人们产生了深入了解太阳本质的朴素愿望。在对太阳不断探索的过程中,人们发现了许多太阳活动现象,如耀斑、日冕物质抛射(CME)、黑子、光斑等,这些太阳活动会引起空间天气变化,剧烈的空间天气扰动会对空间和地面技术系统(如卫星、通信网络、电力设施等)造成危害,产生巨大的经济损失,严重影响人类的生活状态和社会秩序。太阳耀斑是指发生在太阳表面局部区域中突然和大规模的能量释放过程,在短时间内释放大量能量,引起局部区域瞬时加热,向外发射各种电磁辐射,并伴随粒子辐射突然增强,是空间环境的主要扰动源,对地球空间环境造成很大影响。强太阳耀斑引起的高能粒子对卫星和航天员的安全、无线电通信系统、全球定位系统等近空间环境有重要影响。准确的空间天气预报尤其是太阳活动预报能够及时预警未来的空间天气扰动,使我们可以提前做好应对措施,降低恶劣空间天气对人类造成的影响。当前,随着太阳观测技术和探测能力的提升,高时空精度的太阳观测数据呈指数式增长。传统的手工识别太阳活动区方式已经不能满足对海量数据的处理需求,实现对太阳活动区的自动、快速识别已经成为准确预报太阳活动的关键问题和技术基础。
近年来,深度学习神经网络作为机器学习的一个分支,已经成为天文学和其他科学领域中驱动大规模学习问题的一种高度可靠的技术。当工程特性不能完全捕获原始数据的物理特性且机器学习算法不能以最小的损失进行学习时,Arel等与LeCun等指出深度学习是有效的。卷积神经网络(Convolutional Neural Networks,CNNs)是一种非常流行的深度学习方法,属于图像处理和计算机视觉领域,能够进行自动的特征提取。与经典的机器学习算法相比,这些算法损失的信息更少,更适合高维数据集。
卷积神经网络基于神经网络,其中包括卷积层、池化层、批量标准化层、池化层、全连接层等。每一层在执行分类或回归任务之前提取数据中的复杂特征。原始数据可以输入到网络中,因此不需要任何特征工程,网络通过训练来学习提取特征。Park等提出了一个卷积神经网络模型,该模型是GoogleNet和DenseNet的组合,用来预测太阳耀斑的发生。以往的研究大多采用从光球磁场的视距(Line Of Sight,LOS)磁图做出24小时内的二元类预测。黄鑫等提出了基于卷积神经网络的耀斑二分类预测模型,为了避免投影效应,他们的模型使用了许多位于全日面中心±30°范围内的来自太阳活动区的LOS磁图。但是,当前的预报精度不能满足空间活动对空间天气预报的实际需求;因此,需要设计一种基于太阳观测数据空间特征信息的太阳活动预报方法。
发明内容
本发明的目的是克服现有技术的不足,为更好的有效解决当前预报精度不能满足空间活动对空间天气预报的实际需求的问题,提供了一种基于太阳观测数据空间特征信息的太阳活动预报方法。
为了达到上述目的,本发明所采用的技术方案是:
一种基于太阳观测数据空间特征信息的太阳活动预报方法,包括以下步骤:
步骤(A),利用等级i和等级j的图像数据分别训练一个二分类分类器,得到不同网络结构的二分类模型及其训练完成的参数;
步骤(B),加载得到的二分类模型及其训练完成的参数,并用i类数据和j类数据训练好的分类器得到一张图片属于i类的概率;
步骤(C),得到这张图片属于N、C、M和X类的概率,取概率最大的类别作为这张图片的预测概率;
步骤(D),使用基于Keras深度学习框架进行训练和测试,得到模型数据;
步骤(E),对模型数据进行训练和测试,并获得混淆矩阵和评价指标,完成用One-Versus-One方案对太阳活动的预报作业。
前述的一种基于太阳观测数据空间特征信息的太阳活动预报方法,步骤(A),利用等级i和等级j的图像数据分别训练一个二分类分类器,得到不同网络结构的二分类模型及其训练完成的参数,其使用第i类的所有样本数据作为正样本和第j类的所有样本数据作为负样本训练第ij个基础分类器,其具体步骤为加载i和j等级的图片以及等级数据、将图片等级数据转化为One-hot编码、使用图片数据以及标签进行训练以及保存i等级和j等级的二分类模型到指定文件夹。
前述的一种基于太阳观测数据空间特征信息的太阳活动预报方法,步骤(B),加载得到的二分类模型及其训练完成的参数,并用i类数据和j类数据训练好的分类器得到一张图片属于i类的概率,具体步骤如公式(1)所示,
j∈(Ω-i)=j∈({N、C、M、X}-i) (1)
其中,Ω={N、C、M、X};N、C、M、X均表示不同的类别。
前述的一种基于太阳观测数据空间特征信息的太阳活动预报方法,步骤(D),使用基于Keras深度学习框架进行训练和测试,得到模型数据,其中Keras的后端是Python编程语言中的TensorFlow深度学习框架,且使用的是Keras框架中的ModelCheckpoint回调函数。
前述的一种基于太阳观测数据空间特征信息的太阳活动预报方法,使用基于Keras深度学习框架进行训练和测试的具体步骤如下,
步骤(D1),用训练数据集训练至少100个轮次,且每个训练轮次后由ModelCheckpoint生成训练后的模型,其使用测试数据集当作验证数据集在每次训练迭代完成之后计算性能指标以跟踪评价模型的能力;
步骤(D2),由每个轮次后的验证数据集对该模型进行验证并记录训练损失和验证损失,其使用交叉熵损失函数CrossEntropyLoss作为所有模型的损失函数,如公式(2)所示,
步骤(D3),通过监视验证损失的值,且ModelCheckpoint仅在该值最小时保存训练最佳的模型,其使用accuracy指标监控模型的学习过程。
本发明的有益效果是:
(1)本发明植入了使用自动化数据采集工具,大大减少了数据采集周期,而且采集的数据量也大大增加。
(2)本发明使用卷积神经网络来预测太阳耀斑爆发的等级,预测效果较好。
(3)本发明使用One-Versus-One方案增加了预测的成功率,该模型多分类预测TSS指标分别为0.7035±0.0703、0.4893±0.0499、0.4321±0.2228、0.4363±0.3308,与当前国际上所取得的最优性能指标结果相比,性能相当。
附图说明
图1是本发明的整体流程图;
图2是本发明的步骤A中训练过程算法示意图;
图3是本发明的预测过程算法示意图;
图4是本发明的待分类数据示意图;
图5是本发明的第1个分类器(左边)和第2个分类器(右边)需要分类的数据示意图;
图6是本发明的第3个分类器(左边)和第4个分类器(右边)需要分类的数据示意图;
图7是本发明的第5个分类器(左边)和第6个分类器(右边)需要分类的数据示意图;
图8是本发明的N_C模型训练accuracy(左上)、训练损失(右上)、验证accuracy(左下)、验证损失(右下)曲线图;
图9是本发明的N_M模型训练accuracy(左上)、训练损失(右上)、验证accuracy(左下)、验证损失(右下)曲线图;
图10是本发明的N_X模型训练accuracy(左上)、训练损失(右上)、验证accuracy(左下)、验证损失(右下)曲线图;
图11是本发明的C_M模型训练accuracy(左上)、训练损失(右上)、验证accuracy(左下)、验证损失(右下)曲线图;
图12是本发明的C_X模型训练accuracy(左上)、训练损失(右上)、验证accuracy(左下)、验证损失(右下)曲线图;
图13是本发明的M_X模型训练accuracy(左上)、训练损失(右上)、验证accuracy(左下)、验证损失(右下)曲线图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1-13所示,本发明的一种基于太阳观测数据空间特征信息的太阳活动预报方法,包括以下步骤:
步骤(A),利用等级i和等级j的图像数据分别训练一个二分类分类器,得到不同网络结构的二分类模型及其训练完成的参数,其使用第i类的所有样本数据作为正样本和第j类的所有样本数据作为负样本训练第ij个基础分类器,其具体步骤为加载i和j等级的图片以及等级数据、将图片等级数据转化为One-hot编码、使用图片数据以及标签进行训练以及保存i等级和j等级的二分类模型到指定文件夹。
步骤(B),加载得到的二分类模型及其训练完成的参数,并用i类数据和j类数据训练好的分类器得到一张图片属于i类的概率,具体步骤如公式(1)所示,
j∈(Ω-i)=j∈({N、C、M、X}-i) (1)
其中,Ω={N、C、M、X};N、C、M、X均表示不同的类别。
步骤(C),得到这张图片属于N、C、M和X类的概率,取概率最大的类别作为这张图片的预测概率。
步骤(D),使用基于Keras深度学习框架进行训练和测试,得到模型数据,其中Keras的后端是Python编程语言中的TensorFlow深度学习框架,且使用的是Keras框架中的ModelCheckpoint回调函数,使用基于Keras深度学习框架进行训练和测试的具体步骤如下,
步骤(D1),用训练数据集训练至少100个轮次,且每个训练轮次后由ModelCheckpoint生成训练后的模型,其使用测试数据集当作验证数据集在每次训练迭代完成之后计算性能指标以跟踪评价模型的能力;
步骤(D2),由每个轮次后的验证数据集对该模型进行验证并记录训练损失和验证损失,其使用交叉熵损失函数CrossEntropyLoss作为所有模型的损失函数,如公式(2)所示,
步骤(D3),通过监视验证损失的值,且ModelCheckpoint仅在该值最小时保存训练最佳的模型,其使用accuracy指标监控模型的学习过程。
步骤(E),对模型数据进行训练和测试,并获得混淆矩阵和评价指标,完成用One-Versus-One方案对太阳活动的预报作业。
为了更好描述本发明的使用效果,下面介绍本发明的一个具体实施例。
(1)基于One-Versus-One方法的CNN耀斑预报模型的训练算法与预测算法如图2与图3所示。在训练过程中利用等级i和等级j的图像数据来分别训练一个二分类分类器,在实验中一共有4类数据,所以一共会得到12个不同网络结构的二分类模型及其训练完成的参数。最后将这些模型及参数利用深度学习框架提供的结构保存到磁盘,这样就完成了一个数据集的训练过程,一共有10个类似的数据集。还可以使用图示的方式表示分类过程如图4-7所示,实心的即为此次应该被当作训练数据送入分类器的数据,而不同实心形状的代表所属不同类别。
此方案一共有6个模型,它们的结构都是相同的,如表1所示;Parameter的计算公式如公式(3)所示。
表1模型结构
(2)这6个模型同样使用相同的参数,具体参数的值参见表2与表3,表3中的权重因子主要用来控制各个类别在损失函数中的权重,以此可以减小类别不平衡的影响。
表2模型参数设置
表3各模型损失函数中的权重系数
(3)如图8-13分别是N_C模型、N_M模型、N_X模型、C_M模型、C_X模型、M_X模型的训练集的loss曲线、accuracy曲线,验证集的loss曲线、accuracy曲线。从这些图中可以观察得出:模型能由训练集预报到耀斑图像的某些特征。
(4)使用经过调参优化后的One-Versus-One方案对10组数据进行训练和测试,获得的混淆矩阵如表5所示,获得的评价指标如表4所示。One-Versus-One方案的TSS性能指标结果分别为0.7035±0.0703、0.4893±0.0499、0.4321±0.2228、0.4363±0.3308,与当前所取得的国际上最好的性能指标结果相比,性能相当。
表4各项指标及其均差
表5 10个测试数据集的混淆矩阵之和
(5)在对不平衡测试数据集进行测试的时候获得的混淆矩阵和各项指标如表6与表7所示。
表6 10个不平衡测试数据集的混淆矩阵之和
表7不平衡的10个测试数据集的各项指标及其方差
综上所述,本发明的一种基于太阳观测数据空间特征信息的太阳活动预报方法,首先利用等级i和等级j的图像数据分别训练一个二分类分类器,得到不同网络结构的二分类模型及其训练完成的参数,接着加载得到的二分类模型及其训练完成的参数,并用i类数据和j类数据训练好的分类器得到一张图片属于i类的概率,再得到这张图片属于N、C、M和X类的概率,取概率最大的类别作为这张图片的预测概率,随后使用基于Keras深度学习框架进行训练和测试,得到模型数据,再对模型数据进行训练和测试,并获得混淆矩阵和评价指标,完成用One-Versus-One方案对太阳活动的预报作业;本发明植入了使用自动化数据采集工具,大大减少了数据采集周期,而且采集的数据量也大大增加,也使用卷积神经网络来预测太阳耀斑爆发的等级,预测效果较好,还使用One-Versus-One方案增加了预测的成功率,该模型多分类预测TSS指标分别为0.7035±0.0703、0.4893±0.0499、0.4321±0.2228、0.4363±0.3308,与当前国际上所取得的最优性能指标结果相比,性能相当。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
机译: 天气和气候特征中期预报中太阳活动的核算方法
机译: 一种用于宽速度感应电动机的控制装置,该控制装置基于通过伦伯格状态观测器进行的磁通估计来进行控制,以及用于定位所述状态观测器的特征值的方法
机译: 一种用于基于车辆触发特征变量来配置具有传输协议的轮胎信息传感器的装置,系统和方法