首页> 中国专利> 日照辐射量预测方法、装置、设备及存储介质

日照辐射量预测方法、装置、设备及存储介质

摘要

本发明属于气象预测技术领域,公开了一种日照辐射量预测方法、装置、设备及存储介质。本发明通过获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据;将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据;对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。由于日照辐射量预测模型是由不同模型构建方法构建的多个模型融合得到的模型,而并非简单的根据现行回归构建的模型,预测精度高,可以准确的预测日照辐射量。

著录项

  • 公开/公告号CN112801357A

    专利类型发明专利

  • 公开/公告日2021-05-14

    原文格式PDF

  • 申请/专利权人 长江慧控科技(武汉)有限公司;

    申请/专利号CN202110085252.9

  • 申请日2021-01-21

  • 分类号G06Q10/04(20120101);G06F30/27(20200101);G06K9/62(20060101);

  • 代理机构44287 深圳市世纪恒程知识产权代理事务所;

  • 代理人谢阅

  • 地址 430000 湖北省武汉市武昌区八一路102号嘉嘉悦大厦601-612

  • 入库时间 2023-06-19 10:58:46

说明书

技术领域

本发明涉及气象预测技术领域,尤其涉及一种日照辐射量预测方法、装置、设备及存储介质。

背景技术

针对节能重点和调节对象的建筑物,可以基于日照辐射量(包括太阳直射量、太阳散射量和月球辐射量),预测建筑物的室内冷热负荷,然后根据预测得到的室内冷热负荷优化建筑物的室内冷热源系统,以达到节能的效果。

但是,在实际应用中,日照辐射量难以及时获取,因此,需要预测日照辐射量,但是现有技术估算日照辐射量精度低,难以准确预测日照辐射量,而无法准确预测日照辐射量,则难以合理优化室内冷热源系统。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种日照辐射量预测方法、装置、设备及存储介质,旨在解决现有技术估算日照辐射量精度低,难以准确预测日照辐射量的技术问题。

为实现上述目的,本发明提供了一种日照辐射量预测方法,所述方法包括以下步骤:

获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据;

将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据;

对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。

优选地,所述获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据的步骤之前,还包括:

采集各气象站点的小时级气象数据及小时级日照辐射数据,根据所述小时级气象数据及小时级日照辐射数据构建样本数据集;

对所述样本数据集进行预处理,以获得训练样本集;

根据所述训练样本集构建回归预测模型及机器学习模型;

根据所述训练样本集、所述回归预测模型及所述机器学习模型确定日照辐射量预测模型。

优选地,所述采集各气象站点的小时级气象数据及小时级日照辐射数据,根据所述小时级气象数据及小时级日照辐射数据构建样本数据集的步骤,包括:

采集各气象站点的小时级气象数据及小时级日照辐射数据;

获取所述小时级气象数据对应的气象采集时间,并获取所述小时级日照辐射数据对应的辐射采集时间;

基于所述辐射采集时间及所述气象采集时间将所述小时级气象数据及小时级日照辐射数据进行关联,以获得样本数据;

根据所述样本数据构建数据集合;

依据所述辐射采集时间或所述气象采集时间对所述数据集合中的样本数据进行排序,以获得样本数据集。

优选地,所述对所述样本数据集进行预处理,以获得训练样本集的步骤包括:

根据所述样本数据集中的样本数据确定样本数据中位数及样本数据四分距;

根据所述样本数据中位数及所述样本数据四分距对所述样本数据集中的样本数据进行归一化处理,以获得训练样本集。

优选地,所述根据所述样本数据集中的样本数据确定样本数据中位数及样本数据四分距的步骤,包括:

对所述样本数据集中的各个样本数据进行标签编码,并使用均值法对标签编码后的样本数据集中的各个样本数据进行缺值补全,以获得修改后的样本数据集;

根据所述修改后的样本数据集中的样本数据确定样本数据中位数及样本数据四分距。

优选地,所述回归预测模型包括:第一回归预测模型、第二回归预测模型及第三回归预测模型;所述机器学习模型包括:第一机器学习模型及第二机器学习模型;

所述根据所述训练样本集、所述回归预测模型及所述机器学习模型确定日照辐射量预测模型的步骤,包括:

基于K折模型融合算法及所述训练样本集,对所述第一回归预测模型、所述第二回归预测模型及所述第三回归预测模型进行模型融合,以获得融合辐射预测模型;

获取所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值;

基于所述预设融合权值将所述融合辐射预测模型、所述第四辐射预测模型及所述第五辐射预测模型进行融合,以获得日照辐射量预测模型。

优选地,所述获取所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值的步骤,包括:

获取验证样本集,并根据所述验证样本集确定所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预测准确度;

根据所述预测准确度确定所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值。

此外,为实现上述目的,本发明还提出一种日照辐射量预测装置,所述日照辐射量预测装置包括以下模块:

数据转换模块,用于获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据;

数据分析模块,用于将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据;

数据处理模块,用于对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。

此外,为实现上述目的,本发明还提出一种日照辐射量预测设备,所述日照辐射量预测设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的日照辐射量预测程序,所述日照辐射量预测程序被所述处理器执行时实现如上所述的日照辐射量预测方法的步骤。

此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有日照辐射量预测程序,所述日照辐射量预测程序执行时实现如上所述的日照辐射量预测方法的步骤。

本发明通过获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据;将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据;对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。由于日照辐射量预测模型是由不同模型构建方法构建的多个模型融合得到的模型,而并非简单的根据现行回归构建的模型,预测精度高,可以准确的预测日照辐射量。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的电子设备的结构示意图;

图2为本发明日照辐射量预测方法第一实施例的流程示意图;

图3为本发明日照辐射量预测方法第二实施例的流程示意图;

图4为本发明日照辐射量预测装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

参照图1,图1为本发明实施例方案涉及的硬件运行环境的日照辐射量预测设备结构示意图。

如图1所示,该电子设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity, WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及日照辐射量预测程序。

在图1所示的电子设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明电子设备中的处理器1001、存储器1005可以设置在日照辐射量预测设备中,所述电子设备通过处理器1001调用存储器1005中存储的日照辐射量预测程序,并执行本发明实施例提供的日照辐射量预测方法。

本发明实施例提供了一种日照辐射量预测方法,参照图2,图2为本发明一种日照辐射量预测方法第一实施例的流程示意图。

本实施例中,所述日照辐射量预测方法包括以下步骤:

步骤S10:获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据。

需要说明的是,本实施例的执行主体可以是所述日照辐射量预测设备,所述日照辐射量预测设备可以是个人电脑、服务器等电子设备,还可以为其他可实现相同或相似功能点额设备,本实施例对此不加以限制,在本实施例及下述各实施例中,以日照辐射量预测设备为例对本发明日照辐射量预测方法进行说明。

需要说明的是,气象站点可以是进行气象观测,开展单站天气预报的基层气象单位。小时级天气预报数据可以是以一个小时为周期,周期性预测的气象数据,气象数据可以包括:时间、风向、气压、最高气压、最低气压、最大风速、极大风速、最高气温、气温、最低气温、水汽压、湿度、最小相对湿度、降水量、水平能见度、总云量、云量、风力、体感温度等数据。预处理可以选择与模型训练输入数据相同的预处理方式,将小时级天气预报数据转换为模型可输入的数据格式。

步骤S20:将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据。

需要说明的是,日照辐射量预测模型可以是由以不同模型构建方法及样本数据集构建的多个模型融合得到的模型,相较单一模型可以更加准确的预测日照辐射量,样本数据集可以是根据采集的各气象站点的气象数据及日照辐射量经过标签编码、数据补全、归一化等预处理之后构建的样本数据的集合,归一化处理可以使用StandardScaler、MinMaxScaler、RobustScaler等归一化方法进行对数据进行归一化处理。日照辐射预测模型的输入可以是经过预处理的气象数据,输出可以是经过归一化处理的预测辐射数据。预测辐射数据可以是经过归一化处理的数据,而并非最终的日照辐射量。

步骤S30:对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。

需要说明的是,预测辐射数据是经过归一化处理的数据,对预测辐射数据进行逆归一化处理,即可获得日照辐射量,即小时级预测日照辐射量。

例如:假设日照辐射量预测模型是以经过RobustScaler方法归一化的样本集训练得到的,则预测辐射数据可以理解为是经过RobustScaler方法归一化的数据,因此,将RobustScaler方法的归一化公式进行变形,即可得到逆归一化公式:

x

其中,x

在实际使用中,在获得各气象站点对应的小时级预测日照辐射量之后,还可以根据小时级预测日照辐射量及小时级天气预报数据生成日照辐射量预测报告并进行展示。

本实施例通过获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据;将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据;对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。由于日照辐射量预测模型是由不同模型构建方法构建的多个模型融合得到的模型,而并非简单的根据现行回归构建的模型,预测精度高,可以准确的预测日照辐射量。

参考图3,图3为本发明一种日照辐射量预测方法第二实施例的流程示意图。

基于上述第一实施例,本实施例日照辐射量预测方法在所述步骤S10之前,还包括:

步骤S01:采集各气象站点的小时级气象数据及小时级日照辐射数据,根据所述小时级气象数据及小时级日照辐射数据构建样本数据集。

需要说明的是,小时级气象数据可以是气象站点以一小时为周期,周期性采集的气象数据。小时级日照辐射数据可以是气象站点以一小时为周期,周期性采集的日照辐射数据,日照辐射数据可以包括日照辐射量、采集时间等数据。

进一步地,为了合理的构建样本数据集,本实施例步骤S01,可以包括:

采集各气象站点的小时级气象数据及小时级日照辐射数据;获取所述小时级气象数据对应的气象采集时间,并获取所述小时级日照辐射数据对应的辐射采集时间;基于所述辐射采集时间及所述气象采集时间将所述小时级气象数据及小时级日照辐射数据进行关联,以获得样本数据;根据所述样本数据构建数据集合;依据所述辐射采集时间或所述气象采集时间对所述数据集合中的样本数据进行排序,以获得样本数据集。

需要说明的是,气象采集时间可以是气象站点采集小时级气象数据的时间,辐射采集时间可以是气象站点采集小时级日照辐射数据的时间。样本数据可以是由小时级气象数据及小时级日照辐射数据组成的。

在实际使用中,可根据实际数据设置预设时长阈值,例如:5秒,10秒等,计算辐射采集时间与气象采集时间的时间差值,将时间差值小于预设时长阈值的辐射采集时间对应的小时级日照辐射数据及气象采集时间小时级气象数据进行关联,构成样本数据,在将各小时级气象数据及各小时级日照辐射数据关联之后,可以获得多个样本数据,将获得的多个样本数据进行组合即可获得数据集合,之后,为了便于用户进行观察,此时可以根据辐射采集时间或气象采集时间对所述数据集合中的样本数据进行排序,即可获得样本数据及,例如:依据辐射采集时间从大到小或从小到大将数据集合中的样本数据进行优先级排序。

步骤S02:对所述样本数据集进行预处理,以获得训练样本集。

需要说明的是,若直接使用样本数据集中的样本数据进行模型训练,因为数据较为散乱,训练模型准确率难以保证,因此,可以在训练模型之前,将样本数据进行预处理,转化为适于进行模型训练的训练样本,可以在提高训练完毕的模型的准确率。

进一步地,为了便于训练模型,本实施例步骤S02,可以包括:

根据所述样本数据集中的样本数据确定样本数据中位数及样本数据四分距;根据所述样本数据中位数及所述样本数据四分距对所述样本数据集中的样本数据进行归一化处理,以获得训练样本集。

需要说明的是,样本数据中位数可以包括多个,例如:温度数据中位数、气压数据中位数等,样本数据四分距也可以包括多个,例如:温度数据四分距、气压数据四分距等。归一化处理根据样本数据中位数及样本数据四分距使用RobustScaler方法对样本数据集中的样本数据进行归一化处理。

在实际使用中,可以获取样本数据集中所有的样本数据,根据样本数据中的具体的数据数值计算对应的样本数据中位数及样本数据四分距。

例如:样本数据集中共有8个样本数据,各个样本数据对应的温度数据分别为:11℃、12℃、15℃、7℃、17℃、6℃、8℃、13℃,则可以先将温度数据进行从小到大排序,即可得到6℃、7℃、8℃、11℃、12℃、13℃、15℃、17℃,则温度数据中位数T

需要说明的是,在实际处理数据时,样本数据可能会因各气象站点采集时的格式要求不同或采集疏漏,导致部分数据保存形式不便于进行计算,甚至会有部分数据存在缺失,此时会影响计算样本数据中位数及样本数据四分距,会对令数据归一化困难或误差较大。

进一步地,为了防止数据不便于计算且避免数据缺失,本实施例根据所述样本数据集中的样本数据确定样本数据中位数及样本数据四分距的步骤,可以包括:

对所述样本数据集中的各个样本数据进行标签编码,并使用均值法对标签编码后的样本数据集中的各个样本数据进行缺值补全,以获得修改后的样本数据集;根据所述修改后的样本数据集中的样本数据确定样本数据中位数及样本数据四分距。

需要说明的是,标签编码可以是将样本数据中类似于描述性数据等不便于计算的数据进行量化,转化为利于计算的数据,例如:利用十六分法将风向转换为1-16数值。使用均值法补全缺值可以先获取与缺失数据的样本数据的辐射采集时间或气象采集时间作为标志时间,将辐射采集时间或气象采集时间与标志时间的时间差值最小且辐射采集时间或气象采集时间于标志时间大于标志时间的样本数据及辐射采集时间或气象采集时间与标志时间的时间差值最小且辐射采集时间或气象采集时间于标志时间小于标志时间的样本数据作为目标样本数据。确定缺失数据的样本数据中缺失数据的数据类型,将目标样本数据中与缺失数据数据类型相同的数据的平均值作为缺失数据对缺失数据的样本数据进行补全。

例如:样本数据A中缺失温度数据,将样本数据A的气象采集时间作为标志时间,则可以获取气象采集时间与样本数据A的时间差值最小且气象采集时间大于标志时间的样本数据B及气象采集时间与样本数据A的时间差值最小且气象采集时间小于标志时间的样本数据C作为目标样本数据,获取目标样本数据B和目标样本数据C中的温度数据去平均值,将得到的数值作为 A中缺失的温度数据对样本数据A进行数据补全。

步骤S03:根据所述训练样本集构建回归预测模型及机器学习模型。

需要说明的是,回归预测模型可以是根据回归算法及训练样本集构建的模型,机器学习模型可以是根据机器学习算法构建的模型。回归预测模型可以是一个,也可以是多个,机器学习模型也可以是一个或者是多个。

步骤S04:根据所述训练样本集、所述回归预测模型及所述机器学习模型确定日照辐射量预测模型。

在实际使用中,可以根据训练样本集对建立的回归预测模型及机器学习模型进行训练并进行模型融合,即可获得日照辐射量预测模型。

进一步地,为了提高日照辐射量预测模型的预测准确率,回归预测模型可以包括:第一回归预测模型、第二回归预测模型及第三回归预测模型;机器学习模型包括:第一机器学习模型及第二机器学习模型。

本实施例步骤S04可以包括:

基于K折模型融合算法及所述训练样本集,对所述第一回归预测模型、所述第二回归预测模型及所述第三回归预测模型进行模型融合,以获得融合辐射预测模型;获取所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值;基于所述预设融合权值将所述融合辐射预测模型、所述第四辐射预测模型及所述第五辐射预测模型进行融合,以获得日照辐射量预测模型。

需要说明的是,第一回归预测模型、第二回归预测模型及第三回归预测模型可以是由三种不同的回归算法及训练样本集构建的模型,回归算法可以为Lasso回归算法、岭回归算法和ElasticNet回归算法等算法,还可以为其他回归算法。第一机器学习模型及第二机器学习模型可以是由两种不同的机器学习算法及训练样本集构建的模型,机器学习算法可以是xgBoost、LightGBM 等机器学习算法,还可以为其他机器学习算法。

在实际使用中,可以依据K折模型融合算法(k-folding stacking)可以将训练样本集被分成K个折叠(K为正整数,具体的值可以根据实际需要进行设置),并且在K个连续的循环中,使用K-1折叠来拟合第一级回归器(即第一回归预测模型、第二回归预测模型及第三回归预测模型)。在每一轮中(一共 K轮),一级回归器然后被应用于在每次迭代中还未用过的模型拟合的剩余1 个子集。然后将得到的预测叠加起来并作为输入数据提供给二级回归器,二级回归器训练完毕即可获得融合模型,即融合辐射预测模型。之后可以再获取融合辐射预测模型、第一机器学习模型及第二机器学习模型分别对应的预设融合权值,依据预设融合权值将融合辐射预测模型、第一机器学习模型及第二机器学习模型进行加权融合,即可得到日照辐射量预测模型。预设融合权值可以根据实际需要进行设置。

进一步地,为了合理的设置预设融合权值,本实施例步骤获取所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值的步骤,可以包括:

获取验证样本集,并根据所述验证样本集确定所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预测准确度;根据所述预测准确度确定所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值。

需要说明的是,验证样本集可以是使用与训练样本集相同的方式获得的验证样本集合,将验证样本输入融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型进行分析,获得预测结果,与验证样本集中的标准结果进行比对,即可得到融合辐射预测模型、第一机器学习模型及第二机器学习模型分别对应的预测准确度。

在实际使用中,可以预设一准确度阈值,根据融合辐射预测模型、第一机器学习模型及第二机器学习模型分别对应的预测准确度计算与准确度阈值的准确度差值,根据准确度差值确定融合辐射预测模型、第一机器学习模型及第二机器学习模型分别对应的预设融合权值。

例如:预先设定一准确度阈值为0.9,假设融合辐射预测模型、第一机器学习模型及第二机器学习模型对应的预测准确度分别为0.970、0.915、0.915,则可以计算得到准确度差值分别为0.070、0.015、0.015,则融合辐射预测模型对应的预设融合权值=0.070/(0.070+0.015+0.015)=0.7,第一机器学习模型及第二机器学习模型对应的预设融合权值=0.015/(0.070+0.015+0.015)=0.15。

本实施例通过采集各气象站点的小时级气象数据及小时级日照辐射数据,根据所述小时级气象数据及小时级日照辐射数据构建样本数据集;对所述样本数据集进行预处理,以获得训练样本集;根据所述训练样本集构建回归预测模型及机器学习模型;根据所述训练样本集、所述回归预测模型及所述机器学习模型确定日照辐射量预测模型。由于在构建样本数据集之后,对样本数据及进行了预处理,对不利于计算的数据进行标签编码,且将样本数据中缺失的数据进行补全,使得对样本数据进行归一化更加准确,更便于模型训练,且在进行模型融合时采用K折模型融合算法及合理的加权融合算法,使得融合得到的日照辐射量预测模型的泛用性更强,避免了单一模型精度低的缺陷,进一步提高了日照辐射量预测模型的预测精度,使预测的日照辐射量更加准确。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有日照辐射量预测程序,所述日照辐射量预测程序被处理器执行时实现如上文所述的日照辐射量预测方法的步骤。

参照图4,图4为本发明日照辐射量预测装置第一实施例的结构框图。

如图4所示,本发明实施例提出的日照辐射量预测装置包括:

数据转换模块401,用于获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据;

数据分析模块402,用于将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据;

数据处理模块403,用于对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。

本实施例通过获取各气象站点的小时级天气预报数据,并对所述小时级天气预报数据进行预处理,以获得模型输入数据;将所述模型输入数据输入日照辐射量预测模型中进行分析,以获得各气象站点对应的预测辐射数据;对所述预测辐射数据进行逆归一化处理,以获得各气象站点对应的小时级预测日照辐射量。由于日照辐射量预测模型是由不同模型构建方法构建的多个模型融合得到的模型,而并非简单的根据现行回归构建的模型,预测精度高,可以准确的预测日照辐射量。

进一步地,所述数据转换模块401,还用于采集各气象站点的小时级气象数据及小时级日照辐射数据,根据所述小时级气象数据及小时级日照辐射数据构建样本数据集;对所述样本数据集进行预处理,以获得训练样本集;根据所述训练样本集构建回归预测模型及机器学习模型;根据所述训练样本集、所述回归预测模型及所述机器学习模型确定日照辐射量预测模型。

进一步地,所述数据转换模块401,还用于采集各气象站点的小时级气象数据及小时级日照辐射数据;获取所述小时级气象数据对应的气象采集时间,并获取所述小时级日照辐射数据对应的辐射采集时间;基于所述辐射采集时间及所述气象采集时间将所述小时级气象数据及小时级日照辐射数据进行关联,以获得样本数据;根据所述样本数据构建数据集合;依据所述辐射采集时间或所述气象采集时间对所述数据集合中的样本数据进行排序,以获得样本数据集。

进一步地,所述数据转换模块401,还用于根据所述样本数据集中的样本数据确定样本数据中位数及样本数据四分距;根据所述样本数据中位数及所述样本数据四分距对所述样本数据集中的样本数据进行归一化处理,以获得训练样本集。

进一步地,所述数据转换模块401,还用于对所述样本数据集中的各个样本数据进行标签编码,并使用均值法对标签编码后的样本数据集中的各个样本数据进行缺值补全,以获得修改后的样本数据集;根据所述修改后的样本数据集中的样本数据确定样本数据中位数及样本数据四分距。

进一步地,所述数据转换模块401,还用于基于K折模型融合算法及所述训练样本集,对所述第一回归预测模型、所述第二回归预测模型及所述第三回归预测模型进行模型融合,以获得融合辐射预测模型;获取所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值;基于所述预设融合权值将所述融合辐射预测模型、所述第四辐射预测模型及所述第五辐射预测模型进行融合,以获得日照辐射量预测模型。

进一步地,所述数据转换模块401,还用于获取验证样本集,并根据所述验证样本集确定所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预测准确度;根据所述预测准确度确定所述融合辐射预测模型、所述第一机器学习模型及所述第二机器学习模型分别对应的预设融合权值。

应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。

需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。

另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的日照辐射量预测方法,此处不再赘述。

此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号