首页> 中国专利> 预测模型的训练、预测方法、装置、设备、程序和介质

预测模型的训练、预测方法、装置、设备、程序和介质

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请公开了一种空气质量预测模型的训练方法、预测方法、装置、设备、程序和介质，涉及计算机技术领域，尤其深度学习技术。该方法包括：将目标监测范围划分成为多个区域；采用预训练样本和预训练目标函数，对空气质量预测模型进行预训练，所述预训练样本包括所述实测值；采用正式训练样本和正式训练目标函数，对经过预训练的空气质量预测模型进行训练，所述正式训练样本包括所述实测值；其中，所述空气质量预测模型用于根据空间信息、历史信息和环境信息，对所述多个区域的空气质量进行预测。本申请能够以不同的预训练样本和目标函数，达到优化的训练目标。

著录项

公开/公告号CN112561191A

专利类型发明专利
公开/公告日2021-03-26

原文格式PDF
申请/专利权人北京百度网讯科技有限公司;
展开▼

申请/专利号CN202011534216.8
发明设计人刘浩;韩金栋;窦德景;
展开▼

申请日2020-12-22
分类号G06Q10/04(20120101);G06Q10/06(20120101);G06N3/04(20060101);G06N3/08(20060101);
代理机构11332 北京品源专利代理有限公司;
代理人孟金喆
地址 100085 北京市海淀区上地十街10号百度大厦2层
入库时间 2023-06-19 10:24:22

说明书

技术领域

本申请涉及人工智能领域，尤其涉及深度学习技术，具体涉及一种空气质量预测模型的训练方法、预测方法、装置、设备、程序和介质。

背景技术

城市化的快速发展给人们的生活、工作、交通等带来了便利的同时，也不可避免地在全球范围内造成了频繁发生的空气污染。如果能提前准确预测城市各区域的空气质量，就可以通过污染排放控制和早期干预，减少甚至防止空气污染造成的潜在损失。但是，由于高昂的建设和维护成本，一个城市只能部署有限数量的空气质量监测站，无法覆盖到城市的每一个区域。因此，需要对这些监测站点无法覆盖到的区域的未来空气质量进行有效预测。

对空气质量的预测，要么依赖于精确的污染源信息，要么预测粒度比较粗糙，准确性低，不能满足人们对城市细粒度空气质量预测的需求。

发明内容

本公开提供了一种空气质量预测模型的训练方法、预测方法、装置、设备、程序和介质。

根据本公开的一方面，提供了一种空气质量预测模型的训练方法，包括：

将目标监测范围划分成为多个区域，其中，所述多个区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域，并获取所述实测区域中的空气质量实测值；

采用预训练样本和预训练目标函数，对空气质量预测模型进行预训练，所述预训练样本包括所述实测值；

采用正式训练样本和正式训练目标函数，对经过预训练的空气质量预测模型进行训练，所述正式训练样本包括所述实测值；

其中，所述空气质量预测模型用于根据空间信息、历史信息和环境信息，对所述多个区域的空气质量进行预测。

根据本公开的另一方面，提供了一种空气质量预测方法，包括：

获取目标监测范围内至少一个实测区域在至少两个时刻的空气质量实测值；其中，所述目标监测范围被划分为多个区域，多个所述区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域；

将所述空气质量实测值输入空气质量预测模型，以预测所述预测区域在当前时刻之后未来时刻的空气质量值；

其中，所述空气质量预测模型采用本申请任意实施例所提供的空气质量预测模型的训练方法训练而成。

根据本公开的再一方面，提供了一种空气质量预测模型的训练装置，包括：

区域实测值获取模块，用于将目标监测范围划分成为多个区域，其中，所述多个区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域，并获取所述实测区域中的空气质量实测值；

模型预训练模块，用于采用预训练样本和预训练目标函数，对空气质量预测模型进行预训练，所述预训练样本包括所述实测值；

模型正式训练模块，用于采用正式训练样本和正式训练目标函数，对经过预训练的空气质量预测模型进行训练，所述正式训练样本包括所述实测值；

其中，所述空气质量预测模型用于根据空间信息、历史信息和环境信息，对所述多个区域的空气质量进行预测。

根据本公开的再一方面，提供了一种空气质量预测装置，包括：

实测值获取模块，用于获取目标监测范围内至少一个实测区域在至少两个时刻的空气质量实测值；其中，所述目标监测范围被划分为多个区域，多个所述区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域；

空气质量预测模块，用于将所述空气质量实测值输入空气质量预测模型，以预测所述预测区域在当前时刻之后未来时刻的空气质量值；

其中，所述空气质量预测模型采用本申请任意实施例所提供的空气质量预测模型的训练方法训练而成。

根据本公开的再一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任意实施例所提供的空气质量预测模型的训练方法或本申请任意实施例所提供的空气质量预测方法。

根据本公开的再一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行本申请任意实施例所提供的空气质量预测模型的训练方法或本申请任意实施例所提供的空气质量预测方法。

根据本公开的再一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据本申请任意实施例所提供的空气质量预测模型的训练方法或本申请任意实施例所提供的空气质量预测方法。

根据本申请的技术解决了细粒度区域空气质量预测模型的训练问题，提高了模型训练结果的准确性，减少了模型训练的计算量。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1为本申请实施例提供的一种空气质量预测模型的训练方法的流程图；

图2为本申请是实施例提供的一种空气质量预测模型的模型架构图；

图3为本申请实施例提供的一种空气质量预测方法的流程图；

图4为本申请实施例提供的一种空气质量预测模型的训练装置的结构框图；

图5为本申请实施例提供的一种空气质量预测装置的结构框图；

图6示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1为本申请实施例提供的一种空气质量预测模型的训练方法的流程图。该方法适用于构建并训练得到空气质量预测模型。

目前，为了进行空气质量监测，往往会在城市中的一些位置设置空气质量监测站，能够实时监测空气质量数据，例如，典型的PM2.5，PM10等表征空气质量的数据。但是，空气质量监测站在城市中的覆盖率不会很高，例如在10％左右，空气质量监测站能够实测的地理范围是有限的。本申请实施例的技术方案可以利用城市中有限的空气质量监测站所提供的空气质量实测值作为样本数据，对预测模型进行训练，以对没有空气质量监测站的区域的空气质量进行细粒度的预测。

该模型的训练方法可以由配置于计算设备中的空气质量预测模型的训练装置来执行，该装置可以采用硬件和/或软件的方式来实现，该装置可配置于具备计算和存储能力的电子设备中。该方法包括：

S110、将目标监测范围划分成为多个区域，并获取实测区域中的空气质量实测值；其中，多个所述区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域；

目标监测范围是空气质量预测模型的目标预测范围，基于该目标监测范围内的样本数据对模型进行训练，训练好的模型也用于预测该目标监测范围内各区域的空气质量。目标监测范围例如可以是城市级别的地理范围。

将目标监测范围划分成为多个相互不重叠的区域，各个区域的形状和范围，可以相同或不同，区域划分的依据可以以实际需求为准。即，可以将所述目标预测范围，以路段或街道为单位，划分成为多个区域。以城市作为目标监测范围为例，可以按照行政区域的街道或乡镇来划分，每条街道可作为一个区域。路段或街道划分的区域更符合空气质量管控目标，例如，可针对空气质量较差的路段或街道，进行工业、绿化设施的规划，或者进行交通流量的管控。

在这些区域中，包括实测区域和预测区域。实测区域是区域中设置有空气质量监测站，即能够获得空气质量实测值的区域。预测区域是不能获得空气质量实测值的区域。

在实测区域中，可以有一个或多个空气质量监测站，则该实测区域的空气质量实测值可以根据一个或多个空气质量监测站的监测值共同确定。可选的，获取实测区域中的空气质量实测值包括：

以所述实测区域中的一个空气质量监测站的实测值，作为所述实测区域的空气质量实测值；或

计算所述实测区域中的多个空气质量监测站的实测值的平均值，作为所述实测区域的空气质量实测值。

实测区域的空气质量实测值，由多个空气质量监测站的实测值进行综合确定，能够更加准确。可以选择较为简洁的计算方式，减少计算量。

S120、采用预训练样本和预训练目标函数，对空气质量预测模型进行预训练；

其中，所述空气质量预测模型用于根据空间信息、历史信息和环境信息，对所述多个区域的空气质量进行预测。空间信息体现区域之间的空间影响，历史信息体现历史空气质量影响，环境信息体现了区域的环境相似度，由此考虑多方面因素对区域的空气质量进行预测。

在本申请实施例中，提出了一个多视角多任务的空气质量预测框架，从不同视角来学习当前预测区域的空气质量表征并进行融合。

首先，根据托布勒地理学第一定律，空间上相邻的区域比离得远的区域更为相关，由此可以根据空间的区域邻接关系来推断区域的空气质量。即，在空气质量预测模型中从空间视角考虑了区域之间的空间影响；

第二，当前区域空气质量还取决于前一个时段的空气质量状况，在预测的时候应考虑到这一点。即，在空气质量预测模型中从时间视角考虑了历史空气质量影响；

第三，相似的两个区域可能具有相似的区域空气质量，比如说，两个区域都靠近绿地或者工业区，则区域环境上下文也可以作为当前空气质量估计的考虑要素。区域环境上下文可称为区域的环境语义特征，则在空气质量预测模型中从环境视角考虑了区域的环境相似度。

对区域的空间视角、时间视角和环境视角的空气质量表征结果进行融合，用于预测区域的空气质量。由于划分了多个区域，且需要从多个视角进行空气质量的关联和预测，所以模型规模较大，训练的计算成本较高。本申请实施例为提高训练效率，采用了预训练方式。预训练所采用的训练样本和目标函数均与正式训练的训练样本和目标函数不同。

由于本申请实施例的空气质量预测模型从多个视角构建了区域中空气质量的影响因素，因此，预训练可以从空间视角、时间视角和环境视角中的任意一个首先进行训练。优选是，从空间视角，对区域的空间影响关系进行预训练。由于时间视角的空气质量影响也需要基于区域的空气质量基础数据进行预测，而环境视角的影响可以独立出去，所以预训练还可以是在进行空间视角的预训练之后，再排除环境视角的数据进行二次预训练。排除环境视角影响即可以在预训练样本中不携带环境语义特征的数据。

S130、采用正式训练样本和正式训练目标函数，对经过预训练的空气质量预测模型进行训练。

基于预训练之后的空气质量预测模型，采用包括完整数据的正式训练样本，进行正式训练，可以使得空气质量预测模型更加快速的收敛，而完成训练过程。预训练样本和预训练目标函数，与正式训练样本和正式训练目标函数均不相同，由此可以从不同规模和角度对空气质量预测模型进行训练。可选的，本案中空气质量预测模型从空间、时间和环境等多角度对空气质量进行预测，由于考虑的因素多，因此模型的计算量大。所以，可以先对一个或两个设定因素进行一次预训练或先后两次预训练，再在预训练后的模型基础上，对模型进行整体的正式训练。能够方便模型快速收敛，减少计算量。

本申请实施例的技术方案，通过空间视角、时间视角和环境视角等多个视角来对细分粒度的区域进行空气质量预测，能够使得空气质量的预测更加准确，精细化。同时，采用了预训练的模式，能够使得模型训练的计算量减少，快速收敛。

图2为本申请是实施例提供的一种空气质量预测模型的模型架构图，本实施例以前述实施例为基础，提供了一种优选的模型架构。

如图2所示，所述空气质量预测模型包括：空间影响子模型21、时间影响子模型22、环境影响子模型23、影响融合子模型24、预测子模型25和输出子模型26。其中：

所述影响融合子模型24，分别与所述空间影响子模型21、时间影响子模型22和环境影响子模型25的输出端相连，用于基于自注意力层对所述空间影响子模型21、时间影响子模型22和环境影响子模型23各自输出的质量向量进行关键信息提取和融合，输出融合质量向量；

所述预测子模型25，用于根据影响融合子模型24计算输出未来时刻的预测质量向量。可选的是，预测子模型25包括图神经网络251和门控递归模型252；所述图神经网络251用于根据各区域之间的空间影响对所述融合质量向量进行更新，以输出图质量向量，每个所述区域作为图中的节点，区域的图质量向量作为节点的属性，相邻区域之间的空气质量空间影响作为节点的边权值；所述门控递归模型252，用于根据区域的至少两个历史时刻的图质量向量计算输出当前时刻之后未来时刻的预测质量向量；

所述输出子模型26，用于基于前馈神经网络，根据所述预测子模型25生成区域的空气质量预测值。

本实施例所提供的空气质量预测模型，基于多视角的空间影响子模型21、时间影响子模型22、环境影响子模型23，能够分别考虑空间、时间和环境的影响，基于有限实测区域的空气质量实测值计算得到预测区域的空气质量向量。预测子模型25包括了图神经网络251和门控递归模型252，能够在预测环节，通过图神经网络考虑区域之间的空间影响，还能够通过门控递归模型考虑区域内空气质量的时间影响，得到更加精准的预测结果。

在上述方案中，优选的是：

所述空间影响子模型21，用于根据各区域之间的空间影响，基于实测区域的空气质量实测值计算输出预测区域的空间质量向量；

所述时间影响子模型22，为门控递归模型，用于根据实测区域的至少两个历史时刻的空气质量实测值计算输出当前时刻的时间质量向量；

所述环境影响子模型23，用于将与预测区域具有设定环境语义相似度的实测区域的空气质量实测值进行聚合后，获取聚合后的环境质量向量。

上述所提及的质量向量，例如空间质量向量、时间质量向量、环境质量向量、融合质量向量、图质量向量等，均是区域中空气质量的表征向量，是某个子模型输出的作为中间数据的质量向量。实测值一般为某些指标的标量值，而质量向量是对区域中空气质量标量值的特征，以向量形式表达的向量数据，更加适合在深度学习模型中进行计算。

将多视角的空气质量向量进行融合后，基于预测子模型进行空气质量预测的过程中，能够通过图神经网络来考虑区域空气质量的空间影响，基于门控递归模型考虑时间影响，从而进行未来时刻空气质量的有效预测。预测子模型和时间影响子模型中，都会采用门控递归模型来考虑区域中不同时刻空气质量的影响，且该时间影响的规律是一致的，因此，所述预测子模型和时间影响子模型可复用同一个门控递归模型。使得在时间影响子模型训练学习到的当前时刻区域的时间影响模型参数后，能够复用给预测阶段区域中各个时刻空气质量的影响。

输出子模型，作为空气质量预测模型的输出层，能够输出空气质量标量形式的预测值，方便用户识别。

本实施例中所提供的空气质量预测模型，包括了两个阶段的模型，第一阶段是空气、时间和环境影响子模型，能够从多个视角考虑当前时刻区域的空气质量受到相邻区域、历史时刻和相似环境区域的影响，从而计算得到各个预测区域在当前时刻以及各个历史时刻的空气质量向量。第二阶段是预测阶段，能够基于第一阶段计算获得的各个区域、各个时刻的空气质量向量，对未来时刻的空气质量进行预测。最终预测结果可通过作为输出层的输出子模型来以标量形式输出。整体模型架构为多视角多任务的架构，能够对细粒度的区域空气质量进行准确预测。

下面分别介绍本申请实施例中空气质量预测模型的各个子模型的可选实施方案。

(一)空间影响子模型

空间影响子模型是从空间视角考虑区域之间的影响。从空间角度推断当前未覆盖区域(即预测区域)的空气质量。具体来说，目标是基于附近有空气质量实测值的实测区域，学习得到预测区域中的空气质量向量。

可选的，所述空间影响子模型的公式如下：

其中，

dist(r

通过上述空间影响子模型，能够考虑区域之间的空间距离，进而通过学习，来确定实测区域的空气质量实测值与预测区域中空气质量向量之间的相对关系。从而能够有效基于有限的实测值对相邻区域的空气质量向量进行计算获得。

(二)时间影响子模型

时间影响子模型是是从时间视角考虑区域的空气质量向量。具体可通过一个门控循环网络来融入局部的时间信息，进一步从时间视角来推断空气质量。门控循环网络，也可称为门控递归模型，是一种简单有效的循环神经网络变种，能够考虑一个区域中多个历史时刻的空气质量对当前时刻空气质量的影响，建模时间序列的长期依赖关系。在门控递归模型中包括隐含层，能够输出隐含层向量H。隐含层向量H能够反映输入的空气质量向量的特征。

可选的，时间影响子模型的公式如下：

其中，

其中：

其中，W

输入空间影响子模型输出的t-1时刻各个区域的空间质量向量，通过上述公式可以计算出t-1时刻的隐层状态

通过时间影响子模型，能够有效考虑区域中空气质量随着时间变化的延续性，使得空气质量的预测准确率更高。

(三)环境影响子模型

环境影响子模型是从环境视角对区域中空气质量关系的学习。其原理是，具有相似环境的区域，其空气质量特征也会相似。环境以环境语义特征来表示，也称环境上下文，能够反映该区域中对空气质量构成影响的静态环境因素，例如，该区域中设置的绿化带、工业区、行政区，或者路网，这些因素都会对空气质量构成一定影响。在实践中，城市区域中的环境因素可以用POI(兴趣点)和路网密度来反映环境语义特征。具体是，所述环境语义特征包括区域内所覆盖兴趣点的环境影响类别和/或路网数据。兴趣点可按照环境影响类别来划分，具体的环境影响类别可按照需求预先设置，例如包括：优、良、中、差等级别，绿化带的环境影响类别为优、化工厂的环境影响类别为差。还可以包括路网数据，以路段的数量、路段的密度来反映路网数据。环境语义特征可以构造为一个向量，向量中的每个元素分别反映POI的环境影响类别和路网数据，可拼接在一起构成环境语义特征，由此能够准确反映该区域的环境因素。

进而可基于环境语义特征确定区域之间的环境语义相似度，再通过环境语义聚合器，将具有相似环境语义特征的实测区域的空气质量实测值进行聚合，来计算预测区域的空气质量向量，记为环境质量向量。

可选的，环境影响子模型的公式如下：

其中，

其中，sim(·,·)是基于欧几里德距离的相似度函数；

通过从环境视角来考虑区域之间的空气质量关系，能够有效利用实测区域的实测值来计算相似环境区域的预测值。

在分别构建了空间影响子模型、时间影响子模型、环境影响子模型后，能够分别得到作为输出的各个区域在t时刻的空间质量向量、时间质量向量和环境质量向量。而后将空间质量向量

可选的，影响融合子模型的公式如下：

其中，

其中，Attn(·)是一个注意力机制函数，

基于上述空间影响子模型、时间影响子模型和环境影响子模型，能够基于有限的实测值确定各个区域t时刻的空气质量向量，为预测未来时刻(t+1时刻、t+2时刻……)的空气质量数据，具体可通过预测子模型来进行计算。

对于区域中未来时刻的空气质量预测，也会考虑相邻区域的空间影响、相同区域的时间影响和该区域的环境影响。

对于空间影响，具体通过图神经网络来学习区域之间的空气质量影响关系。首先将各个区域分别看作节点，构建拓扑图。每个所述区域作为图中的节点，区域的图质量向量作为节点的属性，相邻区域之间的空气质量空间影响作为节点的边权值。该图的初始图质量向量可以采用影响融合子模型输出的融合质量向量。而后通过图神经网络的学习来调整融合质量向量。

可选的，所述图神经网络的公式如下：

其中，X

其中，v

采用图神经网络能够反映区域的空间相关性，在预测过程中对区域的空气质量向量进行调整，以提高预测的准确性。

每个区域的空气质量不仅与图上的相邻节点相关，而且还受其前一时刻的空气质量影响。因此，在预测子模型中，进一步引入门控递归模型(GRU)。将图神经网络融入门控递归模型，用于时间依赖性建模。考虑一个区域r

在预测子模型输出的是空气质量向量，为了更好表达空气质量值，可选的是通过输出子模型进行输出，例如，输出子模型采用前馈神经网络f(·)来输出空气质量预测值，其公式如下：

其中，

本申请实施例所采用的输出子模型，结合了预测子模型中的隐层输出向量，以及结合了环境语义和天气情况的特征，能够全面综合考虑各种情况，使得预测结果更加准确。预测子模型的隐层输出向量充分体现了区块的空气质量受到空间、时间和环境影响的特征。

在本申请实施例中，通过至少一次预训练对空气质量预测模型进行预先训练。本申请实施例所采用的预训练可以包括节点级预训练和任务级预训练，而后再进行正式训练。下面通过实施例对预训练过程进行详细说明。

(一)节点级预训练

在节点级的预训练中，目标是学习一个通用的图神经网络(GNN)来编码各种图的拓扑结构属性。节点级预训练的主要思想是利用拓扑信息作为监督信号，优化区域表征，使相邻区域在隐空间中彼此接近。具体来说，采用在多视角多任务学习中获得的区域r

具体的，节点级预训练中，预训练样本为各所述实测区域、至少两个历史时刻的空气质量实测值，预训练目标函数为区域的图质量向量之间的相似度。

可选的，区域的图质量向量之间的相似度为余弦相似度L

其中，σ是非线性激活函数；P

图质量向量的初始值是融合质量向量，经过对图神经网络的处理后，更新为图质量向量。负采样分布区域是对于任一区域而言，从相邻区域中随机确定的区域集合。

节点级预训练能够从区域的空间影响角度进行考虑，以较小计算规模对模型进行预先训练，提高模型的收敛速度、降低计算成本。

(二)任务级预训练

在节点级预训练的基础上，还可以引入任务级预训练，采用各种区域特征作为监督信号，将高度相关的预测性任务的知识融入到模型参数中。一般来说，任意的区域特征均可以作为自监督信号。然而，在实际应用中，气象特征的粒度比较粗糙(即一些相邻的节点可能共享相同的气象信息)，且环境语义特征(例如POI、路网)并不随时间变化。预测这些信息量较少的特征可能会引入额外的噪声并导致负迁移。为此，在任务级预训练时，只采用区域空气质量特征作为自监督信号。具体地，只使用部署了监测站的区域来构造区域图，图上的每一个节点都具有真实的空气质量实测值。训练一个GNN提取每一个节点周围的空气质量以及环境信息，建模空间相关性。然后，使用一个全连接层处理GNN的输出，得到每个节点最终的空气质量预测值。模型在自监督学习下对节点级预训练中获得的GNN进行进一步的微调。任务级预训练遵循硬参数共享的多任务学习范式，这样不同的监督信号可以通过特定任务的输出层反向传播。预训练的网络参数集成了通用的图拓扑信息和各种环境语义信息，将这些网络参数应用于下游的未来细粒度空气质量预测任务并进行微调。

具体的，在任务级预训练中，预训练样本可以为各所述实测区域、至少两个历史时刻的空气质量实测值，预训练目标函数为所述空气质量预测模型输出的空气质量预测值与空气质量实测值之间的均方误差函数。

由上述介绍可知，任务级预训练能够通过排除环境语义特征的参与，从而简化模块训练过程。

总体而言，时空预训练策略可以分别采用节点级预训练或任务级预训练。优选是，首先进行节点级预训练，然后进行任务级预训练。

则，在本申请实施例中，采用预训练样本和预训练目标函数，对空气质量预测模型进行预训练的操作可选的是包括：

采用各所述实测区域、至少两个历史时刻的空气质量实测值作为预训练样本，采用区域的图质量向量之间的相似度作为节点预训练目标函数，对空气质量预测模型进行节点级预训练；

采用各所述实测区域、至少两个历史时刻的空气质量实测值作为预训练样本，采用所述空气质量预测模型输出的空气质量预测值与空气质量实测值之间的均方误差函数作为任务预训练目标函数，对空气质量预测模型进行任务级预训练。

通过节点级预训练和任务级预训练的联合训练，能够首先优化区域空气质量的空间影响，再进一步优化时间影响，且同时减少训练的难度，加快计算速度。

在经过预训练之后，本申请实施例基于预训练的空气质量预测模型，进行正式训练。经过预训练的模型，其模型参数已经得到了一定程度的优化，在正式训练的过程中能够更快速的收敛。

对于正式训练，可选的是，正式训练样本包括各所述实测区域、至少两个历史时刻的空气质量实测值，以及区域的环境语义特征；正式训练目标函数包括第一正式目标函数和第二正式目标函数，所述第一正式目标函数是影响融合子模型输出的融合质量向量的分类结果的函数，所述第二正式目标函数是最小化空气质量实测值与空气质量预测值之间的最小二乘误差。

在正式训练时，训练样本包括全面的特征，即各个实测区域的、各个时刻的实测值，以及各区域的环境语义特征。正式训练目标函数优选是包括了两个部分，第一正式目标函数侧重判断影响融合子模型的分类结果，即脱离预测环节判断区域的空气质量向量的计算是否准确；第二正式目标函数则从最终预测值的角度，监督学习预测值与样本实测值之间的关系，从而对模型进行优化。

下面分别介绍第一正式目标函数和第二正式目标函数的可选实施方案。

可选的，所述第一正式目标函数包括对于空气质量数值回归任务以及所有时刻的均方误差损失函数，以及对于空气质量指数分类任务的交叉熵损失函数。可以使用Adam优化器来训练整个模型。

具体的，可采用如下公式作为所述第一正式目标函数L

其中，β

其中，T为训练样本所涉及时刻的集合，t为时刻的序号；R

其中，

在本申请实施例中，为了使空气质量数值预测的结果更加稳定，进一步引入了一个多类别分类任务来推断当前的空气质量指数，定义为

空气质量指数分类任务的交叉熵损失函数，用于对影响融合子模型输出的反映区域空气质量向量结果进行分类，并以分类结果进行模型的纠正训练，使得模型训练更加准确。

空气质量数值回归任务，是将反映区域中空气质量特征的、向量形式的空气质量向量，通过回归方式转换成为区域中、标量形式的空气质量数值，并基于标量值进行模型的优化训练，能够避免后续在向量和标量的输出过程中引入的误差。

可选的，所述空气质量预测值采用满足如下公式的线性回归单元计算确定：

其中，

具体的，可采用如下公式作为所述第二正式目标函数L

其中，

第二正式目标函数，进一步考虑了预测子模型、输出子模型的整体输出结果，综合对整个模型进行反馈优化训练。

本申请实施例的技术方案，无需依赖于精确的污染源信息，由此不会由于污染源信息不足而导致空气质量预测出现严重偏差。并且，能够实现细粒度的空气质量预测，预测细粒度区域的空气质量对人们的出行决策和政府的政策制定非常有利，特别是在基础设施较少的地区进行环境预测，需求尤为迫切。

在本申请实施例中，将区域级的空气质量预报作为一个半监督的深度学习问题。首先通过一个多视角多任务学习框架来估计那些没有监测站点覆盖的区域的空气质量，然后使用图卷积网络和门控循环网络分别建模区域的空间相关性和时间相关性，进而生成最终的预测结果。深度神经网络的性能很大程度上依赖于大量的标记数据。然而，由于区域空气质量数据的稀疏性，无法充分利用标签信息，可能会导致预测效果不理想。因此，提出了时空预训练策略来学习鲁棒和可迁移的神经网络参数，以便模型可以很容易地针对只有少量标签的下游任务进行微调。本申请实施例中，时空预训练策略的关键是使用图拓扑和环境上下文信息来进行自监督表示学习。具体来说，时空预训练包括两个部分：节点级预训练和任务级预训练。

本申请实施例的技术方案，使用稀疏的历史空气质量实测数据、天气数据和区域环境语义数据，提出了一个基于多视角多任务学习的实时空气质量预测模型，通过融合不同的视角以及辅助空气质量指数分类任务，从而提高模型预测的性能。

上述技术方案克服了基于数值的方法的局限，从大量历史数据中直接学习空气质量模式，不依赖于具体的污染源信息。

已有技术方案和产品主要是基于站点级别或城市级别来预测空气质量，而本申请实施例进行了更加精细化的建模，对街道和乡镇级区域进行了细粒度的空气质量预测，可以为地方政府和人们的出行提供更好的决策支持。通过时空预训练策略，可以更加高效地利用区域的信息，学习到更加鲁棒和可迁移的模型参数，提升空气质量预测的泛化性能。

图3为本申请实施例提供了一种空气质量预测方法，该方法用于对空气质量进行预测，可以由空气质量预测装置来执行，该装置可以采用硬件和/或软件的方式实现，可以集成于电子设备中。优选可作为客户端中的空气质量预测功能来实现，例如天气预报客户端。该方法包括：

S310、获取目标监测范围内至少一个实测区域在至少两个时刻的空气质量实测值；其中，所述目标监测范围被划分为多个区域，多个所述区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域；

S320、将所述空气质量实测值输入空气质量预测模型，以预测所述预测区域在当前时刻之后未来时刻的空气质量值；

其中，所述空气质量预测模型采用本申请实施例所提供的空气质量预测模型的训练方法训练而成。

本申请实施例的技术方案，解决的是细粒度空气质量预测的问题，例如，可以将城市按照街道和乡镇划分成不重叠的区域，根据稀疏的空气质量监测站的实测数据和多源异构城市数据，预测每一个区域的未来空气质量。采用本申请实施例的技术方案，能提前准确预测城市各区域的空气质量，就可以通过污染排放控制和早期干预，进而减少甚至防止空气污染造成的潜在损失。由此，可以对监测站点无法覆盖到的区域的未来空气质量进行有效预测。

图4为本申请实施例提供的一种空气质量预测模型的训练装置的结构框图。该装置400包括：

区域实测值获取模块410，用于将目标监测范围划分成为多个区域，其中，所述多个区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域，并获取所述实测区域中的空气质量实测值；

模型预训练模块420，用于采用预训练样本和预训练目标函数，对空气质量预测模型进行预训练，所述预训练样本包括所述实测值；

模型正式训练模块430，用于采用正式训练样本和正式训练目标函数，对经过预训练的空气质量预测模型进行训练，所述正式训练样本包括所述实测值。其中，所述空气质量预测模型用于根据空间信息、历史信息和环境信息，对所述多个区域的空气质量进行预测。

该装置可选的是：

所述空气质量预测模型包括：空间影响子模型、时间影响子模型、环境影响子模型、影响融合子模型、预测子模型和输出子模型；其中：

所述影响融合子模型，分别与所述空间影响子模型、时间影响子模型和环境影响子模型的输出端相连，用于基于自注意力层对所述空间影响子模型、时间影响子模型和环境影响子模型各自输出的质量向量进行关键信息提取和融合，输出融合质量向量；

所述预测子模型，用于根据影响融合子模型计算输出未来时刻的预测质量向量；

所述输出子模型，用于基于前馈神经网络，根据所述预测子模型生成区域的空气质量预测值。

该装置可选的是：

所述预测子模型包括图神经网络和门控递归模型；所述图神经网络用于根据各区域之间的空间影响对所述融合质量向量进行更新，以输出图质量向量，每个所述区域作为图中的节点，区域的图质量向量作为节点的属性，相邻区域之间的空气质量空间影响作为节点的边权值；所述门控递归模型，用于根据区域的至少两个历史时刻的图质量向量计算输出未来时刻的预测质量向量。

该装置可选的是：

所述空间影响子模型，用于根据各区域之间的空间影响，基于实测区域的空气质量实测值计算输出预测区域的空间质量向量；

所述时间影响子模型，为门控递归模型，用于根据实测区域的至少两个历史时刻的空气质量实测值计算输出当前时刻的时间质量向量；

所述环境影响子模型，用于将与预测区域具有设定环境语义相似度的实测区域的空气质量实测值进行聚合后，获取聚合后的环境质量向量。

该装置可选的是：

所述预测子模型和时间影响子模型复用门控递归模型。

该装置可选的是：

预训练样本为各所述实测区域、至少两个历史时刻的空气质量实测值，预训练目标函数为区域的图质量向量之间的相似度。

该装置可选的是：

区域的图质量向量之间的相似度为余弦相似度L

其中，σ是非线性激活函数；P

该装置可选的是：

预训练样本为各所述实测区域、至少两个历史时刻的空气质量实测值，预训练目标函数为所述空气质量预测模型输出的空气质量预测值与空气质量实测值之间的均方误差函数。

该装置可选的是：

模型预训练模块具体包括：

节点级预训练单元，用于采用各所述实测区域、至少两个历史时刻的空气质量实测值作为预训练样本，采用区域的图质量向量之间的相似度作为节点预训练目标函数，对空气质量预测模型进行节点级预训练；

任务级预训练单元，用于采用各所述实测区域、至少两个历史时刻的空气质量实测值作为预训练样本，采用所述空气质量预测模型输出的空气质量预测值与空气质量实测值之间的均方误差函数作为任务级预训练目标函数，对空气质量预测模型进行任务预训练。

该装置可选的是：

正式训练样本包括各所述实测区域、至少两个历史时刻的空气质量实测值，以及区域的环境语义特征；正式训练目标函数包括第一正式目标函数和第二正式目标函数，所述第一正式目标函数是影响融合子模型输出的融合质量向量的分类结果的函数，所述第二正式目标函数是最小化空气质量实测值与空气质量预测值之间的最小二乘误差。

该装置可选的是：

所述第一正式目标函数包括对于空气质量数值回归任务以及所有时刻的均方误差损失函数，以及对于空气质量指数分类任务的交叉熵损失函数。

该装置可选的是：

采用如下公式作为所述第一正式目标函数L

其中，β

其中，T为训练样本所涉及时刻的集合，t为时刻的序号；R

其中，

该装置可选的是：

所述空气质量预测值采用满足如下公式的线性回归单元计算确定：

其中，

该装置可选的是：

所述第二正式目标函数的公式如下：

其中，

该装置可选的是：

所述空间影响子模型的公式如下：

其中，

dist(r

该装置可选的是：所述时间影响子模型的公式如下：

其中，

其中：

其中，W

该装置可选的是：所述环境语义特征包括区域内所覆盖兴趣点的环境影响类别和/或路网数据。

该装置可选的是：所述环境影响子模型的公式如下：

其中，

其中，sim(·,·)是基于欧几里德距离的相似度函数；

该装置可选的是：所述影响融合子模型的公式如下：

其中，

其中，Attn(·)是一个注意力机制函数，

该装置可选的是：所述图神经网络的公式如下：

其中，X

其中，v

该装置可选的是：所述输出子模型的公式如下：

其中，

该装置可选的是：区域实测值获取模块具体用于：

将所述目标预测范围，以路段或街道为单位，划分成为多个区域。

该装置可选的是：区域实测值获取模块具体用于：

以所述实测区域中的一个空气质量监测站的实测值，作为所述实测区域的空气质量实测值；或

计算所述实测区域中的多个空气质量监测站的实测值的平均值，作为所述实测区域的空气质量实测值。

本申请实施例所提供的一种空气质量预测模型的训练装置可用于执行本申请实施例所提供的空气质量预测模型的训练方法，具备相应的功能和模块。

图5为本申请实施例提供的一种空气质量预测装置的结构框图，该装置500包括：

实测值获取模块510，用于获取目标监测范围内至少一个实测区域在至少两个时刻的空气质量实测值；其中，所述目标监测范围被划分为多个区域，多个所述区域包括具有空气质量实测值的实测区域和不具有空气质量实测值的预测区域；

空气质量预测模块520，用于将所述空气质量实测值输入空气质量预测模型，以预测所述预测区域在当前时刻之后未来时刻的空气质量值；

其中，所述空气质量预测模型采用本申请任意实施例所提供的空气质量预测模型的训练方法训练而成。

本申请实施例所提供的一种空气质量预测装置可用于执行本申请实施例所提供的空气质量预测方法，具备相应的功能和模块。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示，设备600包括计算单元601，其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序，来执行各种适当的动作和处理。在RAM 603中，还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理，例如空气质量预测模型的训练方法或空气质量预测方法。例如，在一些实施例中，空气质量预测模型的训练方法或空气质量预测方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时，可以执行上文描述的空气质量预测模型的训练方法或空气质量预测方法的一个或多个步骤。备选地，在其他实施例中，计算单元601可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行空气质量预测模型的训练方法或空气质量预测方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 预测模型的训练、预测方法、装置、设备、程序和介质 [P] . 中国专利： CN112561191A . 2021-03-26
2. 轨迹预测模型训练以及轨迹预测方法、装置、设备及介质 [P] . 中国专利： CN114021080A . 2022-02-08
3. PREDICTION MODEL GENERATING APPARATUS, TRAVEL SUITABILITY PREDICTING APPARATUS, PREDICTION MODEL GENERATING METHOD, TRAVEL SUITABILITY PREDICTING METHOD, PROGRAM, AND RECORDING MEDIUM [P] . 美国专利： US2020342170A1 . 2020-10-29

机译：预测模型生成装置，旅行适合度预测装置，预测模型生成方法，旅行适合度预测方法，程序和记录介质
4. AIR QUALITY PREDICTION MODEL TRAINING METHOD, AIR QUALITY PREDICTION METHOD, ELECTRONIC DEVICE AND STORAGE MEDIUM [P] . US2021342722A1 . 2021-11-04

机译：空气质量预测模型训练方法，空气质量预测方法，电子设备和存储介质
5. WEATHER PARAMETER PREDICTION MODEL TRAINING METHOD, WEATHER PARAMETER PREDICTION METHOD, ELECTRONIC DEVICE AND STORAGE MEDIUM [P] . US2021341646A1 . 2021-11-04

机译：天气参数预测模型训练方法，天气参数预测方法，电子设备和存储介质