首页> 中国专利> 一种基于过站航班保障流程的航班延误预测方法

一种基于过站航班保障流程的航班延误预测方法

摘要

本发明公开了一种基于过站航班保障流程的航班延误预测方法,包括:收集并清洗特定时间段内机场在航班过站时流程节点上产生的时间数据;计算原始数据集合中所有航班实际起飞时间与计划离港时间的时间差值集合,得到各个节点差的标准时段;将航班各流程节点构建为具有逻辑关系的非欧空间的图网络结构;使用节点差的标准时段计算其与延误航班的时间差,将时间差作为节点特征载入图网络结构,构建并封装图数据集;搭建进行信息传递与信息更新的图卷积神经网络;得到最优的航班延误时间预测模型。本发明方法通过构建具有逻辑关系的图网络结构,对不正确的时间节点数据进行修正,预测航班延误时间,能够考虑不同延误发生环节的相关性,提高预测精度。

著录项

  • 公开/公告号CN114781704A

    专利类型发明专利

  • 公开/公告日2022-07-22

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202210368680.7

  • 申请日2022-04-08

  • 分类号G06Q10/04;G06Q10/06;G06Q50/30;G06N3/04;G06N3/08;

  • 代理机构江苏圣典律师事务所;

  • 代理人贺翔

  • 地址 210016 江苏省南京市秦淮区御道街29号

  • 入库时间 2023-06-19 16:04:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-22

    公开

    发明专利申请公布

说明书

技术领域

本发明属于空中交通管理技术领域,具体涉及一种基于过站航班保障流程的航班延误预测方法。

背景技术

随着民航业的快速发展,航空出行更密切地聚焦在提升航班服务效率与质量方面。然而,航班量的迅猛增长与空域资源的限制等原因带来的航班延误问题越来越严重,已成为航班服务质量下降的主要原因。

目前民航航班持续高位运行,航班过站时机场、空管、航司多方同时交织参与,保障系统满负荷运转,航班正点率难以提升。尽管当前已有大量针对航班延误问题的研究,然而目前延误预测方法大多将航班执行的过程视为整体,未根据航班执行的前序后序流程深入剖析延误产生的环节及前后关联性,造成延误预测精度不高。基于作业流程节点数据,在研究地面延误时考虑飞机过站流程中的节点时间和前后相关性,可以从新的视角研究航班延误预测问题,有利于提高航班延误预测精度,为提高机场运行效率、加快航司过站保障、缓解航班延误频发提供科学方法。

发明内容

针对于上述现有技术的不足,本发明的目的在于提供一种基于过站航班保障流程的航班延误预测方法,以解决现有技术中未考虑机场过站时产生的延误环节前后关联、航班延误预测精度不高的问题;本发明方法可从航班在地面保障流程中各类作业产生的时间数据入手,考虑航班过站时前后流程节点的关联性,将流程节点上的时间数据转化为非欧空间的图网络结构特征进行航班延误预测。

为达到上述目的,本发明采用的技术方案如下:

本发明的一种基于过站航班保障流程的航班延误预测方法,步骤如下:

(1)收集特定时间段内机场在航班过站时各流程节点上产生的时间数据,根据航班作业流程的逻辑关系对航班各流程上时间的原始数据进行清洗,并将其作为原始数据集合T

(2)计算原始数据集合T

(3)针对各航班流程节点的前后衔接特征,将航班各流程节点构建为具有逻辑关系的非欧空间的图网络结构G;

(4)使用各后序-前序流程节点的时间差值的标准时段集合D

(5)利用创建后的图网络结构G,搭建双层GCN、双层GAT、双层GraphSAGE、单层GCN与单层GraphSAGE结合的四种图卷积神经网络模型;

(6)选取三种机器学习模型,划分训练集、验证集和测试集,训练三种机器学习模型和搭建后的双层GCN、双层GAT、双层GraphSAGE、单层GCN与单层GraphSAGE结合的四种图卷积神经网络模型,通过调整参数得到三种机器学习模型和四种图卷积神经网络模型的最优模型;

(7)使用得到的三种机器学习模型和四种图卷积神经网络模型的最优模型进行模型结果对比与评价。

进一步的,所述步骤(1)中的过站航班流程节点包括:计划进港节点,实际落地节点,实际上轮挡节点,开舱门节点,关舱门节点,登机口开启节点,登机口关闭节点,实际撤轮挡节点,实际开始滑行节点,实际起飞节点,计划离港节点。

进一步的,所述步骤(1)中航班时间数据包括:计划进港时间,实际落地时间,实际上轮挡时间,开舱门时间,关舱门时间,登机口开启时间,登机口关闭时间,实际撤轮挡时间,实际开始滑行时间,实际起飞时间,计划离港时间。

进一步的,所述步骤(1)的具体过程如下:

(11)检查收集到的各航班时间集合的时间前后关联,将时间数据中记录异常值剔除(如该航班的某一时间点与其余时间点不在同一天,该航班的下一时间点比上一时间点早,该航班的上一时间点比下一时间点晚等);

(12)根据每条航班时间集合中记录的开舱门时间和关舱门时间的差值长度,将差值长度超过400且开舱门时间在晚上,关舱时间在第二天早上的数据归为隔夜航班集合T

(13)以收集到各航班的实际落地时间t

(14)将清洗后的所有时间数据作为原始数据集合T

进一步地,所述步骤(13)具体包括:

(131)针对第一类异常值,如果第i条航班的实际开始滑行时间t

式中,t

(132)针对第二类异常值,如果第i条航班的实际关舱门时间t

式中,t

进一步地,所述步骤(2)的具体过程如下:

(21)计算原始数据集合T

式中,d

(22)在隔夜航班集合T

式中,m表示一条航班包含的流程节点个数,p-name代表数据集中的航班条数,p-nonover和p-over分别表示非隔夜航班和隔夜航班的航班条数;

(23)在隔夜航班集合T

(24)分别统计隔夜航班集合T

进一步的,所述步骤(3)的具体过程如下:

(31)针对使用的航班流程节点数据创建图网络结构G=(V,E),G表示创建后的图网络结构,v

(32)针对图网络结构G分别构建图上的邻接矩阵和度矩阵,公式如下:

式中,A

进一步的,所述步骤(4)的具体过程如下:

(41)取出所有延误航班样本的边集合E,将边集合E通过流程节点编号进行转换,按照边的顺序和流程节点编号的大小依次排列,将排列后的边集合E'存储至数据集1中;

(42)将属于不同图的流程节点按照索引依次排列,每个图中的流程节点为同一索引值,得到索引集合I,将索引集合I存储至数据集2中;

式中,m表示一条航班包含的流程节点个数,p-delay表示延误航班的航班条数;

(43)利用步骤(24)中得到的非延误航班的标准时间段集合D

式中,T

(44)将样本中所有延误航班实际起飞时间与计划离港时间的时间差值集合D

(45)将所述数据集1、数据集2、数据集3和数据集4一同封装至图数据集中,使得每次取出的图网络结构均为原始图网络结构的子集。

进一步的,所述步骤(5)的具体过程如下:

(51)针对创建后的图网络结构G,使用传播规则f将图上的特征向下层传递,公式如下;

式中,H

(52)将层的传递映射到具体数据上,公式表示如下:

X

式中,f表示传播规则,X

(53)在搭建的GCN层中,传播规则f的传播公式如下:

式中,X

(54)构建GAT层,通过注意力系数实现为不同边分配不同的权重;

(55)构建GraphSAGE层,通过邻居采样将流程节点特征的全图训练模式转化成以流程节点特征为中心的小批量训练模式,采用聚合函数对邻居流程节点的信息进行特征聚合;

(56)针对不同图卷积神经网络层,考虑过站航班流程的时间作为特征输入以及需要预测的图导向任务,构建双层图卷积神经网络,包括搭建四种图卷积神经网络:双层GCN层、双层GAT层、双层GraphSAGE层、单层GCN层与单层GraphSAGE层相连的图神经网络;每个双层图神经网络与双层全连接神经网络相连,并与最后的池化层相接,将节点导向任务和边导向任务转化为全局的图导向任务,构成四种不同的图卷积神经网络模型。

进一步地,所述步骤(54)具体包括:

(541)GAT层在进行传递时,根据每个流程节点与不同的邻居流程节点相连的特点,计算流程节点v

式中,LeakyReLU表示激活函数,α

(542)根据计算得到的注意力系数,将特征加权求和,公式如下;

式中,x'

(543)根据每个流程节点的生成的新特征x'

进一步地,所述步骤(55)具体包括:

(551)GraphSAGE层在聚合邻居流程节点的特征后,再与自身流程节点的特征进行聚合,聚合方法具体如下表示;

式中,k表示总迭代聚合次数,W

(552)对每个流程节点聚合后的特征进行L2标准化,公式如下;

式中,V表示图网络结构中的流程节点集合,

进一步的,所述步骤(6)的具体过程如下:

(61)选取的三种机器学习模型为决策树模型、随机森林模型和XGBoost模型;

(62)划分训练集X

(63)将数据进行归一化处理,放入各模型中,采用K折交叉验证的方法,对每次运行的模型结果取平均,进行训练和调整参数,得到三种机器学习模型的最优模型;

(64)将训练集数据分别输入双层GCN、双层GAT、双层GraphSAGE、单层GCN与单层GraphSAGE结合的四种图卷积神经网络模型中进行训练,将平均绝对误差(MAE)作为反向传播的误差以更新权重,多次进行模型训练和调整参数,得到四种图卷积神经网络模型的最优模型。

进一步的,所述步骤(7)的具体过程如下:

(71)选取平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分误差(MAPE)三个指标以衡量各模型的预测值和真实值的距离;

(72)将测试集输入得到的三种机器学习模型和四种图卷积神经网络模型的最优模型中,利用(71)的指标对比三种机器学习模型和四种图卷积神经网络模型的性能。

本发明的有益效果:

本发明的方法聚焦于过站航班在地面保障时的多步流程,从各类流程相互关联和作业时间长短不一的角度出发,构建具有逻辑关系的图网络结构,从所有流程节点的时间集合中抽取出标准航班的作业流程时间,将延误航班的作业流程时间处理后得到图网络上的节点特征,从而将航班作业流程与航班延误预测相结合,以丰富航班延误预测的数据集、提高航班延误时间预测的精度。

本发明方法考虑了航班地面保障时作业流程的相关数据和数据间的逻辑关系,在航班地面起飞延误的产生机理和时间预测方面具有实际的应用价值。

附图说明

图1为本发明方法的流程图。

图2a为本发明实施例的非延误航班中非隔夜航班各时间差箱型图。

图2b为本发明实施例的非延误航班中隔夜航班各时间差箱型图。

图3为本发明实施例的旅客相关流程图。

图4为本发明实施例的图神经网络示意图。

图5为本发明实施例的K折交叉验证示意图。

具体实施方式

为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。

参照图1所示,本发明的一种基于过站航班保障流程的航班延误预测方法,步骤如下:

(1)收集特定时间段内机场在航班过站时各流程节点上产生的时间数据,根据航班作业流程的逻辑关系对航班各流程上时间的原始数据进行清洗,并将其作为原始数据集合T

其中,所述步骤(1)中的过站航班流程节点包括:计划进港节点,实际落地节点,实际上轮挡节点,开舱门节点,关舱门节点,登机口开启节点,登机口关闭节点,实际撤轮挡节点,实际开始滑行节点,实际起飞节点,计划离港节点。

所述步骤(1)中航班时间数据包括:计划进港时间,实际落地时间,实际上轮挡时间,开舱门时间,关舱门时间,登机口开启时间,登机口关闭时间,实际撤轮挡时间,实际开始滑行时间,实际起飞时间,计划离港时间。

示例中,采集上海浦东国际机场2019年6月1日至12月31日的所有过站航班保障流程节点的时间数据,采集的数据包括前站计划起飞时间、计划进港时间、前站实际起飞时间、实际落地时间、实际上轮挡时间等11个流程节点在内的时间集合;

由于采集的时间集合存在前后逻辑关系,需要对其进行数据的合理性分析及预处理;处理的原则为:

(11)检查收集到的各航班时间集合的时间前后关联,将时间数据中记录异常值剔除(如该航班的某一时间点与其余时间点不在同一天,该航班的下一时间点比上一时间点早,该航班的上一时间点比下一时间点晚等);

(12)由于示例数据中存在隔夜起飞情况,因此根据每条航班时间集合中记录的开舱门时间和关舱门时间的差值长度,将差值长度超过400且开舱门时间在晚上,关舱时间在第二天早上的数据归为隔夜航班集合T

(13)以收集到各航班的实际落地时间t

(131)第一类异常值使用实际开始滑行时间进行举例说明,如果第i条航班的实际开始滑行时间t

式中,t

(132)第二类异常值使用实际关舱门时间进行举例说明,如果第i条航班的实际关舱门时间t

式中,t

(14)将清洗后的所有时间数据作为原始数据集合T

(2)计算原始数据集合T

所述步骤(2)的具体过程如下:

(21)计算原始数据集合T

式中,d

(22)在隔夜航班集合T

式中,m表示一条航班包含的流程节点个数,p-name代表数据集中的航班条数,p-nonover和p-over分别表示非隔夜航班和隔夜航班的航班条数;

(23)在隔夜航班集合T

(24)分别统计隔夜航班集合T

表1

(3)针对各航班流程节点的前后衔接特征,将航班各流程节点构建为具有逻辑关系的非欧空间的图网络结构G;参照图3所示,

所述步骤(3)的具体过程如下:

(31)针对使用的航班流程节点数据创建图网络结构G=(V,E),G表示创建后的图网络结构,v

(32)针对图网络结构G分别构建图上的邻接矩阵和度矩阵,公式如下:

式中,A

(4)使用各后序-前序流程节点的时间差值的标准时段集合D

所述步骤(4)的具体过程如下:

(41)取出所有延误航班样本的边集合E,将边集合E通过流程节点编号进行转换,按照边的顺序和流程节点编号的大小依次排列,将排列后的边集合E'存储至数据集1中;

(42)将属于不同图的流程节点按照索引依次排列,每个图中的流程节点为同一索引值,得到索引集合I,将索引集合I存储至数据集2中;

式中,m表示一条航班包含的流程节点个数,p-delay表示延误航班的航班条数;

(43)利用步骤(24)中得到的非延误航班的标准时间段集合D

式中,T

(44)将样本中所有延误航班实际起飞时间与计划离港时间的时间差值集合D

(45)将所述数据集1、数据集2、数据集3和数据集4一同封装至图数据集中,使得每次取出的图网络结构均为原始图网络结构的子集。

(5)利用创建后的图网络结构G,搭建双层GCN、双层GAT、双层GraphSAGE、单层GCN与单层GraphSAGE结合的四种图卷积神经网络模型;

所述步骤(5)的具体过程如下:

(51)针对创建后的图网络结构G,使用传播规则f将图上的特征向下层传递,公式如下;

式中,H

(52)将层的传递映射到具体数据上,公式表示如下:

X

式中,f表示传播规则,X

(53)在搭建的GCN层中,传播规则f的传播公式如下:

式中,X

(54)构建GAT层,通过注意力系数实现为不同边分配不同的权重;

(55)构建GraphSAGE层,通过邻居采样将流程节点特征的全图训练模式转化成以流程节点特征为中心的小批量训练模式,采用聚合函数对邻居流程节点的信息进行特征聚合;

(56)针对不同图卷积神经网络层,考虑过站航班流程的时间作为特征输入以及需要预测的图导向任务,构建双层图卷积神经网络,包括搭建四种图卷积神经网络:双层GCN层、双层GAT层、双层GraphSAGE层、单层GCN层与单层GraphSAGE层相连的图神经网络;每个双层图神经网络与双层全连接神经网络相连,并与最后的池化层相接,将节点导向任务和边导向任务转化为全局的图导向任务,构成四种不同的图卷积神经网络模型,参照图4所示。

进一步地,所述步骤(54)具体包括:

(541)GAT层在进行传递时,根据每个流程节点与不同的邻居流程节点相连的特点,计算流程节点v

式中,LeakyReLU表示激活函数,α

(542)根据计算得到的注意力系数,将特征加权求和,公式如下;

式中,x'

(543)根据每个流程节点的生成的新特征x'

进一步地,所述步骤(55)具体包括:

(551)GraphSAGE层在聚合邻居流程节点的特征后,再与自身流程节点的特征进行聚合,聚合方法具体如下表示;

式中,k表示总迭代聚合次数,W

(552)对每个流程节点聚合后的特征进行L2标准化,公式如下;

式中,V表示图网络结构中的流程节点集合,

(6)选取三种机器学习模型,划分训练集、验证集和测试集,训练三种机器学习模型和搭建后的双层GCN、双层GAT、双层GraphSAGE、单层GCN与单层GraphSAGE结合的四种图卷积神经网络模型,通过调整参数得到三种机器学习模型和四种图卷积神经网络模型的最优模型;

所述步骤(6)的具体过程如下:

(61)选取的三种机器学习模型为决策树模型、随机森林模型和XGBoost模型;

(62)清洗数据得到最终可用的样本数量为18794条,在对比模型中,将前16500条样本作为训练样本集X

(63)将训练集的样本进行归一化,以加快模型训练速度,提升模型预测准确度,采用的公式如下;

式中,x_std

针对决策树、随机森林和XGBoost三种机器学习模型,在K折交叉验证的方法中,令K=5,对每次运行的模型结果取平均,进行参数的调整,调整好的最优参数组合参照表2、表3和表4所示;

表2

表3

表4

(64)将训练集数据分别输入双层GCN、双层GAT、双层GraphSAGE、单层GCN与单层GraphSAGE结合的四种图卷积神经网络模型中进行训练,将平均绝对误差(MAE)作为反向传播的误差以更新权重,多次进行模型训练和调整参数,得到四种图卷积神经网络模型的最优模型;如表5所示;

表5

(7)使用得到的三种机器学习模型和四种图卷积神经网络模型的最优模型进行模型结果对比与评价;

所述步骤(7)的具体过程如下:

(71)选取平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分误差(MAPE)三个指标以衡量各模型的预测值和真实值的距离;其公式分别如下:

式中,p-delay表示延误航班的航班条数,y

(72)将测试集输入得到的三种机器学习模型和四种图卷积神经网络模型的最优模型中,利用(71)的指标对比三种机器学习模型和四种图卷积神经网络模型的性能。七种模型预测结果如表6所示:

表6

由表6中可以看出,传统的方法如随机森林和决策树等难以适应时间节点数据,在验证集上预测出的航班延误时间与真实值相比误差较大,而本发明方法考虑到航班过站流程中各类作业流程的前后逻辑关系,将其转化成图结构并加载进节点特征,预测到的航班延误时间相比传统方法更为准确,故本发明方法在航班延误预测上的适用性更优。

本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号