首页> 中国专利> 一种基于DBSCAN聚类算法的受限空域单元识别方法

一种基于DBSCAN聚类算法的受限空域单元识别方法

摘要

本发明公开了一种基于DBSCAN聚类算法的受限空域单元识别方法,该方法首先对空域单元进行定义;其次,收集航班实际运行数据与其对应的航路信息,将航路信息与空域单元的经纬度坐标数据相匹配构建航路网络模型;然后,计算航班延误数据,对数据降采样,并与空域单元进行关联得到航班延误特征数据;最后,结合航路网络模型与航班延误特征,基于DBSCAN聚类算法构建受限空域单元的识别模型。本发明方法可以识别受限空域单元和受限的起止时间,有助于解决恶劣天气、空中交通管制等事件引起的随机性。确定空域受限的起始时间和结束时间,可以将航班直接延误与传播引起的延误分开,进一步探索航班延误的传播机理,对提高航班延误预测的准确性具有重要意义。

著录项

  • 公开/公告号CN112257748A

    专利类型发明专利

  • 公开/公告日2021-01-22

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202010984365.8

  • 申请日2020-09-18

  • 分类号G06K9/62(20060101);G06Q10/04(20120101);G08G5/00(20060101);

  • 代理机构32200 南京经纬专利商标代理有限公司;

  • 代理人姜慧勤

  • 地址 210016 江苏省南京市秦淮区御道街29号

  • 入库时间 2023-06-19 09:36:59

说明书

技术领域

本发明涉及一种基于DBSCAN聚类算法的受限空域单元识别方法,属于空中交通管理技术领域。

背景技术

随着民航的快速发展,航班延误问题已成为航空运输系统的一个重要课题,航空业一直在遭受经济损失。根据美国交通统计局(BTS)的数据,2018年有超过20%的航班延误。在中国,航班异常率为80.13%,这意味着2018年延误航班超过85万架次。在实际运行中导致航班延误的因素有很多,例如航空公司运行管理因素、天气因素、空管流量控制、军事活动等等,这些因素会使空域单元受到不同程度的限制,进而造成航班延误的出现。同时这些影响因素的出现和发生有很强随机性和不确定性,当这些因素例如恶劣天气在航路上突然出现时,即使机场范围内和机场附近没有受到限制,航班还是会发生延误。而且前序某一航班的延误也可能会导致后序的多个航班延误,因此航班的延误呈现着混沌或者非线性的发展趋势,对航班延误进行准确的预测都有着一定难度。

目前许多学者在航班延误预测方面做了大量的研究。但是,如上所述,航班延误受许多因素的影响,这些因素具有一定的突发性和随机性。因此,航班延误表现为混沌或非线性,难以准确预测。同时,一个航班延误也可能导致后续航班延误。虽然有学者有意识地将直接延误和传播引起的延误分开,但没有找到有效的方法来定量地区分二者。当造成航班延误的事件发生时,空域单位受到限制,造成航班延误。识别受限空域单元和受限的起止时间,有助于解决恶劣天气、空中交通管制等引起的延误事件的随机性。确定受限的起始时间和结束时间,可以将直接延误与传播引起的延误分开,进一步探索航班延误的传播机理,对提高航班延误预测的准确性具有重要意义。

发明内容

本发明所要解决的技术问题是:提供一种基于DBSCAN聚类算法的受限空域单元识别方法,统计每个时间段每个空域单元的累计延误时间,将累计延误时间与空域单元的经纬度坐标进行匹配,建立特征矩阵,对每个时间段进行DBSCAN聚类,以识别受限空域单元。

本发明为解决上述技术问题采用以下技术方案:

一种基于DBSCAN聚类算法的受限空域单元识别方法,包括如下步骤:

步骤1,定义空域单元指的是机场和航路点,受限空域单元指的是因天气、军方活动、空管流量控制因素造成容量降低的空域单元;

步骤2,收集历史航班飞行数据和航图数据,从历史航班飞行数据中提取航路数据,结合航图数据中各空域单元的经纬度坐标,构建航路网络模型;

步骤3,以15分钟为间隔,将一天分为96个时间段,按照时间段先后顺序,从历史航班飞行数据中提取出包括时间序列的空域延误累计关联特征,根据空域延误累计关联特征建立包括时间特征、空间特征和延误累计关联特征的空域单元数据集;

步骤4,采用基于密度的DBSCAN聚类算法,对包括时间特征、空间特征和延误累计关联特征的空域单元数据集进行聚类,并结合历史航班飞行数据,从所有空域单元中识别出空域受限单元及延误特征,包括:空域受限单元的数量、位置和受限的起止时间。

作为本发明的一种优选方案,所述步骤2的具体过程如下:

步骤21,收集历史航班飞行数据和航图数据,其中历史航班飞行数据包括航班号、航班预计起飞和降落时间、实际起飞和降落时间、起飞和降落机场、所用航路以及航路上的航路点,航图数据包括空域单元的经纬度坐标;

步骤22,从历史航班飞行数据中提取所有条航路数据,每一条航路数据包括航班号、起飞和降落机场、所用航路、航路上的航路点;

步骤23,将每一条航路的起飞机场、降落机场和航路上的航路点与各自对应的经纬度坐标相关联,即将航路上的各空域单元与各自对应的经纬度坐标相关联,构建航路网络模型。

作为本发明的一种优选方案,所述步骤3的具体过程如下:

步骤31,对起飞机场以及航路上的航路点按照航班的离场延误时间统计航班延误,对降落机场按照航班的降落延误时间统计航班延误,且离场延误时间或降落延误时间大于15分钟时视为航班延误;

步骤32,以15分钟为间隔,将一天分为96个时间段,按照时间段先后顺序,统计每个时间段经过各空域单元的航班延误,进而统计各时间段各空域单元的累计航班延误即为包括时间序列的空域延误累计关联特征;

步骤33,将将航班经过各空域单元时对应的时间段作为时间特征,各空域单元的经纬度坐标作为空间特征,建立包括时间特征、空间特征和延误累计关联特征的空域单元数据集。

作为本发明的一种优选方案,步骤31所述对起飞机场以及航路上的航路点按照航班的离场延误时间统计航班延误,对降落机场按照航班的进场延误时间统计航班延误,具体为:

起飞机场的航班延误等于离场航班的实际起飞时间减去预计起飞时间;

航路点的航班延误等于起飞机场的航班延误;

降落机场的航班延误等于进场航班的实际降落时间减去预计降落时间。

作为本发明的一种优选方案,步骤32所述累计航班延误具体为:某个时间段经过某空域单元的所有航班的航班延误之和。

作为本发明的一种优选方案,所述步骤4的具体过程如下:

步骤41,以步骤2建立的航路网络模型为基础,结合时间特征、空间特征和延误累计关联特征建立的受限空域单元识别模型为:

其中,D

步骤42,使用DBSCAN聚类算法对各时间段的受限空域单元识别模型进行聚类,从所有空域单元中识别出受限空域单元,根据受限空域单元得到延误特征,包括:空域受限单元的数量、位置和受限的起止时间。

本发明采用以上技术方案与现有技术相比,具有以下技术效果:

本发明对空域中受到限制的空域单元进行识别,并识别出空域单元受到限制的起止时间,有助于解决恶劣天气、空中交通管制等事件引起的随机性。对深入探索航班延误的传播机理,细化分析一架航班延误后对后序航班的影响有着重要意义,同时也能进一步提高对航班延误预测的准确率。

附图说明

图1是本发明一种基于DBSCAN聚类算法的受限空域单元识别方法的原理图。

图2是航路网络模型示意图。

图3是实施例2017年7月17日22:15:00~22:29:59的受限空域单元识别结果图。

图4是实施例2017年7月17日22:15:00~22:29:59的受限空域单元分布图。

图5是实施例2017年7月17日受限严重空域单元热力分布图。

具体实施方式

下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

如图1所示,本发明通过挖掘历史航班数据,计算了各航班的离场延误和到达延误,并将每个航班与其使用的航路信息相对应。然后,收集各机场和航路点的坐标信息,根据时间序列和始发地机场对历史飞行数据进行分类和分组。统计每个空域单元的累计延误时间和延误时间,将每个时间段的平均延迟时间与每个空域单元的坐标进行匹配,建立特征矩阵。最后对每个时间段进行DBSCAN聚类,以识别受限空域单元。具体实现步骤如下:

步骤1,对本发明中提到的空域单元进行定义。本发明中空域单元是指航路点和机场;受限空域单元是指因天气、军方活动、空管流量控制等因素造成容量降低的空域单元。

步骤2,收集历史航班数据和航图数据。从历史航班数据中提取各目标机场之间的往返航路信息,结合航图中各航路点的经纬度坐标,构建航路网络模型。具体包括以下步骤:

(2.1)收集历史航班飞行数据和航图数据。其中历史航班数据该历史航班数据包括航班预计起飞/降落时间、实际起飞/降落时间、起/降机场、航班号和所用航路等信息;

(2.2)按照起降机场将历史航班数据进行分组,提取各机场之间的往返航班所使用的航路数据;

(2.3)将航路数据与空域单元的经纬度坐标数据进行关联构建航路网络模型并可视化。以北京首都机场(ZBAA)、上海浦东机场(ZSPD)、广州白云机场(ZGGG)和成都双流机场(ZUUU)四个机场往返航路的航班数据为例,按照起飞机场和降落机场进行分组,提取出每一组所使用的航路信息。其中航路用其所经过的各航路点来表示。将4个目标机场总计12条航路各个点的经纬度坐标在平面直角坐标系中标注出,而后将各路径点(航路点和机场)按航空器飞越的顺序连接起来即可形成如图2所示的航路示意图。

步骤3,对航班延误特征与空域单元进行关联分析,为从历史数据中识别出空域受限单元信息提供支持。对历史航班时刻数据进行清洗和重采样,并将各时间间隔的航班延误数据与其预计使用的空域单元进行累计关联,提取出包括时间序列的空域延误累计关联特征,并新建基于时间特征、空间特征(经/纬度)和延误累计关联特征的空域单元数据集。具体包括以下步骤:

(3.1)计算各航班的起飞和降落延误,在本发明中起飞/降落延误时间大于15分钟才视为航班延误;

(3.2)将航班的延误特征与空域单元相关联,在本发明中选择累计延误时间作为特征进行研究,对起飞机场、所经航路及航路点按照航班的离场延误进行统计,降落机场按照航班的降落延误进行统计;

(3.3)对历史航班时刻数据进行清洗和重采样,以15分钟为间隔,将一天分为96个时间段,将各时间间隔的航班延误数据与其预计使用的空域单元进行累计关联,统计各时间段各空域单元的累计航班延误即延误累计关联特征;

(3.4)将航班经过各空域单元时对应的时间段作为时间特征,各空域单元的经纬度坐标作为空间特征,新建基于时间特征、空间特征(经/纬度)和延误累计关联特征的空域单元数据集。

步骤4,采用基于密度的DBSCAN聚类算法,对包括时间特征、空间特征(经/纬度)和延误累计关联特征的空域单元数据集进行聚类,并结合历史航班的预计和实际起降信息,从所有空域单元识别出空域受限单元及延误特征,包括:空域受限单元的数量、位置和受限的起止时间。具体包括以下步骤:

(4.1)以第二步建立的航路网络模型为基础,结合时间特征、空间特征(经/纬度)和延误累计关联特征建立受限空域单元识别模型,T时段的特征矩阵D

式中:

(4.2)使用DBSCAN聚类算法对受限空域单元识别模型进行聚类,识别受限空域单元;

(4.3)输出各时段的识别结果,并对结果进行可视化。图3为上述4个机场间的航路在2017年7月17日22:15:00~22:29:59受限空域单元识别结果图。为了更直观的看出空域中受限的路径点的分布,绘制了图4所示的受限空域单元分布图。综合分析2017年7月17日全部96个时段的所有航班的识别结果,统计空域单元受限的次数,绘制如图5所示的热力分布图,图中0~55表示空域单元在一天96个时段中受到限制的次数。在2017年7月17日中,成都双流机场受限次数最多,其后是北京首都机场、广州白云机场和上海浦东机场;对于航路点,一天中受限次数在前五位的航路点依次是ONEBA、SUBUL、BOBAK、JTG和WFX。

以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号