首页> 中国专利> 一种突发事件下的城市轨道交通短时OD需求预测方法

一种突发事件下的城市轨道交通短时OD需求预测方法

摘要

本发明公开了一种突发事件下的城市轨道交通短时OD需求预测方法。该方法包括:在当前时间段t,获取观测到的OD需求序列、实时进站流数据和轨道交通网络图;将所述OD需求序列、所述实时进站流数据和所述轨道交通网络图输入到经训练的预测模型,预测下一个时间段的轨道交通系统的OD需求。本发明能够有效整合周时和日时OD需求模式,以捕捉长短时历史OD分布信息,在满足短时OD需求预测实时性要求的同时,提高了突发事件下OD需求的预测精度。

著录项

  • 公开/公告号CN117593878A

    专利类型发明专利

  • 公开/公告日2024-02-23

    原文格式PDF

  • 申请/专利权人 北京交通大学;

    申请/专利号CN202311345507.6

  • 发明设计人

    申请日2023-10-17

  • 分类号G08G1/01;G06N3/0464;G06N3/0442;G06N3/045;

  • 代理机构北京市诚辉律师事务所;

  • 代理人耿慧敏;朱伟军

  • 地址 100044 北京市海淀区西直门外上园村3号

  • 入库时间 2024-04-18 19:57:11

说明书

技术领域

本发明涉及交通客流预测技术领域,更具体地,涉及一种突发事件下的城市轨道交通短时OD需求预测方法。

背景技术

突发情况下的OD需求具有较大的随机性和突发性,给城市轨道交通的运营管理带来巨大挑战,同时也给乘客出行造成极大不便,因此突发事件下的城市轨道交通短时OD需求预测尤为重要。

在现有技术中,关于突发事件下的城市轨道交通OD需求预测方案主要存在以下缺陷或特点:与出租车OD需求不同,城市轨道交通实时OD需求数据只有当乘客完成出行才能获得,因此在城市轨道交通短时OD需求预测时,无法即刻获得完整的实时OD需求数据;受城市内不同地理区域的用地性质不同的影响,OD需求并非均匀分布在城市的各个区域,其分布具有明显的稀疏性,这种稀疏性使得模型在学习OD需求的时空分布特性时容易受到较低的OD需求影响,从而无法准确学习OD需求的分布;由于OD需求描述了站点与站点之间的客流关系,在处理OD需求数据时,其维度通常高于常规的进出站客流数据,从而使模型的计算成本提高;由于突发事件会给城市轨道交通OD需求分布带来较大影响,短时间内造成OD需求的异常波动,因此刻画OD需求分布在突发事件期间的演化趋势,有利于提升预测精度;OD需求与站点进出站客流间存在确定的数量关系,以起始站点为例,其进站流量等于以该站点为起点的OD需求量,因而有效利用OD需求和进出站流间的物理数量关系有利于增强模型的训练效果,提高模型的可解释性和预测的可靠性。

发明内容

本发明的目的是克服上述现有技术的缺陷,提供一种突发事件下的城市轨道交通短时OD需求预测方法。该方法包括以下步骤:

在当前时间段t,获取观测到的OD需求序列、实时进站流数据和轨道交通网络图;

将所述OD需求序列、所述实时进站流数据和所述轨道交通网络图输入到经训练的预测模型,预测下一个时间段的轨道交通系统的OD需求

其中,f表示经训练的预测模型,

与现有技术相比,本发明的优点在于,提出一种实时OD需求数据估计方法,克服OD需求数据的实时可获得性;并提出一种全新的OD需求动态压缩方法,以解决OD需求数据的稀疏性和高维性;另外,提出自适应图卷积长短时记忆网络结构(AGC-LSTM)和多周期交叉注意力机制(MPC-ATTN),从而构建了一种切实有效的深度学习框架,并提出异质信息融合模块,将突发事件期间的OD需求数据、突发事件相关数据有机融合,以充分挖掘突发事件对OD需求变化的影响,捕捉OD需求动态复杂的时空分布特征;最后,提出一种掩码物理引导损失函数用以训练模型,嵌入OD需求与进出站流的物理数量关系,从而增强模型的训练过程,提高模型的可解释性和预测可靠性。本发明在满足短时OD需求预测“实时性”要求的同时,提高了突发事件下OD需求的预测精度。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1是根据本发明一个实施例的突发事件下的城市轨道交通短时OD需求预测方法的流程图;

图2是根据本发明一个实施例的动态OD矩阵压缩操作示意图;

图3是根据本发明一个实施例的基于物理引导的自适应图时空注意力网络PAG-STAN模型框架示意图;

图4是根据本发明一个实施例的实时OD需求估计模块;

图5是根据本发明一个实施例的自适应图卷积长短时记忆网络结构AGC-LSTM的示意图;

图6是根据本发明一个实施例的多周期交叉注意力机制MPC-ATTN的示意图;

图7是根据本发明一个实施例的表示BiLSTM的计算过程示意图;

图8是根据本发明一个实施例的展示异质信息融合模块的计算过程示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

参见图1所示,简言之,所提供的突发事件下的城市轨道交通短时OD需求预测方法包括:步骤S110,在当前时间段t,获取观测到的OD需求序列、实时进站流数据和轨道交通网络图;步骤S120,将所述OD需求序列、所述实时进站流数据和所述轨道交通网络图输入到经训练的预测模型,预测下一个时间段的轨道交通系统的OD需求。在下文中,将具体描述所要解决的科学问题、模型结构和实验验证结果等。

一、问题定义

本发明旨在利用历史AFC数据及其他可靠数据源,借助深度学习模型,预测突发事件下城市轨道交通全网车站的短时OD需求。

定义一(URT网络):为了关注城市轨道交通系统中站点间的OD需求预测,定义了城市轨道交通(URT)网络G=(S,E,A),用以表示每个车站间的空间关联性,其中S={s

其中,P

定义二(客流矩阵):给定AFC记录,历史进出站流序列可以提取并整合成不同时间粒度下的客流矩阵,例如10分钟和60分钟。令

定义三(OD需求矩阵):短期OD需求预测的目标是预测URT网络中站点间的短时未来OD需求。因此,需要对OD需求矩阵进行定义。令x

需要注意的是,OD需求和URT网络内各车站的进出站流间存在耦合数量关系,可以定义为:

定义四(动态压缩OD矩阵):由于URT网络站点间的OD需求分布不均匀,导致原始的OD需求矩阵具有显著的稀疏性,即部分站点间(郊区站点)的OD需求比较低甚至没有,而一些站点间(居住区与商业区)的OD需求十分明显。那些较低的OD需求通常代表随机或者无规律的出行,对城市轨道交通系统影响较小,但容易影响OD需求预测的准确性;另外,原始OD需求矩阵的高维性也容易导致高额的计算费用。

为解决上述问题,仅考虑部分具有较高需求的OD对,以生成一个动态压缩的OD需求矩阵。具体来说,对于每个起始站i,首先计算所有目的站点的客流分布率

在获得起始站i的目的站点的客流分布率R

其中,|j|表示所选目的站点的数量,不同起始站点的参数k

定义五(多重OD需求模式):由于乘客的出行行为具有显著的周期性,在一个实施例中,考虑了多重OD需求模式,即周时OD需求模式、日时OD需求模式以及实时OD需求模式,以学习OD需求分布的长短时周期特征。具体来说,假设当前时间段为t,,且一天内总时段数量为t

问题定义:在时间段t,给定观测到的OD需求序列

其中,f表示训练过程中要学习的模型。

二、关于注意力机制和卷积长短时注意力网络

注意力机制提供了一种通用方法来对查询(query)下的值集合(value)和键值(key)之间的相关性建模。分配给每个值(value)的相关权重是由查询(query)的兼容性函数和与该值相关的相应键(key)计算获得。数理上,注意力机制可以看作一个将查询(query)和一组键值(key-value)对映射到输出的函数,其中查询、键和值都是向量,输出计算结果是该值的加权和。

以Transformer为例,其提出基于“Scaled Dot-Product”的注意力机制,该机制通过查询(query)和值(value)之间的点积计算每个值得相关权值。具体来说,给定列数为d

为联合处理来自不同表示子空间的信息,需要考虑多头注意机制。给定查询

MultiHead(Q,K,V)=Concat(Head

其中,H表示多头数,

对于通用的时空序列建模来说,Convolution LSTM(ConvLSTM)在序列数据的长期时空关系建模方面是稳定而强大的。在FC-LSTM,记忆单元C

其中,*表示卷积操作,

三、模型结构

为了准确预测突发事件下的城市轨道交通系统的OD需求,提出了全新的物理指导的自适应图时空注意力机制(PAG-STAN),以充分利用各种异质信息,即历史完整的OD需求、实时进出站流、突发事件相关信息以及日期属性数据用于有效建模突发事件下OD需求的时空演化模式。图3示意了所提出模型的构架,主要包括实时OD估计模块、编码器(Encoder)、解码器(Decoder)以及掩码物理指导损失函数等的设计。

图4是实时OD需求估计模块示意图,可以解决OD数据实时可获得性问题。该模块利用实时进站流和长短时历史OD需求分布率估计完整的实时OD需求。具体来说,首先根据输入的周时、日时OD需求模式计算昨天相同时间和上周相同时间的OD分布率;其次,通过将实时进站流和长短时历史OD分布率进行相乘,获得两个潜在的长短时OD需求矩阵。最后,对两个长短时潜在OD需求矩阵进行融合获得完整的实时OD需求矩阵。通过这种方式可以获得一个完整的带有长短时历史OD分布信息的实时OD需求矩阵。

在编码器中,设计了一个全新的自适应图卷积长短时记忆网络(AGC-LSTM)和一个全新的多周期互注意力(MPC-ATTN),以学习OD需求的隐藏时空分布信息。为捕捉OD需求显著的周期性,模型充分考虑多重OD需求模式,即周时OD模式、日时OD模式以及实时OD模式,通过输入到三个AGC-LSTM分支以深度聚合三种OD模式的隐藏时空分布信息。接着,MPC-ATTN通过编码来自AGC-LSTM分支的隐藏周期时空分布信息生成特征表示。最终,将特征表示输入到带有残差操作的卷积网络中增强周期时空分布特征表示。

在解码器中,多个BiLSTMs用于整合来自编码器的增强周期性时空分布特征表示和估计的实时OD需求。具体来说,估计的实时OD需求首先由一个BiLSTM处理,以捕捉实时全局的时空分布信息。接着,多个相同的BiLSTMs用于聚合来自编码器的特征表示和经过处理的实时OD需求,有利于从前向和后向充分解码情景时空分布信息。另外,为学习突发事件下外部因素对地铁OD需求的影响,提出一个异质信息融合模块(HIFB)充分融合OD需求与其他外部数据(突发事件相关数据、日期属性数据),该模块可以有效学习用于增强OD需求演化特征的信息。最后,通过几个堆叠的全连接层,实现下一个时间段的城市轨道交通OD需求精确预测。

此外,考虑到OD需求和进出站流间存在物理数量关系,可以提供有效的信息提升预测的可靠性,在一个实施例中,提出一个全新的掩码物理指导损失函数(MPG-LossFunction),通过考虑OD需求和进出站流间的物理数量关系指导模型的训练。该损失函数在保持数据驱动模型精确预测优点的同时提升了OD需求预测模型的可解释性。另外,MPG-Loss Function使用了掩码操作消除了由于动态压缩OD需求矩阵内填充零值带来的训练误差,从而提高对影响URT系统运行的那部分OD需求的预测性能。

总体而言,本发明有效整合了多重OD需求模式、实时进出站流以及外部因素,以预测突发事件下城市轨道交通系统的未来OD需求。接下来将具体介绍各模块的组成成分。

1)实时OD估计模块

由于当前时间段内一些乘客可能没完成他们的出行,完整的OD需求信息无法及时获得,而不完整的实时OD需求矩阵会干扰特征学习,从而导致不精确的预测。因此,在进行城市轨道交通OD需求预测时,需要克服OD需求数据的实时可获得性问题。虽然完整的实时OD需求数据无法及时获得,但可以从AFC记录中及时获得实时的进站流数据。另外,由于乘客出行行为具有周期性特征,历史长短时目的地分布率包含了有意义的OD需求周期分布信息。所以,使用实时进站流数据和历史长短流目的地分布率估计完整的实时OD需求是合理可行的。本发明所提出的实时OD估计模块用以估计完整的实时OD需求,通过联合利用实时进站流和历史OD需求的长短时分布信息可以有效解决OD数据实时可获得性问题。

图4描述了实时OD需求估计的过程,令t为当前时间段,完整的实时OD需求矩阵X

在获得两个潜在的OD需求矩阵后,将这两个矩阵进行拼接并输入到单位卷积网络,以生成带有长短时周期分布信息的完整实时OD需求。

2)编码器

编码器的目标是基于多重OD需求模式,挖掘隐藏的周期时空分布信息。为此,在一个实施例中,提出一个全新的自适应图卷积长短时记忆网络(AGC-LSTM)和一个新颖的多周期交互注意力机制(MPC-ATTN)深度整合多重OD需求模式用于学习固有的周期时空分布特征。具体来说,编码器考虑了三种不同OD需求模式,分别是周时OD模式、日时OD模式以及实时OD模式。周时OD模式和日时OD模式首先输入至周时、日时AGC-LSTM中以捕捉长短时隐藏状态。接着,将长短时隐藏状态视为初始状态,将实时OD模式视为特征输入,均输入到实时AGC-LSTM分支内以生成带有长短时周期信息的特征输出。为了进一步挖掘显著的周期性时空分布信息,三个分支的输出输入到MPC-ATTN中从不同子空间联合挖掘内在关联性,其可以有效的编码周期性时空分布信息以生成潜在表示。总体而言,编码器通过AGC-LSTM和MPC-ATTN深度整合多重OD需求模式来有效学习OD需求显著的周期时空分布信息。

(1)自适应图卷积长短时记忆网络(AGC-LSTM)

城市轨道交通系统本质上是一个具有复杂空间拓扑结构的动态交通系统,因此可使用GCN(图卷积网络)捕捉客流动态复杂的空间依赖性。图卷积的本质是通过聚合邻接节点的信息提取目标节点的特征。具体来说,图卷积特征可以通过以下方式计算。

其中,H

虽然传统图卷积可以有效建模拓扑空间特征,但预定义的静态邻接矩阵会限制图卷积网络在交通流预测中的表现,因为交通节点间的空间依赖性通常随时间变化。例如,在工作日,居住区和商业区的站点间存在显著的依赖性;在周日的联系则较少,因此动态的空间依赖性无法通过预定义的静态邻接矩阵有效学习。为了建模动态的空间依赖性,本发明引入一个自适应邻接矩阵

通过初始化节点嵌入相乘,可以提取节点间的隐藏空间依赖性。该过程中,ReLU激活函数可以忽略较弱的依赖性,Softmax可以用于归一化自适应邻接矩阵。本质上,自适应邻接矩阵是对节点间不确定关系的补充,可以在训练过程中动态建模隐藏空间依赖性。因此,本发明通过元素相加将自适应邻接矩阵嵌入到拓扑邻接矩阵中,不仅可以考虑先验空间信息,还可以以自适应的方式动态建模隐藏的空间依赖性,其具体计算过程如下:

ConvLSTM中的传统卷积操作仅关注常规的欧式结构,无法有效提取城市轨道交通网络中复杂的非欧式空间信息。为同时捕捉OD需求复杂的空间拓扑特征和时间演化特征,在一个实施例中,提出了全新的自适应图卷积长短时记忆网络(AGC-LSTM),该网络使用自适应图卷积操作替换ConvLSTM中常规的卷积操作,参见图5所示。

与ConvLSTM相比,AGC-LSTM在状态到状态和输入到状态的转换中使用自适应图卷积算子,可以自适应地考虑其拓扑邻居的输入和隐藏状态来确定目标节点的未来状态。AGC-LSTM的计算过程具体如下,其中

利用AGC-LSTM,可以自适应地学习城市轨道交通系统OD需求复杂的时空依赖性。具体来说,周时OD模式和日时OD模式首先分别输入到两个独立的AGC-LSTM分支中以生成长短时周期隐藏状态:

隐藏状态

(2)多周期交互注意力机制

由于乘客出行行为具有周期性,多重OD需求模式间存在显著的关联性。例如,周时OD需求模式可以在长时角度反映工作日/周末的OD分布的规律,日时OD需求模式可以在短时角度反映OD需求的波动趋势,这些历史多重OD需求模式包含OD需求中有意义的周期时空分布信息,有利于有效建模内在的OD分布。由于多头注意力机制可以共同注意来自不同表示子空间的信息,提高特征表示的能力,因此为进一步挖掘OD需求显著的周期性时空分布信息,在一个实施例中,提出了全新的多周期交互注意力机制,从多重表示子空间联合建模不同OD需求模式间固有的关联性。该方法可以有效编码来自三个AGC-LSTM分支的多重OD特征输出以生成潜在表示,参见图6所示。

具体来说,三个AGC-LSTM分支的特征输出首先转化为相同维度的特征嵌入

其中,T表示矩阵转移算子。具体来说,

信息传播后,对长时交互注意力Attn

其中,

其中,h表示多头数,

3)解码器

在编码器中,引入了AGC-LSTM和MPC-ATTN深度整合多重OD需求模式用于学习长短时周期性时空分布信息。在解码器中,多个双向LSTMs(BiLSTMs)用于从前向后向解码历史周期时空分布信,该网络可以有效捕捉情景信息和学习OD需求的全局演化模式。另外,由于城市轨道交通系统OD需求容易受到突发事件影响,导致OD需求不规则的时空分布。这种无规律的OD分布通常会增加突发事件下OD需求预测的难度。因此,为了学习突发事件下外部因素对城市轨道交通系统OD需求的影响,进一步提出一个异质信息融合模块(HIFB)融合外部异质信息,包括突发事件社交媒体信息、日期属性信息等。该异质信息融合模块有效挖掘了突发事件信息和轨道交通OD需求信息间的交互信息以增强随时间变化OD需求演化特征。最后,未来时刻完整的OD需求通过全连接层可以准确预测得到。

(1)双向LSTM

由于突发事件下OD需求显著确定性和突发性,单向建模可能无法充分捕捉突发事件下OD需求的全局时刻分布信息。因此,可使用双向LSTM解码有意义的历史周期性分布信息,从前向和后向提供互补信息以充分理解OD需求复杂的全局演化模式。双向LSTM的框架如图7所示。具体来说,BiLSTM首先从正向和反向分别处理输入数据,获得正向和反向的时间依赖关系,接着将正向和反向的时间依赖性进行拼接并输入到全连接层以获得最终的隐藏状态。该模块使模型可以从两个方向学习OD需求的长短时周期时刻分布信息,增强对突发事件下OD需求复杂演化模式的理解。

在解码器中,实时估计的OD需求首先经过一个BiLSTM处理以捕捉解码序列。接着,来自编码器的潜在表示被视为初始状态,与解码序列一起输入到BiLSTM中。最后,通过堆叠多个BiLSTMs,可以有效解码历史周期性时空分布信息。通过这种方式,解码序列的每个位置都可以与来自编码器的周期分布特征表示进行融合,有利于从前向和后向理解OD需求的全局演化模式。

(2)异质信息融合模块

城市轨道交通OD需求通常容易受到外部因素影响,突发事件容易导致城市轨道交通系统中客流不规律的变化,显著影响OD需求的时空分布。近年来,社交媒体的兴起为理解城市轨道交通OD需求和人们出行行为之间的关系提供了一个可行的方式,关于突发事件的社交媒体推文在一定程度上可以反映人们的出行意愿和出行方式的选择。另外,轨道交通客流波动同样受到日期属性的影响,例如工作日/周末,或者假期属性。在大数据时代,海量的异质数据有利于从多角度探讨影响客流异常波动的外部因素。因此,提出一个全新的异质信息融合模块(HIFB)考虑了多源异质信息,包括突发事件的相关社交媒体数据、日期属性数据。该模块旨在学习可以反映外部因素对地铁OD需求影响的有意义信息,并利用该信息提高城市轨道交通OD预测的准确性。

图8是异质信息融合模块的框架图。具体来说,给定突发事件相关社交媒体数据和日期属性数据,定义时间段t的异质信息向量F

其中,σ表示Sigmoid函数。给定增强的特征矩阵

4)损失函数

城市轨道交通系统中OD需求与进出站客流之间存在明显的数量关系。例如,以站点A为始发站的OD需求量等价于站点A的进站流,以站点B为终到站的OD需求量等价于站点B的出站流。这种数量关系揭示了OD需求演化的物理规律,有利于提高OD需求预测的可解释性和可靠性。因此,可以将客流数量规律嵌入损失函数,用于刻画城市轨道交通系统中OD需求与进出站流的物理耦合关系,从而指导模型训练。另外,在OD矩阵预处理过程中,可使用0值填充动态压缩OD矩阵

其中,W

具体来说,损失函数第一项用于评估模型学习OD分布特征的能力;第二和第三项用于评估模型学习数量关系方程描述的物理定律的能力。在训练过程中,如果屏蔽数值,则相应误差不会进行反向传播。因此,在反向传播过程中,采用掩码操作对动态压缩OD矩阵的填充0值采取掩码操作,消除由于OD需求矩阵压缩而产生的填充0值对训练的干扰,并提高其他OD需求的预测性能。此外,将客流量规律嵌入到损失函数中,反向传播有意义的物理信息,以增强模型训练。通过嵌入物理意义,MPG-Loss Function提高OD需求预测模型的可解释性,同时保持数据驱动模型的准确性。

四、模型评价

为进一步验证本发明的效果,在真实数据集上验证PAG-STAN的预测性能。下文将介绍实验所使用的数据集、模型的参数设置、评估指标、基准模型以及实验结果对比等。

1)数据集

实验所使用的数据集是广西壮族自治区南宁市城市轨道交通AFC数据集,该数据集主要包括2020年1月6日到2020年5月31日南宁地铁早上6点到晚上11点的AFC数据,涵盖突发事件的发展全阶段。例如,采用15分钟、30分钟以及60分钟等多个时间粒度分别提取各站点的进站客流数据以及站点间的OD需求数据,车站编号根据地铁线路和车站邻接关系排序。

在实验研究中,从新浪微博爬取特定时期(与客流数据的时段一致)内带有特定地理标签信息且包含“突发事件名称”、“南宁”的相关博客。由于爬取的推文数量有限,因此按照日为时长统计推文,并使用日推文量表示当天任一时间段的推文数量特征。

此外,收集了日期属性数据,包括星期几、日期类型(工作日/周末)以及假期属性。由于日期属性数据为非数值特征,因此使用one-hot编码将非数值的外部特征转换为二进制向量。经过转化,共有10个变量用以表示所有外部因素,即外部特征维度为10,下表1是所有数据属性。

表1异质数据描述

2)模型配置

在台式电脑上进行实验,电脑配置为

超参数:本实验以12:4:5的比例将南宁地铁客流数据集按时间划分训练集、验证集和测试集。所有数据使用Min-Max归一化方法归一化至[0,1]的范围内并输入模型中。模型分别由三层encoder层和三层decoder层堆叠而成。经过fine-tuning后,模型的特征大小d

预处理:训练前,需要对所有数据进行归一化。得到预测结果后,将其逆归一化至原标度范围,便于结果进行评价。

3)评价指标

使用均方根误差Root Mean Square Error(RMSE)、平均绝对误差Mean AbsoluteError(MAE)和加权平均绝对百分比误差weighted Mean Absolute Percentage Error(WMAPE)作为模型预测效果的评价指标。

/>

其中,

4)基准模型

为全面评价PAG-STAN的预测性能,在南宁地铁突发事件期间客流数据集上比较PAG-STAN与基准模型的预测效果。基准模型的细节描述如下:

Autoregressive Integrated Moving Average(ARIMA):本实验中ARIMA的三个参数:滞后阶数、差度以及移动平均阶数经过调整后分别设定为2、1和2。

3D Convolutional Neural Network(3DCNN):本实验使用两层CNN层进行特征提取,卷积核大小为3×3;接着使用一个全连接层预测未来的OD需求,其中神经元个数为256。

Long Short-Term Memory Neural Network(LSTM):本实验使用两层LSTM层预测未来OD需求,其隐藏状态的维度为256。

ConvLSTM:该模型的架构与LSTM十分相似,最大不同是ConvLSTM使用卷积操作替代了LSTM原本的全连接操作,因此模型可以同时建模时间和空间相关性。模型的参数与LSTM保持一致,隐藏状态的维度同样设置为256。

Graph WaveNet(GWN):该模型介绍了一个自适应邻接矩阵用于建模隐藏空间依赖性,并使用一个膨胀一维卷积单位建模长时时间依赖性。

Contextualized Spatial-Temporal Network(CSTN):该模型首次研究了基于深度学习的交通OD需求预测,充分整合了局部空间情景、时间演化情景以及全局关联性情景以预测出租车在区域间的OD需求。

ST-ResNet:在该模型中,残差卷积单元被用于建模长短时时间特性和空间特征,另外介绍了一个聚合机制用于学习外部因素对交通流的影响。本实验仅使用三个残卷卷积单元学习多重长短时时空依赖性,没有考虑外部因素。

Spatial-Temporal Encoder-Decoder Residual Multi-Graph ConvolutionalNetwork(ST-ED-RMGC):ST-ED-RMGC是最近提出用于轨道交通OD需求预测的模型。在该模型中,邻接关系图、功能相似性图、中心距离图以及移动模式关联性图被引入用于学习OD需求的复杂模式。本实验基于其公开代码对模型进行复现。

Transformer:搭建了包含三层encoder和三层decoder的Transformer框架。其中,多头数设置为8,特征大小d

Informer:搭建了含有三层encoder和三层decoder的Informer框架,其中多头数为8,特征大小d

5)实验结果分析

(1)线网级预测性能研究

模型首先在整个地铁数据集上与其他基线模型进行比较,比较结果参见下表2。可以看出,数理统计模型ARIMA在所有时间段内表现最差,这是因为其在捕捉OD需求复杂时空特征方面的能力较差。与ARIMA相比,基础深度学习模型CNN和LSTM的预测效果取得了一定程度的提升,这两个模型分别通过建模空间或时间依赖性实现OD需求的预测。复合模型ConvLSTM、GWN、ST-ResNet同时建模了OD需求的时空依赖性,因此其表现优于其他基础模型,表明充分挖掘时空依赖性对于预测精度提升的重要性。比较受欢迎的OD需求预测模型CSTN和ST-ED-RMGC没有在本数据集上取得满意的预测效果,可能是因为两种模型主要关注出租车的OD需求预测,其时空特征与轨道交通OD需求预测存在显著差异。因此,CSTN和ST-ED-RMGC可能不适用于城市轨道交通OD需求预测。另外,根据预测结果可得,注意力模型Transformer和Informer在所有时间段下的表现都具有竞争力,模型在不考虑序列距离的情况下有效建模了时间依赖性。尽管这两个模型没有考虑空间特征,但由于该数据集涉及的地铁网络的拓扑结构并不复杂,所以对预测效果的影响较小。

尽管上述模型在架构和性能方面取得了进展,但模型只关注历史OD需求信息而忽略了突发事件期间外部因素对OD需求分布的影响。与上述模型相比,PAG-STAN不仅深入整合多重OD需求模式以捕捉周期性时空依赖性用于建模OD需求分布,而且引入异质数据(突发事件下相关社交媒体数据和日期属性数据等)用于学习可以反映突发事件对OD需求分布影响的有意义信息,从而增强OD需求随时间的演化趋势。因此,PAG-STAN在所有时间粒度下表现均优于其他基线模型,在大部分算例中取得了最低的评价指标。相比较现存最好的模型,PAG-STAN在RMSE、MAE和WMAPE上分别取得了1.60%、1.77%以及1.57%的提升。表2不同模型线网级预测性能比较。

表2不同模型线网级预测性能

为更加直观理解模型的预测性能,还利用热力图对不同时间段下预测的OD需求矩阵进行可视化,分别为8:00-8:30,12:00-12:30以及19:00-19:30。例如,每一行表示起始站点,每一列表示目标站点。可视化了2022年4月22日早高峰8:00-8:30的实际OD需求矩阵和预测OD需求矩阵。并且可视化了2022年4月22日午间12:00-12:30的实际OD需求矩阵和预测OD需求矩阵。此外,还可视化了2022年4月22日晚高峰19:00-19:30的实际OD需求矩阵和预测OD需求矩阵。通过可视化分析可知,受到突发事件(如疫情)的影响,即使在早晚高峰,大部分的OD需求都十分小甚至为零,仅有一部分OD对有较高的OD需求。由于OD需求矩阵显著的稀疏性,使得突发事件期间OD需求的准确预测具有挑战性。为实现准确的轨道交通OD需求预测,PAG-STAN深度融合了多重OD需求模式以挖掘OD需求的周期性时空分布信息。因此,无论是低需求还是高需求,模型的预测值与真实值非常接近。另外,实验可知,模型在早晚高峰时段的OD需求预测性能优于正常时段,这是因为早晚高峰时段存在更为显著的OD需求分布特征,便于模型学习从而提升预测精度。这些比较结果充分说明了PAG-STAN突发事件期间预测地铁OD需求的有效性和可靠性。

(2)高需求站点间预测性能比较

实验过程中,比较了PAG-STAN和其他基线模型在高需求站点间OD需求预测的性能。首先选择了top-k个高需求站点,并且只考虑这些站点间的OD需求以评估模型的预测性能。具体而言,对于15个需求量较高的站点,大约覆盖率该数据集约65%的OD需求量。下表3展示了不同方法在高OD需求站点下的预测性能,可以看出PAG-STAN取得了最好的预测性能,且随着时间粒度增大,PAG-STAN的优势越发明显。具体来说,PAG-STAN与现有第二好的模型相比,在高需求站点的OD需求预测方面,RMSE、MAE以及WMAPE分别提升了1.37%、1.60%以及1.07%,说明PAG-STAN在高需求站点间的OD需求预测中具有良好的预测效果。

表3不同模型高需求站点OD需求预测性能

(3)消融实验研究

为进一步分析PAG-STAN不同组成部分对模型预测性能的影响,在地铁数据集上进行了消融实验。

EffectivenessofMulti-Periodic OD demand:由于OD分布显著的长短时周期性,考虑了多重OD需求模式用以学习周期性时空分布信息。并且挖掘了多周期OD需求对地铁OD需求预测的影响,即利用周OD模式和日OD模式的长短期OD分布信息来预测未来的OD需求。接下来介绍几个变体:

Net-Real-time OD:该变体直接使用估计的实时OD需求预测未来的地铁OD需求。

Net-Real-time OD+weekly OD:除了估计的实时OD需求外,该变体使用周时OD模式共同预测未来OD需求,旨在研究长时历史OD分布信息对OD需求预测的影响。

Net-Real-time OD+daily OD:与前一个变体相似,该变体使用日时OD模式与估计的实时OD需求共同预测未来OD需求,旨在探讨短时历史OD分布信息对OD需求预测的影响。

Net-Mulit-periodic OD:该变体整合了周时和日时OD需求模式以捕捉长短时历史OD分布信息,用于建模OD需求的周期演化特征。

表4不同多周期OD需求模式对于OD需求预测影响

模型预测效果指标参见上表4。可以发现,Net-Real-time OD的预测效果最差,因为该变体仅仅使用有限的实时信息来预测OD需求,忽视了OD分布的长短时周期性。当考虑周时OD模式或日时OD模式时,模型的预测性能在一定程度上得到提升,表明长时或短时OD分布信息有利于OD需求预测。同时可以发现,在大部分情况下变体Net-Real-time OD+daily OD的预测性能要优于Net-Real-time OD+weekly OD,因为短时周期时空分布信息可以更加准确刻画周期OD需求演化特征。与上述变体比较,Net-Mulit-periodic OD基于多重OD模式联合挖掘长短时周期OD分布信息,取得了最优的预测性能。与Net-Real-time OD相比,RMSE、MAE、WMAPE平均提升了8.05%、6.45%以及7.29%。因此,从多周期需求中提取的长、短期周期需求分布信息可以大大提高需求预测性能。

Effectiveness of Real-time OD demand estimation:由于部分乘客在当前时刻尚未完成出行,所以只能获得不完整的实时OD需求矩阵,而不完整的实时OD需求会干扰模型的训练,降低预测精度。因此,根据实时进站流和历史完整的长短时OD分布率估计实时OD需求。为探讨实时OD需求估计对OD需求预测的影响,本实验提出以下变体。

Net-Incomplete OD:该变体直接使用不完整的OD需求预测未来地铁OD需求。

Net-Real-time OD(long-term):该变体使用了仅考虑长时OD分布率(周时OD分布率)的实时估计OD需求预测未来地铁OD需求。

Net-Real-time OD(short-term):与上一个变体类似,该变体使用了仅考虑短时OD分布率(短时OD分布率)的实时估计OD需求预测未来地铁OD需求。

Net-Real-time OD(long short-term):该变体是使用了考虑长短时完整OD分布信息的实时估计OD矩阵需求预测未来地铁OD需求。

表5实时OD需求估计对于OD需求预测的影响

所有变体的预测效果总结参见上表5。可以看出,当直接使用不完整的OD需求矩阵预测未来OD需求时,变体Net-Incomplete OD取得了最差的预测效果。这是因为不完整的OD需求矩阵并没有记录到尚未完成的出行信息,会干扰OD分布信息的学习,导致不准确的OD需求预测。本发明利用实时进站流和历史完整的OD分布率去估计完整的实时OD需求,从而解决实时数据可获得性问题。可以观测到Net-Real-time OD(long-term)和Net-Real-timeOD(short-term)的预测效果得到提升,这是因为他们均考虑了完整的OD需求信息。与上述实验结果相似,Net-Real-time OD(short-term)的预测效果优于Net-Real-time OD(long-term)的预测效果,再一次证明了短时周期性OD分布数据可以提供更有用的信息用于OD需求预测。与上述三种变体比较,Net-Real-time OD(long short-term)在所有时间粒度下取得了最佳的预测效果,表明本发明提出的实时OD需求估计模块可以通过利用实时进站流和长短时完整OD分布信息生成实时完整的OD需求矩阵,从而提升预测精度。

EffectivenessofHeterogeneousinformation:本发明所提供的全新的异质信息融合模块(HIFB),可以从多源异构数据(突发事件相关社交媒体数据、日期属性数据)中充分挖掘有意义的信息,反映突发事件期间外部因素对地铁OD分布的影响。本实验进一步研究多源异构数据信息对预测性能的影响,接下来介绍几种变体。表6是不同外部因素对于OD需求预测的影响。

Net-no heterogeneous Information:该变体不使用多源异构数据预测未来OD需求,意味着不考虑突发事件期间外部因素对地铁OD分布的影响。

Net-Social Media Information:该变体使用与突发事件相关的社交媒体数据协助预测,从而学习突发事件对地铁OD分布的影响。

Net-Date Attribute Information:该变体使用日期属性数据协助预测,从而学习日期属性对地铁OD分布的影响。

Net-Heterogeneous Information:该变体充分使用多源异构数据协助预测突发事件期间的地铁OD需求,模型均考虑了与突发事件相关的社交媒体数据和日期属性数据以全面学习突发事件期间外部因素对地铁OD分布的影响。

表6不同外部因素对于OD需求预测的影响

Effectivenessof Masked Physics Guided Loss Function:本发明提出了一种全新的掩码物理引导损失函数,不仅将客流数量关系嵌入到损失函数中指导模型的训练,同时利用掩码操作消除了压缩OD矩阵中填充的0值对模型训练的干扰。本实验对该损失函数的效果进行研究,提出以下多个变体。

Net-General Loss Function:该变体使用常规的MSE损失函数训练模型。

Net-Information Embedding Loss Function:该变体嵌入客流数量规律至损失函数中用以增强模型的训练过程,但没有采用掩码操作消除压缩OD矩阵中0值对模型训练的影响。

Net-Masked Loss Function:该变体使用掩码操作消除压缩OD矩阵中0值对模型训练的影响,但没有将客流数量规律嵌入至损失函数中。

Net-MPG-Loss Function:该变体利用本发明提出的MPG-Loss Function对模型进行训练。

表7不同损失函数对于OD需求预测的影响

上表7总结了PAG-STAN在不同损失函数下训练后的预测效果,由该表可知模型在使用常规的MSE损失函数训练后效果最差,这是因为模型训练时没有考虑OD需求与进出站流间的物理数量关系,同时压缩OD矩阵的0值干扰了模型的训练。当模型在训练时遮掩压缩OD需求矩阵0值时,模型的预测效果得到提升,表明掩码操作可以消除压缩OD矩阵中0值产生的训练误差;同时,当模型在训练时考虑OD需求与进出站流间的物理数量关系时,模型的预测效果得到提升,表明OD需求与进出站流间的物理数量关系可以增强模型的训练并提升模型的可解释性。当PAG-STAN使用MPG损失函数进行训练时,模型在所有的时间粒度下均取得了最好的预测效果,表明本发明提出的MPG-Loss Function可以有效提升模型的训练,增强模型的可解释性和预测的可靠性。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号