首页> 中国专利> 一种基于图卷积神经网络的多尺度交通流量预测方法

一种基于图卷积神经网络的多尺度交通流量预测方法

摘要

本文公开了一种基于图神经网络的多任务城市交通流量预测方法,首次研究了预测多尺度(细粒度和粗粒度)交通流量的新问题,具体来说,给定道路图,我们首先基于节点(道路链接)之间的拓扑接近度和交通流相似度构建粗粒度道路图;然后提出了一种跨尺度图卷积Cross‑Scale GCN来提取细粒度和粗粒度的交通流量特征,并将它们进行融合。利用加入了Intra‑Attention与Inter‑Attention的LSTM提取时间特征,为了保证两种尺度数据预测结果的一致性,引入了结构约束。该方案在细粒度和粗粒度流量预测方面的同时体现出优异性能,提高了预测的准确率。

著录项

  • 公开/公告号CN112767682A

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202011513907.X

  • 发明设计人 张美越;王森章;缪浩;杜金龙;

    申请日2020-12-18

  • 分类号G08G1/01(20060101);G06N3/04(20060101);G06N3/08(20060101);G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 210016 江苏省南京市秦淮区御道街29号

  • 入库时间 2023-06-19 10:54:12

说明书

技术领域

本发明给出一种基于图卷积神经网络的多尺度交通流量预测方法,涉及时空大数据预测 领域,主要用于预测城市不同粒度的交通流量,进而帮助交通部门缓解交通拥堵现象。

背景技术

随着我国城市化进程的加速,不断增长的城市人口与有限的空间资源之间的矛盾日益加 剧,导致交通拥堵问题成为阻碍城市发展的一大难题。自上世纪六十年代以来,世界各国对 城市交通规划和城市交通控制进行了研究,但随着城市规模的不断扩大和交通状况的日趋复 杂,仅靠这两种措施进行有效的交通管理已不再可行,因此,智能交通系统(ITS,Intelligent Transportation System)应运而生。智能交通系统结合先进的物理通讯设备和智能计算机技术, 建立起针对整个交通网络的信息预测和管理系统,它是目前全面有效解决包括交通拥堵在内 的交通运输领域问题的最佳途径。

城市交通流量预测是智能交通系统的重要组成部分,它包括交通速度、交通密度等。在 很多领域都有重要的研究应用价值,传统的预测方法大多是基于统计的,包括ARIMA和VAR 等。基于统计的方法通常学习基于历史交通数据的线性映射模型,以预测其未来趋势。虽然 这样方法可以在道路水平交通预测中实现期望的性能,但当应用于预测整个道路网络上的交 通时,它们的性能可能显著降低,其中道路之间的关联是高度非线性和动态的,而且此类方 法都不能很好体现出来数据的时空性。随着技术的进步、硬件的提升和大量数据的收集,神 经网络由于其优异的表现性能而被广泛使用,随着图卷积神经网络、循环神经网络及其一系 列变体的网络结构的提出,各种深度学习模型被用于交通流量预测。很多研究人员提出了一 系列的新方法,例如:DCRNN、STGCN和TGCN等,这些基于神经网络的方法从大量的数据 中学习到特征,很好的利用了数据的时空性,并且获得了优异的表现。以上的研究都是现有 的在城市交通流量预测方面的技术探索和更进一步的优化,但是上述的这些方法存在一些局 限性。首先,之前的研究大多侧重于预测每条道路上的交通状况,可以认为是一种细粒度的 预测。然而,在许多情况下,还需要粗粒度的预测,例如预测覆盖多个道路连接的不同城市 区域之间的交通流量,以帮助政府从宏观角度更好地掌握交通状况。这在城市规划和公共交 通规划的应用中特别有用。

综上,现有的城市交通流量预测模型往往忽略不同粒度数据之间的相互影响,在区域预 测方面具有缺陷,同时还存在模糊预测的问题。因此,现有问题往往存在预测准确度和效率 较低的缺陷。

发明内容

发明目的:本发明的目的是针对现有技术的缺陷,提供一种基于图神经网络的多尺度 城市交通流量预测方法,用于解决在背景技术方面提出的几个缺陷问题。采用本发明公开 的方法,可以有效利用交通数据流的时空相关性来实现整个城市不同尺度的交通流预测, 并且可以保证在不同情况下有较高的预测精度。

技术方案:一种基于图神经网络的多尺度城市交通流量预测方法,具体步骤如下:

步骤一:数据预处理

1)基于图结构获得分配矩阵A

2)基于节点特征获得分配矩阵A

3)将两种映射矩阵融合,得到最终的映射矩阵。具体是将两个映射矩阵做点积运算, 从而得到最终的映射矩阵A

A

4)然后采用求和或者求平均的方式聚合细粒度数据,从而得到粗粒度数据X

X

上述细粒度和粗粒度数据就是我们所需要的城市交通流量历史数据张量。

步骤二:训练神经网络

使用步骤一构建的细粒度与粗粒度城市交通流量数据训练整个网络。模型有两个部分: 空间特征提取模块与时间特征提取模块。空间提取模块中包括普通图卷积GCN与跨尺度图 卷积Cross-Scale GCN,GCN用于分别提取不同粒度数据各自的空间特征,而Cross-Scale GCN 将不同粒度数据的空间特征进行融合。时间特征提取模块中包括Inter-Attention与 Intro-Attention,前者用于加强同一粒度内捕获时间相关性的能力,后者用于捕获不同粒度 数据的时间相关性。

网络的输入则分别是细粒度的历史流量特征矩阵和粗粒度的历史流量特征矩阵以及它 们对应的邻接矩阵。邻接矩阵的值代表两个节点是否连通,如果连通则为1,不连通为0。 首先通过GCN分别对粗细粒度数据进行卷积,然后利用映射矩阵,通过Cross-ScaleGCN将 不同粒度数据的特征融合,细粒度的信息流向粗粒度,同时粗粒度的数据也流向细粒度。 然后通过加入了Inter-Attention的LSTM,将两种粒度数据的隐藏表示通过Intra-Attention融 合,最后通过全连接层映射为不同粒度的数据,得到最终预测数据。

我们将不同粒度的预测值与其相应的真实值构建损失,除此之外,为了保证细粒度与 粗粒度的准确性,我们在它们之间添加了结构约束,这保证粗粒度节点的预测值与其对应 的细粒度节点是对应的。若用X

其中λ是一个超参数,通过使用Adam算法和反向传播算法对损失函数进行优化,最终当算 法收敛时,得到最优解。

步骤三:生成预测结果

将前t个时刻的细粒度与粗粒度城市交通流量矩阵{X

作为本发明的进一步优选方案,上述步骤二中,空间卷积模块与时间特征提取模块具 体设计方法如下:

对于粗细两种粒度的数据,我们使用两个独立的图神经网络,空间卷积模块首先包含了 普通GCN,它可以聚合局部节点的特征信息,还包括Cross-scale GCN,通过粗粒度的卷积, 将结果加到细粒度特征,两者实现信息传递。我们通过在每个图中传递信息来学习更好的 节点的表示,并使用由粗到细和由细到粗的信息流在两种表示之间交换信息,这允许图中 节点捕获到远距离节点的特征。空间卷积模块我们使用加入了Attention的LSTM,当输入序 列非常长时,模型难以学到合理的向量表示。于是加入了Intra-attention,这样最后一个时 刻的数据能不同侧重的考虑前面所有时刻数据。输入的历史数据为{X

有益效果:本发明针对城市交通流量预测问题,提出了一直基于图神经网络的城市交通 流量预测方法。本发明采用以上技术方案与现有技术相比,具有以下技术效果:

1)本发明首次研究了多尺度交通预测问题,并提出了一个多任务时空网络模型,实现 不同尺度的城市交通流量预测。

2)提出了一种跨尺度时空特征学习机制,该机制包含有效融合跨尺度空间特征的跨尺 度GCN层和捕捉跨尺度时间相关性的分层注意机制,使得模型预测更加准确。

3)为了满足多尺度交通数据预测结果的一致性,为目标函数设计了结构约束。

附图说明

图1是方法流程图;

图2是模型的具体设计结构图;

图3是Intra-Attention与Inter-Attention模块的示意图;

具体实施方式

下面结合附图,对本发明的技术方案做进一步的详细说明。

基于图神经网络的城市交通流量预测方法总体流量如图1所示。预处理后的数据输入到 一个包含空间特征提取与时间特征提取的模块里,生成未来时刻的粗粒度与细粒度的城市交 通流量。两种不同粒度的数据可以相互影响,具体来讲,本发明构造了如下两组组数据作为 输入:

X

本发明公开的基于图神经网络多尺度城市交通流量预测方法,其具体过程如下:

步骤一:数据预处理

5)基于图结构获得分配矩阵A

6)基于节点特征获得分配矩阵A

7)将两种映射矩阵融合,得到最终的映射矩阵。具体是将两个映射矩阵做点积运算, 得到最终的映射矩阵A

A

8)然后采用求和或者求平均的方式聚合细粒度数据,从而得到粗粒度数据X

X

上述细粒度和粗粒度数据就是我们所需要的城市交通流量历史数据张量。

步骤二:训练神经网络

使用步骤一构建的细粒度与粗粒度城市交通流量数据训练整个网络。如图2所示,模 型有两个部分:空间特征提取模块与时间特征提取模块。空间提取模块中包括GCN与Cross-Scale GCN,GCN用于分别提取不同粒度的数据各自的空间特征,而Cross-Scale GCN将 不同粒度的数据的特征进行融合。时间提取模块中包括Inter-Attention与Intro-Attention, 前者用于加强同一粒度内捕获时间相关性的能力,Intro-Attention用于捕获不同粒度数据的 时间相关性。

网络的输入则分别是细粒度的历史流量特征矩阵{X

若用X

其中λ是一个超参数,通过使用Adam算法和反向传播算法对损失函数进行优化,最终当算 法收敛时,得到最优解。

对于粗细两种粒度的数据,我们使用两个独立的图神经网络,空间卷积模块首先包含了 普通GCN,它可以聚合局部节点的特征信息,远距离的交通流量也可能影响当前位置的节 点,为了使节点捕捉到远距离节点信息,加入了Cross-scale GCN,通过粗粒度的卷积,将结 果加到细粒度特征,两者实现信息传递。我们通过在每个图中传递信息来学习更好的节点 的表示,并使用由粗到细和由细到粗的信息流在两种表示之间交换信息,这允许图中节点 捕获到远距离节点的特征。我们的方法能够克服经典图神经网络已知的一些限制,如捕获 远距离节点的信息,同时进行有效的训练。Cross-scale GCN的公式如下:

空间卷积模块我们使用LSTM,并进行改进,如图3所示,当输入序列非常长时,模型难以学到合理的向量表示。加入了Intra-attention,这样最后一个时刻的数据能不同侧重的 考虑前面所有时刻数据,它最核心的操作就是一串权重参数,要从序列中学习到每一个元 素的重要程度,然后按重要程度将元素合并。权重参数就是一个注意力分配的系数,给哪 个元素分配多少注意力。Attention机制的实现是通过保留LSTM编码器对输入序列的中间输 出结果,然后训练一个模型来对这些输入进行选择性的学习并且在模型输出时将输出序列 与之进行关联。输入的历史数据为{X

f

i

c

o

其中σ代表激活函数,⊙代表哈达玛积,f

为了模拟两个尺度数据之间的时间关联,我们还设计了一个Inter-Attention机制,如图 3右侧所示。由于两个尺度数据的特征维数不同,我们需要先将它们转换到相同的特征空间。 我们首先将粗粒度特征向上采样到细粒度特征空间,用s′

Z=β

Z

β表示Inter-Attention的系数。

步骤三:生成预测结果

将前t个时刻的细粒度交通流量矩阵{X

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式, 在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各 种变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号