首页> 中国专利> 基于城市区域多模态融合的人群流量预测方法

基于城市区域多模态融合的人群流量预测方法

摘要

本发明公开了一种基于城市区域多模态融合的人群流量预测方法,包括:获取城市数据并进行预处理;将城市划分成等大小的网格区域,并构建相应大小结构的城市数据矩阵;计算每个网格区域的流行度、兴趣点差异性矩阵、热度值;基于热度值,对人类活动数据进行OPTICS聚类,将城市划分成多种类的功能区域;计算每个网格区域的欧几里得距离、流量相似度、兴趣点相似度,并基于划分好的功能区域构建多模态相关性图;基于多模态相关性图,使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测。本发明方法能够划分更加真实、多元的热点区域,并充分利用城市区域之间潜在的多种相关性。在基于海量的城市时空数据计算中,具有更良好的预测效果。

著录项

  • 公开/公告号CN112396218A

    专利类型发明专利

  • 公开/公告日2021-02-23

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202011227802.8

  • 发明设计人 顾晶晶;孙明;凌超;

    申请日2020-11-06

  • 分类号G06Q10/04(20120101);G06Q50/26(20120101);G06N3/04(20060101);

  • 代理机构32203 南京理工大学专利中心;

  • 代理人朱炳斐

  • 地址 210016 江苏省南京市秦淮区御道街29号

  • 入库时间 2023-06-19 09:58:59

说明书

技术领域

本发明属于模式分析领域,特别涉及一种基于城市区域多模态融合的人群流量预测方法。

背景技术

随着经济的飞速发展,人民的生活水平不断提高,人们的出行方式日益多样化,出行次数也大幅上升。但与此同时,城市的交通拥堵问题也日益严重。随着位置技术服务Location Based Services(LBS)的普及和计算机计算能力的提高,城市居民的出行信息被采集,生成了大量的人类活动行为数据集。大数据的应用使得我们有机会发现一些现代城市中的各种出行行为的规律,以帮助解决快速的城市化带来的一系列问题。

如果能够及时准确的预测和分析人群活动的规律,许多城市化问题,比如交通拥堵、交通资源调度等问题就会迎刃而解。但由于不同年龄段、不同工作、不同文化背景的人们对兴趣点的偏好不同,城市中的人们流向是多种多样的以及城市环境的高度动态性,精确的城市人群流量预测一直是个难点。

通常情况下,对于城市的流量预测主要通过采集历史数据并使用某种数学模型来预测未来的流量情况,一般分为基于统计与机器学习方法、基于概率图模型的方法以及基于深度学习的方法。例如,A.Abadi等人提出了一种自回归综合移动平均(AutoregressiveIntegrated Moving Average,ARIMA)模型进行数据驱动的方法来预测城市交通流量。Longbiao Chen等提出了一种基于动态集群的过度预测框架来预测站点式共享自行车的流量。C.Thirumalai等人提出了一个深度神经网络模型,使用历史自行车数据来预测共享自行车的未来使用情况,并使用基于门控循环单元的循环神经网络(Recurrent NeuralNetwork,RNN)进行城市交通流量预测。

虽然现有研究工作中有大量关于城市人群活动数据的流量预测的工作,但是现有的工作主要是通过解决问题中的众多约束或图形模型来执行带有一些环境变量的交通量预测。然而,环境方面的变量很多,用户无法考虑所有这些变量。另外,这也会使优化变得极其复杂且难以解决。

发明内容

本发明的目的在于针对上述现有技术存在的问题,提供一种基于城市区域多模态融合的人群流量预测方法,利用多模态融合,结合图卷积神经网络以及城市数据的时空相关性,挖掘城市区域多重相关性,更好地预测人群流量。

实现本发明目的的技术解决方案为:一种基于城市区域多模态融合的人群流量预测方法,所述方法包括以下步骤:

步骤1,获取城市数据,并对数据进行预处理以消除噪声数据;

步骤2,将城市划分成等大小(H×W)的网格区域g

步骤3,计算每个网格区域的流行度PR

步骤4,基于网格区域的热度值H

步骤5,计算每个网格区域的欧几里得距离、流量相似度、兴趣点相似度,并基于划分好的城市功能区域构建多模态相关性图:区域间距离相关图G

步骤6,基于多模态相关性图,使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测。

本发明与现有技术相比,其显著优点为:1)在高度复杂、动态的城市环境下,基于热度值的聚类方法可以对城市进行更真实、多元的功能区划分;2)针对城市复杂的结构、功能、交互特征,设计了多模态的相关性图,可以更加充分地挖掘城市多种潜在相关性;3)使用了基于图卷积神经网络的多模态融合预测模型,可以更好的提取图型结构的特征,并对城市多种潜在相关性进行融合,预测城市区域未来的人群流量。

下面结合附图对本发明作进一步详细描述。

附图说明

图1为本发明基于城市区域多模态融合的人群流量预测方法流程图。

图2为本发明基于城市区域多模态融合的人群流量预测方法框架图。

图3为一个实施例中基于热度值的OPTICS聚类形成的城市区域图,其中(a)为对上海地区聚类得到的功能区热力图,(b)为对北京地区聚类得到的功能区热力图。

图4为一个实施例中算法误差对比图,其中(a)和(b)分别为以MAE和RMSE作为评价指标,在不同时间序列上使用不同方法进行预测的对比实验结果图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,结合图1和图2,本发明提供了一种基于城市区域多模态融合的人群流量预测方法,所述方法包括以下步骤:

步骤1,获取城市数据,并对数据进行预处理以消除噪声数据;

这里,城市数据包括:

人类活动数据,包括人类活动起始点(x

城市兴趣点数据,包括兴趣点名称、类别、位置等;

天气温度数据,包括每个时刻的天气及温度等。

步骤2,将城市划分成等大小(H×W)的网格区域g

步骤3,计算每个网格区域的流行度PR

步骤4,基于网格区域的热度值H

步骤5,计算每个网格区域的欧几里得距离、流量相似度、兴趣点相似度,并基于划分好的城市功能区域构建多模态相关性图:区域间距离相关图G

步骤6,基于多模态相关性图,使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测。

进一步地,在其中一个实施例中,步骤1中所述对数据进行预处理以消除噪声数据,具体过程包括:

步骤1-1,若某一条数据记录中的某一特征存在空值,将该条数据删除;

步骤1-2,对剩余的数据进行降维处理,删除其中的离群点数据;

步骤1-3,对剩余的数据进行归一化处理,并将天气温度数据处理成独热值数据。

进一步地,在其中一个实施例中,步骤2中所述城市数据矩阵包括人类活动数据矩阵M

式中,

进一步地,在其中一个实施例中,步骤3中所述网格区域流行度使用PageRank值进行度量,计算公式为:

式中,PR

所述兴趣点差异性矩阵f的计算过程包括:

(1)计算网格内兴趣点的特征值v

式中,n

(2)计算不同网格的兴趣点差异性,构建兴趣点差异性矩阵f:

式中,f(v

所述网格区域的热度值H

其中,

式中,h

由于人类活动的局限性,当用户乘坐交通工具出行,会经过公交站、地铁站等交通枢纽。这些区域虽然具有很高的活跃度,但是通常不是用户真正的目的。而上述设计的区域热度值可以解决这种不真实的活跃度的问题,从而发现更真实的城市热点区域。

进一步地,在其中一个实施例中,步骤4所述基于网格区域的热度值H

MR=(1-l*H

式中,l为超参数,默认为0.01,eps为OPTICS聚类方法中质心的最大半径。

进一步地,在其中一个实施例中,步骤5中所述区域间距离相关图G

式中,

进一步地,在其中一个实施例中,步骤6所述使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测,具体包括:

步骤6-1,利用图卷积神经网络对四种多模态相关性图进行图卷积操作,得到每个相关性图的输出O

步骤6-2,对不同模态的相关性图的卷积结果O

O=W

式中,W

步骤6-3,将融合得到的结果O输入到多个全连接层f,即可得到最终的预测值为:

F

式中,F

由上述过程构建出基于图卷积神经网络结构的多模态融合模型,通过反向传播减小预测值和真实值的误差更新模型参数,获得训练后的人群流量预测模型;

步骤6-4,针对待预测人群流量的城市区域,执行步骤1至步骤5,获得相应的多模态相关性图,将这些图输入人群流量预测模型得到人群流量预测结果。

作为一种具体示例,在其中一个实施例中,对本发明进行进一步验证说明。

本实施例中选择10000m×10000m范围的上海和北京地区作为研究城市区域,同时收集了真实的上海自行车数据和北京出租车数据来测试本发明的模型。上海自行车包含733,457,167个骑乘记录,从2017年2月至2018年3月在上海市共有314,812辆共享自行车。每条记录都包含一个自行车ID、出发位置,出发时间,到达位置和到达时间;北京出租车数据包含983,457,167个出行记录,时间跨度从2017年2月至2018年3月。每条记录都包含一个出租车ID、出发位置,出发时间,到达位置和到达时间。

对于实验中的流量数据,使用基于热度值的OPTICS算法进行区域划分。如图3所示:使用基于热度值的OPTICS算法得到不同种类的城市功能区域,其中每个灰度值像素标识一个类别。

本实施例选择目前流行的不同流量预测方法作为对比方法来进行对比实验:全连接(FNN)、扩散卷积递归神经网络(DCRNN)、注意力图卷积模型(AGCN)。本发明的方法记作MVFCR。

对比实验的实验结果如图4所示,横轴表示需要预测的未来时间流量的时间步长,纵轴表示评价指标(MSE,RMSE)。可以看到:本发明提出的MVFCR模型优于其他三种方法。其中,FNN性能最差,因为它仅使用最新的交通数据,并且没有考虑相关的时空信息,因此它忽略了许多其他重要因素。性能其次差的是DCRNN算法,它忽略了区域之间的多重相关性,所以这种方法对于长距离人群运动中的交通流量的预测效果不好。AGCN方法在最初的几个时间步长中与本发明的MFCFP方法非常接近,但是随着时间步长的增加,其多重相关性会产生更大的影响,并且高度动态的城市环境也会影响注意力机制的效果,因此误差会增加。这证明本发明的方法对于预测城市区域人群流量是有效的。

本发明方法能够划分更加真实、多元的热点区域,并充分利用城市区域之间潜在的多种相关性。在基于海量的城市时空数据计算中,具有更良好的预测效果,且通过与其他相关算法对比,进一步验证了本发明的方法可以更准确地对人群流量进行预测。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号