首页> 中国专利> 一种基于空间copula理论的交通流量预测方法

一种基于空间copula理论的交通流量预测方法

摘要

本发明公开了一种基于空间copula理论的交通流量预测方法,包括1、获取一条路段中磁感线圈设备的地理位置及其统计的交通流量数据;2、基于样本点的地理位置计算其两两之间的距离;3、根据半变异函数来确定样本适合的相关函数模型;4、由样本交通流量进行边缘分布拟合;5、选择cpula模型,计算交通流基于距离的关联系数,从而验证所选copula模型的可行性;6、调用模型进行预测。本发明考虑交通流的空间特征,深度挖掘交通流分布类型,具有较高的精度和可靠性。

著录项

  • 公开/公告号CN105741549A

    专利类型发明专利

  • 公开/公告日2016-07-06

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN201610243324.7

  • 发明设计人 马晓磊;栾森;丁川;刘从从;

    申请日2016-04-18

  • 分类号G08G1/01(20060101);G08G1/042(20060101);G06Q10/04(20120101);G06Q50/30(20120101);

  • 代理机构11121 北京永创新实专利事务所;

  • 代理人赵文颖

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-06-19 00:02:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-05

    授权

    授权

  • 2016-08-03

    实质审查的生效 IPC(主分类):G08G1/01 申请日:20160418

    实质审查的生效

  • 2016-07-06

    公开

    公开

说明书

技术领域

本发明属于智能交通信息处理技术领域,具体地说是一种基于空间copula(关联)理论 的交通流量预测方法。

背景技术

随着经济发展和汽车的普及,道路交通流量逐年增加,其增速超过了道路的修建速度, 造成交通阻塞总是存在。所以,修建道路扩大交通容量已成定局。交通流量是指在选定的时 间内,通过道路某一地点、某一断面或某一车道交通体的数量。同时交通流量也是交通系统 的组成要素之一,对于智能交通系统(ITS)有着重要的意义,是用于交通规划、交通设计和 交通管理的重要参数,为道路智能化管理提供依据,从而有效的减少道路拥堵,提高路面资 源的利用率。在数据时代,交通流数据的准确和完整,显得尤其重要。

目前,各大省市的路段和收费站都设有磁感线圈设备记录过往车流量,计算机系统实时 收到线圈记录并存入数据库。但是磁感线圈检测器的性能易受天气、地理环境或自身故障等 因素的影响,极易造成数据流失。在某些路段,线圈返回数据并不连贯,有时还会出现明显 的错误,累积有高达50%的检测点的数据无效,这种情况下的数据只能得到可信度较低的交 通决策,也是管理者无法接受的。因此,利用统计学理论进行交通流预测是弥补数据缺失的 行之有效的方法。

现有的比较成熟的预测方法有基于时间序列的ARIMA(自回归求和滑动平均)、非参数的 K-NN方法和空间插值法等。ARIMA模型适用于短时客流预测,且需要完备精确的历史数据, 但数据的缺失影响了时间序列的连续性,无法捕捉到相邻时间序列观测值之间的依赖性; K-NN算法依据邻近的k个样本来决定待预测样本,适用范围有限于交通流平稳的区域;空 间插值法利用样本点之间的半变异函数关系并基于临近样本点对未知点进行插值预测,此种 方法在已知样本点分布密集的区域效果较好,在样本稀疏区域则会出现较大误差。

发明内容

本发明的目的为克服上述现有技术的不足,提供一种基于空间copula理论的交通流量 预测方法,相比于时间序列和近邻插值,本发明从交通流量切入,不仅克服了已有方法的不 足,而且采用交通流拟合方法能够明确不同区域路段的交通流分布规律,并有效提取交通流 特征,对于道路交通分析和预测以及交通设施的设计和控制具有重要意义。

本发明的一种基于空间关联理论的交通流量预测方法,首先抽样选择一条路段上的磁感 线圈设备作为样本,样本的选择尽量能体现整条路段的交通流分布;计算样本点之间的欧式 距离,并选择拟合度较高的相关函数。其次用所选样本的交通流量进行边缘分布拟合,确定 其分布类型。然后计算预测点与所有样本点的距离并设定作为参考的样本点的个数。随后, 选择copula模型并计算其关联系数;若关联系数偏小,则意味着所选模型不能充分反映整 条路段交通流的空间分布规律,建议重新选择其它模型,反之,则表明所选模型可以使用。 最后对边缘分布的逆函数和copula密度函数的乘积进行单位区域内的积分可得预测值。

本发明的优点在于:

(1)本发明最大的特点就是不再依靠传统的时间序列和近邻插值理论,而是通过挖掘样 本点的空间分布规律和特点并运用概率统计知识对交通流进行预测,具有很强的创新意义。

(2)本发明的主要目的是用已有检测点来预测数据缺失的检测点,完成对数据的补充。

(3)本发明只需少数样本点便可预测整个路段分布的交通流量,也就意味着可以减少路 段上线圈设备的投入。

附图说明

图1为本发明的方法流程示意图;

图2为国内某条高速公路上磁感线圈设备的分布图;

图3为实施例中基于不同距离刻度下交通流量关联系数的散点示意图。

具体实施方式

下面将结合附图和实施例对本发明作进一步的详细说明。

本发明提供一种基于空间copula理论的交通流量预测方法,流程图如图1所示,包括 如下步骤:

1)、数据采集及处理:在高速路网上通过磁感线圈设备对交通客流计数获取实时客流信 息,从所获得信息中选取测试点的经纬度坐标和客流量数据。其中,用x,y表示经纬度,z 表示交通流,n表示样本点数目。

2)、计算两两样本点之间的距离得到对称的距离方阵记为H,例如H中(1,2)点的值即为 第一个样本与第二个样本的距离值,(2,1)点处的值与之相等;显然对角线上的值全都为零。

3)、选择合适的相关函数:首先计算变程a、基台l和块金c0三个参数,然后在基于步骤 2)中所得距离方阵计算相关协方差矩阵,最终将参数代入不同的相关函数得到不同的半变异 方差。其中已有供选相关函数包括高斯、指数、球形,也可补充其他类型。计算方法如下:

a=0.1*(max(xi)-min(xi))2+(max(yi)-min(yi))2l=max(dis)+median(dis)2c0=min(dis)lmse=min(fv(c0,a,l))

其中,xi,yi为样本点的坐标;dis为样本点的距离方阵H中数值小于指定距离h的平均 值,h和dis均为值序列,如h=[10203040];min、max和median分别是求最小值、 最大值和中值;fv为相关函数;mse为不同相关函数所得的半变异方差中的最小值,与之 对应的即为样本的相关函数。相关函数的表达式如下表:

4)、边缘分布拟合:需要计算交通量样本的均值、标准差,然后进行不同边缘分布下的 各样本值的概率密度计算,得到每个样本点的概率值,然后对所有样本点的概率值求和,不 同的边缘分布最终会得到不同的总概率值,当某一边缘分布对应的总概率值最大时,该边缘 分布类型即作为样本的最佳边缘分布,计算方法如下:

P=Σi=1nlog(fm(zi,u,σ))

其中,zi交通流量样本值;u为样本均值;σ为样本标准差;fm为不同的边缘分布概率 密度函数,P表示样本点服从某一分布的概率总和值;n为样本点个数。

5)、基于距离的关联结构检测:选择copula模型,基于相关函数,计算关联系数。计 算公式如下:

ci=(1-c0)*exp(-hi2a2)ρi=1201cidc-3

其中,c0和a分别为步骤3)中的块金和变程;hi为指定的距离序列;ci为相应距离内的 相关矩阵;ρi为相应距离内的关联系数。

6)、根据步骤4)中的最优边缘分布概率密度函数选择高斯copula模型,进行交通流 量数据的转换,所述高斯copula模型是由数据转换过程采用了标准正态的方式而被定义的, 其计算方法如下:

Ci=Fm(zi,u,σ)newi=Fc-1(Ci,0,1)

其中,zi交通流量样本值;u为样本均值;σ为样本标准差;Fm表示边缘分布的累积分 布函数;Ci为样本的边缘累积分布率;是copula模型函数采用的标准正态累积分布函数 的逆运算;newi表示交通流量数据转换值。

7)、用x*,y*分别表示预测点的地理坐标,计算每一预测点与已知样本点的距离,设定 参考样本量为N*,则从距离序列中递增的选择前N*个数值d*并得到其在原序列中的索引序 列记为Ind,然后从步骤2)中所得距离矩阵中取H(Ind,Ind),记为h*,h*为N*xN*矩阵。计 算已知点和预测点之间的相对的期望与标准差,计算公式如下:

m=exp(-d*·^2)exp(-h*·^2)*new(Ind)v=1-exp(-d*·^2)exp(-h*·^2)*(d*T)

其中,new表示6)中的交通流量转换序列,new(Ind)则表示new中索引对应位置处的值;d*T表示d*的转置序列,m,v分别表示预测点与样本点之间的相对的期望和标准差。。

然后计算边缘分布的逆函数和copula密度函数c(t),把二者乘积在单位区间上积 分即得预测值。其计算公式如下:

其中,fc和为分别正态分布的概率密度函数及其逆函数;步骤5)中确定的边缘分 布的概率密度函数的逆函数;pt表示单位区间内均匀步长的概率值;即为交通流预测值。

8)、计算预测结果的绝对百分比误差(APE),计算公式如下:

所述步骤1)中,磁感线圈设备数据还包括设备编号、所在路段、运行状态等信息。

所述步骤3)中,相关函数是由半变异函数变化而来,半变异函数是地质统计学中研究 土壤变异性关键函数,反映土壤性质的不同距离观测值之间的变化。半变异函数的拟合也可 以通过专业分析软件求得,如Arcgis。

实施例

一种基于空间关联理论的交通流量预测方法,具体如下:

1)、如图2所示,为国内某一条高速路段,此路段有效样本点共计490个,在路段全 局范围内选择约1/4的磁感线圈设备作为样本,所需数据包括每一设备的地理坐标和日交通 流量。此外,经纬度坐标需要换算一下方便后续的距离计算。数据换算后如下:

(89.5538,8.1358,74000),(89.0651,8.3785,71000)…

(39.0882,66.5354,36500)…(100.6302,10.1570,13700)

统计周期为一天,样本数据为123组。

2)、计算两两样本间的距离,利用Matlab工具得到对称的距离方阵。结果如下:

3)、根据样本数据,便可计算出计算变程(a)、基台(l)和块金(c0)三个参数,其结果如 下:

a=0.1*(max(x)-min(x))2+(max(y)-min(y))2=18.5687l=max(dis)+median(dis)2=657540c0=min(dis)l=0.2774

然后代入不同的相关函数得到不同的半变异方差,最小方差对应的函数类型即为相关函 数类型。半变异方差结果如下表:

相关函数类型 高斯 指数 球形 mse 20.3131 23.3565 23.9115

由mse的最小值可确定相关函数模型为Gaussian模型。

4)、边缘分布拟合是针对交通流量的分布拟合,常用的边缘分布函数有正态分布(norm)、 广义极值分布(gev)、对数高斯分布(logn)、Gamma分布和box-cox分布,将数据依次代入 所列分布函数,其结果如下表:

其中,box-cox分布是高斯分布的一种变换。由P的最大值可确定所选路段样本交通流 量符合对数高斯分布。

5)、设定距离刻度hi,计算可得不同刻度下的关联系数,对应结果如下表:

h 1 3 5 7 9 ρ 0.8891 0.8700 0.8334 0.7818 0.7184

由关联系数可知,距离较近的交通流量样本点具有较强的关联性,反过来也证明了所选 copula模型和相关函数是有效的。此外,还可知关联性随着距离的增加而减弱,其关联系数 也可转换为散点示图,如图3。

6)、计算样本交通流量值的对数高斯累积分布率,再对其进行高斯分布逆运算,则有:

Ci=logn>cdf(zi,mean(log(z)),std(log(z)))newi=norminv(Ci,0,1)

转换后的样本交通流量如下:

(89.5538,8.1358,0.0722),(89.0651,8.3785,0.037)…

(39.0882,66.5354,-0.5278)…(100.6302,10.157,-1.3586)

7)、选取预测点(88.6028,9.3341,157000)进行验证。由于距离越小关联系数越大, 则参考样本量尽量去较小值。本专利中N*=2,则首先计算出:

m=exp(-d*·^2)exp(-h*·^2)*new(Ind)=-0.555v=1-exp(-d*·^2)exp(-h*·^2)*(d*T)=0.3911

然后计算对数高斯分布的逆函数和关联结构为Gaussian模型的copula密度函数,将 二者乘积在单位区间上积分得到预测值如下:

最终由预测值可知其绝对百分比误差为:

SS=(159667-157000)/157000=1.7%。

以上详细描述了本发明的优选实施案例,但是本发明并不局限于上述实施案例的具体细 节,在本发明的整体结构范围内,可以对本发明的部分步骤进行多种变换并重新组合,本发 明对各种可能的组合方式不再列举,这些变换组合均属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号