首页> 中国专利> 一种基于多源交通数据的全局动态出行需求估计方法

一种基于多源交通数据的全局动态出行需求估计方法

摘要

本发明公开了一种基于多源交通数据的全局动态出行需求估计方法,将动态的交通数据与静态手机历史信令数据相融合,结合居民全局历史出行数据与实时交通出行数据来实时估计居民全局出行数据,可以大大减小OD调查的时间和经济成本。此外,引入Chi‑square distance来度量所构建的融合模型的准确度,进而确定最佳的主导出行方式阈值,获得估计准确的融合模型。本发明所述方法通过出租车出行与地铁出行的实时数据结合手机历史信令数据,可以有效感知大规模居民出行的实时出行状态,对于发生一些人群聚集的事件能够及时的感知并预警,对于城市的规划和管理具有十分重要的借鉴意义。

著录项

  • 公开/公告号CN108877227A

    专利类型发明专利

  • 公开/公告日2018-11-23

    原文格式PDF

  • 申请/专利权人 中南大学;

    申请/专利号CN201811000204.X

  • 发明设计人 王璞;黄智仁;刘洋;

    申请日2018-08-30

  • 分类号G08G1/01(20060101);G06Q10/06(20120101);G06Q50/26(20120101);

  • 代理机构43114 长沙市融智专利事务所;

  • 代理人龚燕妮

  • 地址 410083 湖南省长沙市岳麓区麓山南路932号

  • 入库时间 2023-06-19 07:21:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-02

    授权

    授权

  • 2018-12-18

    实质审查的生效 IPC(主分类):G08G1/01 申请日:20180830

    实质审查的生效

  • 2018-11-23

    公开

    公开

说明书

技术领域

本发明属于交通技术领域,特别涉及一种基于多源交通数据的全局动态出行需求估计方法。

背景技术

城市居民的出行与社会经济的发展息息相关,了解居民的出行需求不仅有利于城市的土地合理布局,也对城市交通的规划和管理具有十分重要的意义。长期以来,居民的出行OD调查受到各国政府和科研工作者的广泛重视,从政府管理层面,了解居民的出行特征不仅有利于维持城市的安全和稳定,也关乎行政人员对城市经济发展的宏观把控。从科研发展层面,科研工作者们广泛研究居民的出行特征,一方面是为了对居民的生活方式有更深刻的了解,同时也为从居民的出行规律中提取出有益信息,实现对诸如疫情传播等意外事故等的及时缓解与预警。传统的居民出行OD调查主要是通过问卷调查的形式,采样统计城市居民在一天中的各种活动地点与活动时间,之后随着手机的广泛普及,手机基站覆盖范围广且其服务的用户数量众多。已有部分发明利用手机通话详单数据(CDR)对居民出行进行提取,但是CDR数据由于采样频率低,往往不能提供精细而全面的出行信息。而手机信令数据作为另一种手机数据,克服了CDR数据的稀疏性的问题,记录频率高,根据精度要求的不同,一般数分钟至数小时就对用户进行一次扫描,通过手机信令数据来了解大规模的居民出行成为一种可行的方式。综上所述,现有的城市居民出行信息估计方法存在如下问题:

1)传统的问卷调查等方法不仅要耗费大量的人力物力财力,很大获取大规模的数据且记录信息并不十分精准。

2)由于手机基站数据被手机运营商收集,第三方机构难以实时获取,只能获取少量历史数据,故通过手机信令数据并不能对居民出行进行实时估计。

由此可见,找到一种成本较低且能实时有效估计居民出行需求的方法具有十分重要的现实意义。因为人们在日常使用各种信息设备时,设备会记录下用户的标识与使用信息,这些都将成为人们的社会信息。因此社会信号是一种静默的、广泛存在的个人行为数据。但是不同的社会信号数据的记录精度与获取难度各不相同,如何充分利用各种社会信号的优势对于实时出行感知方法的建立至关重要。

发明内容

本发明针对现有技术中存在的问题,提出一种基于多源交通数据的全局动态出行需求估计方法,将动态的交通数据与静态手机信令数据相融合,结合居民全局历史出行数据与实时交通出行数据来实时估计居民全局出行数据,有效的描述居民的实时出行需求特征。

交通数据作为社会信号中十分重要的一类,可以很好的记录人们的位置信息,为提取出行信息、估计交通需求提供数据支持。

一种基于多源交通数据的全局动态出行需求估计方法,包括以下步骤:

步骤1:依据道路网络和居民出行信息,构建城市交通小区;

步骤2:基于手机历史信令数据,提取居民出行OD作为居民全局出行信息;

步骤3:基于交管局实时记载的出租车GPS数据和地铁出行刷卡数据,提取居民出行OD作为居民实时交通出行信息;

一次居民出行OD是指某居民在某个时间从起点交通小区(O)到终点交通小区(D)的行为,OD交通量就是指起终点间的交通出行量;

步骤4:依据居民实时交通出行信息占居民全局出行信息的比值,选取不同居民出行OD估计模型,对不同交通小区之间的居民出行需求进行估计;

所述居民出行OD估计模型包括以下两种:

1)若β(i,j,tp)<δ,TR(i,j,t)=f(i,j,t)×<TM(i,j,tp)>;

2)若β(i,j,tp)>δ,TR(i,j,t)=T(i,j,t)×(1/β(i,j,tp));

其中,δ表示主导出行方式阈值,取值为范围为(0-1);t表示当前时间窗,tp表示历史日期数据中与t相同的时间窗;

β(i,j,t)表示居民实时交通出行信息占居民全局出行信息的比值:

β(i,j,tp)=<T(i,j,tp)>/<TM(i,j,tp)>

T(i,j,t)为利用出租车GPS数据和地铁出行刷卡数据记录到的在t时间窗从交通小区i到达交通小区j的居民数量;<T(i,j,tp)>为与当前时间窗t所在日期前的至少连续30天内每天在在tp时间窗从交通小区i到达交通小区j的平均居民数量;

<TM(i,j,tp)>表示利用手机历史信令数据记录到的与当前时间窗t所在日期前的至少连续30天内每天在tp时间窗从交通小区i到达交通小区j的平均居民数量;

所选的至少连续30天是指利用手机历史信令数据记录了居民出行数据的日期,在实际使用过程中,选取与当前时间窗所在日期越接近的日期越好;

所述的时间窗t和tp即为不同日期中同一时间段,例如,t表示当前日期内的上午8:00到9:00,tp表示当前日期之前的某天中的上午8:00到9:00;

f(i,j,t)表示活力系数,为t时间窗从交通小区i以及i周围εd=2km范围以内的所有交通小区选择出租车或地铁出发的居民数量;为与当前时间窗t所在日期前的至少连续30天内每天在在tp时间窗从交通小区i以及i周围εd范围以内的所有交通小区选择出租车或地铁出发的平均居民数量;为在t时间窗选择出租车或地铁到达交通小区j或j周围εd范围以内的所有交通小区的居民数量;为与当前时间窗t所在日期前的至少连续30天内每天在在tp时间窗选择出租车或地铁到达交通小区j或j周围εd范围以内的所有交通小区的平均居民数量;

TR(i,j,t)为所估计的在t时间窗从i交通小区到达j交通小区的实时真实居民数量。

进一步地,将主导出行方式阈值δ从0开始,递增步长为0.05,选用居民历史出行数据进行多次计算xi,j和yi,j,从而得到d(x,y),选取d(x,y)的拐点处的横坐标作为最佳主导出行方式阈值δ:

其中,d(x,y)表示差异化程度;xi,j表示在至少连续30天的历史数据中,利用出租车GPS数据和地铁出行刷卡数据记录到的在tp时间窗从交通小区i到达交通小区j的居民数量以及居民出行OD估计模型估计出的居民真实出行的归一化值:xi,j,t=TR(i,j,tp)/∑i,jTR(i,j,tp)

yi,j表示在至少连续30天的历史数据中,利用手机信令数据计算得到的居民真实出行的归一化值:yi,j=TM(i,j,tp)/∑i,jTM(i,j,tp)。

通过利用历史出行数据,在主导出行方式阈值的取值范围中,按照步长遍历阈值的各种取值,得到使得估计值和真实值差异化程度对应拐点处的阈值;

进一步地,所述利用出租车GPS数据和地铁出行刷卡数据记录到的在t时间窗从交通小区i到达交通小区j的居民数量的计算过程如下:

T(i,j,t)=βsub×Tsub(i,j,t)+βtaxi×Ttaxi(i,j,t)

其中,βsub和βtaxi分别为地铁出行与出租车出行的扩样系数,分别为交通管理部门发布的日均地铁出行总量与日均出租车出行总量,Tsub(i,j,t)和Ttaxi(i,j,t)分别为在时间窗t从交通小区i到达交通小区j选择地铁出行和出租车出行的居民数量。

进一步地,所述时间窗的时间为1小时。

有益效果

本发明提供了一种基于多源交通数据的全局动态出行需求估计方法,将动态的交通数据与静态手机历史信令数据相融合,结合居民全局历史出行数据与实时交通出行数据来实时估计居民全局出行数据,可以大大减小OD调查的时间和经济成本。此外,引入Chi-square distance来度量所构建的融合模型的准确度,进而确定最佳的主导出行方式阈值,获得估计准确的融合模型。本发明所述方法通过出租车出行与地铁出行的实时数据结合手机历史信令数据,可以有效感知大规模居民出行的实时出行状态,对于发生一些人群聚集的事件能够及时的感知并预警,对于城市的规划和管理具有十分重要的借鉴意义。

附图说明

图1为本发明所述方法的流程图;

图2为出行数据提取方式示意图;

图3为融合校正模型的流程图;

图4为在不同的δ值下的Chi-square distance值的分布图;

图5为在δ=0.05下得到的对所估计的居民实时真实出行分布与居民真实出行分布的Chi-square distance值的分布图;

图6为3个交通小区在正常时期(白色直方图)与发生人群聚集活动时(灰色直方图)通过本发明所述方法统计的区域人口总量变化情况的对比图,其中,(a)为交通小区A,(b)为交通小区B,(c)为交通小区C。

具体实施方式

下面将结合附图和实施例对本发明做进一步的说明。

本发明提出了一种利用多源交通数据进行动态交通需求估计方法,如图1所示,并对南方某特大城市的居民出行进行了应用。

首先构建该市交通小区,通过该市的手机信令数据提取居民的真实出行信息,通过该市出租车GPS数据与地铁刷卡数据提取居民的实时出行信息,然后将该市的居民出行按β(i,j,tp)的取值以δ为临界值分为两种居民出行模式,对不同居民出行模式采用不同的方式估计居民的实时真实出行。

在本实例中,以该市的大规模人群聚集活动为例对该实时居民出行感知方法进行了有效性验证。

所述交通小区是基于该市的道路网络和用地属性进行划分,共分为1112个交通小区,各小区平均面积1.79平方公里。

所述手机信令数据为2012年一个普通工作日的全天出行手机信令数据,共记录到超过一千万的手机用户,总信令数据约为5.4亿条记录。时间窗长度tw选为1个小时,将一天按24小时划分为24个时间窗,提取在不同时间窗下手机信令数据中所记录到的所有用户出行OD,得到TM(i,j,t),作为居民真实出行信息。

所述出租车GPS数据为连续记录三个月的出租车GPS记录数据,共包括约为15000个出租车用户,总GPS记录超过30亿条;地铁刷卡数据为同样在此3个月内的用户地铁进出站刷卡数据,共包括320万地铁卡用户,约为2亿条地铁刷卡记录。提取在不同时间窗下出租车GPS数据和地铁刷卡数据中所记录到的用户出行OD,分别得到Ttaxi(i,j,t)和Tsub(i,j,t)。获取到该市每日的平均出租车出行量<Ttaxi(i,j,t)>约为43万次,而据官方数据显示,该市日均出租车出行为120万次,故可得到出租车出行扩样系数为βtaxi=120/43=2.77;同样获取到该市每日的平均地铁出行量<Tsub(i,j,t)>约为162万次,而据官方调查该数据为284万次,故可得到地铁出行扩样系数为βsub=284/162=1.76。从而根据下式获取不同时间窗下的实时交通出行信息:

T(i,j,t)=βsub×Tsub(i,j,t)+βtaxi×Ttaxi(i,j,t)

不同时间窗下的居民真实出行与实时交通出行数据如图3所示。

所述的居民不同出行模式通过交通出行比例因子β(i,j,tp)来度量,β(i,j,tp)=<T(i,j,tp)>/TM(i,j,tp),设置临界值δ。

1)对于β(i,j,tp)<δ时的居民出行,引入一个活力系数f(i,j,t):

f(i,j,t)=fTP×fTA×fT

而后估计居民的实时真实出行数据TR(i,j,t):

TR(i,j,t)=f(i,j,t)×TM(i,j,tp)

2)对于β(i,j,tp)>δ时的居民出行,通过下式估计居民的实时真实出行数据TR(i,j,t):

TR(i,j,t)=T(i,j,t)×(1/β(i,j,tp))

所述的临界值δ的确定,通过引入Chi-square distance,对在不同δ下所估计的实时真实居民出行TR(i,j,tp)/∑i,jTR(i,j,tp)的分布与居民真实出行TM(i,j,tp)/∑i,jTM(i,j,tp)的分布进行相似度度量,Chi-square>

其中,d(x,y)表示差异化程度;xi,j表示在至少连续30天的历史数据中,利用出租车GPS数据和地铁出行刷卡数据记录到的在tp时间窗从交通小区i到达交通小区j的居民数量以及居民出行OD估计模型估计出的居民真实出行的归一化值:xi,j,t=TR(i,j,tp)/∑i,jTR(i,j,tp)

yi,j表示在至少连续30天的历史数据中,利用手机信令数据计算得到的居民真实出行的归一化值:yi,j=TM(i,j,tp)/∑i,jTM(i,j,tp)。

从而计算到在不同δ值下两种居民出行分布的Chi-square distance值,如图4所示,Chi-square distance值越低,表明两种概率分布越相似,看到δ=0.05为拐点值,在δ=0.05时的Chi-square distance值已经较低,若δ的取值过大则会导致忽视实时交通出行数据所带来的实时性,因此,确定临界值δ=0.05。

在δ=0.05时两种居民出行数据的分布如图5所示,说明在δ=0.05时所估计的实时真实居民出行已经很接近真实的居民出行。

所述对该居民出行感知方法有效性的验证,根据社交媒体发布的信息选取了在三个月期间该市发生人群聚集活动的3个案例,通过上述方法估计这些案例发生地点所处交通小区的在人群聚集时和正常情况下人口总量的变化,具体过程为:

步骤1、通过手机信令数据估计居民的家庭地点,在22:00到凌晨06:00期间居民最长停留的位置视为居民的家庭所在位置,可以得到不同交通小区的夜间居民数量Np(z),其中z表示交通小区。

步骤2、通过上述居民出行感知方法统计从凌晨05:00至24:00每小时的各交通小区的人口变化量ΔN(z,t):

其中:表示在t时间窗进入交通小区z的居民数量,表示在t时间窗内离开交通小区z的居民数量。

从而可以得到不同时间下的不同交通小区的人口总量:

N(z,t)=Np(z)+∑tΔN(z,t)

其中:N(z,t)表示位于z交通小区在t时间窗的居民数量,∑tΔN(z,t)表示在t时间窗内居民对z交通小区的净到达量(t时间窗内居民进入的人数减去离开的人数)。

从而得到在这3个发生人群聚集案例的交通小区A、B、C在正常时(白色直方图)与发生人群聚集时(灰色直方图)的人口总量变化情况,如图6所示。可以看出,在发生人群聚集时,该方法所感知到的人口总量也会发生明显增加,说明通过该方法能够非常有效的实时感知到人口的变化情况,验证了该实时居民出行感知方法的有效性。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号