法律状态公告日
法律状态信息
法律状态
2020-04-24
授权
授权
2019-08-16
实质审查的生效 IPC(主分类):G06Q10/04 申请日:20190327
实质审查的生效
2019-07-23
公开
公开
技术领域
本发明涉及大数据领域,特别涉及一种面向复杂地理环境的多层次网格划分算法。
背景技术
城市交通在人们的出行中扮演着非常重要的角色。交通运力与出行需求相匹配是最理想的情况,但现实中常出现这样的尴尬情景,以出租车为例:一边是出租车满大街转悠,另一边是乘客打不到车;一边是出租车扎堆,另一边是一辆车也没有。这种情况随着“滴滴”、“首汽”等网约车平台的出现有所改观,但营运车辆空载后到接单的这个时段依然存在着盲目行驶,热点区域车辆扎推等现象,对于乘客而言,依然存在着打车等待时间过长等问题,城市交通效率有待提升。
城市居民出行具有随机性,不同时间、不同区域的乘客分布也不均匀,并且会随着城市的发展、道路的拓展以及周边环境的变化而快速变化,依靠经验实现出行供需的精准对接是不可能的,必须借助大数据的收集和分析研究才能实现。出租车GPS大数据的收集是实时且透明的,它记录了乘客的上车时间、下车时间、上车地点、下车地点、行驶里程、费用等信息,这为挖掘乘客随机行为背后的出行规律,实现以出租车运营效益、运力和交通资源均衡分布为多重优化目标,制定实时高效寻客策略提供了基础数据。
目前,国内外研究者借助GPS大数据开展寻客策略研究,对于寻客策略来说,路径的选择、网格的划分方式会影响到策略的精准度,两个区域中心距离的取值决定了寻客行驶时间,直接影响计算结果。而现有的大多数交通路线的推荐方法中,没有结合城市的实际地理环境进行计算,如对于像北京这类道路规则有序、地理环境单一的平原地貌城市,参数值和区域两点之间的实际行驶距离基本接近,但对于诸如纽约、香港这类地理环境多样化的岛屿或者丘陵地貌城市,区域内经纬度相近的两个点可能隔着一条河,隔着一座山等天然屏障,必须绕道行驶,导致实际行驶距离和参数值相差非常大,导致在应用过程中与预想的收益结果偏差较大。
发明内容
为了解决背景技术中复杂地理环境导致实际行驶距离与计算值相差大的问题,本发明提供一种面向复杂地理环境的多层次网格划分算法。
本发明解决其技术问题所采用的技术方案是:一种面向复杂地理环境的多层次网格划分算法,包括以下步骤:
步骤1)初始划分:对城市地域进行初始网格划分,将各个网格记为(i,j),i=1,2…m,j=1,2,…n;
步骤2)稳定性计算:从GPS大数据中获取各网格内的行驶记录,并获得行驶距离d,计算各网格的稳定性指标
其中,
步骤3)独立区域划分:根据各网格的稳定性指标σijsk结合地理环境将城市地域划分为若干独立区域,使各个独立区域之间任意两点的行驶距离相对稳定;
步骤4)网格二次划分:每个独立区域采用数量等分法划分二次网格,标识为(b,i,j),其中(i,j)为网格编号,b为独立区域编号;将从GPS大数据中获取的行驶记录与各所述二次网格匹配;
步骤5)二次稳定性计算:计算所述二次网格的稳定性指标,得
其中,dijsk为网格(i,j)的中心至网格(s,k)中心的距离;
步骤6)重复步骤4至步骤5,最终使得(b,i,j)网格区域内各点到其他区域内各点的距离基本保持稳定,即
所述步骤4)还包括:
步骤41)将所述独立区域拆分成若干凸多边形,取所述凸多边形的各顶点的经纬度平均值,作为伪中心(x0,y0),其中,三角形是重心,其他凸多边形围成的平面区域,必定覆盖该点;
步骤42)用斜率截距法,计算所述凸多边形任意一条边的直线方程y=kx+b,将伪中心x0代入方程,计算y′=kx0+b,若y′≥y0,表明直线在上方,取不等式y≤kx+b;否则取y≥kx+b;
其中,对于平行于y轴的边,其直线方程为x=b,则只须判断x0与b的大小,就知道(x0,y0)在直线右边还是左边,取对应的不等式x≥b或者x≤b;
步骤43)重复步骤42,将得到的各个不等式进行“与”操作,从总出行记录中进行筛选,获得该凸多边形所包含的点。
本发明的有益效果是:本发明自行设计多层网格划分优化算法,巧妙地规避了由于城市地形屏障或交通管制等情况带来的网格划分不合理,解决了网格之间各点行驶距离不稳定的问题,同时根据历史数据方便地得到参数值,极大简化了求解两点之间行驶距离问题,提升了高效益寻客策略的精准度。
附图说明
图1为本发明实施例的纽约市行政地图。
图2为本发明实施例的客流量空间分布散点图。
图3为本发明实施例的行驶距离稳定性空间分布特征图。
图4为本发明实施例的空间区域折线划分图。
具体实施方式
下面结合附图对本发明实施例作进一步说明:
本发明实施例中,一种面向复杂地理环境的多层次网格划分算法,包括以下步骤:
步骤1):初始划分:对城市地域进行网格划分,网格划分可以有两种方法,一是按单位距离进行划分,单位距离设定为1km*1km;另一种按n*m进行划分,两者都可行,但后者更加灵活。将划分的各个网格记为(i,j),记xij,yij,i=1,2…m,j=1,2,…n为第(i,j)个网格区域中心点的经纬度,xmin,ymin,xmax,ymax表示纽约行政区域最小经度纬度和最大经纬度,可得每个空间网格的尺寸为Δx*Δy,
第(i,j)个区域中心点经纬度为:
网格距离决定了出发点到推荐点所花的时间成本,是提升高效益寻客策略精准度的关键指标。我们将网格距离定义为两个区域中心的距离,因为一般道路都是南北走向或者东西走向,所以该距离的计算可近似为延经度方向距离差加上延纬度方向距离差。于是可得第(i,j)个网格到第(s,k)个网格距离定义为:
dijsk=|xij-xsk|Ux+|yij-ysk|Uy
其中,Ux表示在该网格一度纬线对应的实际长度,Uy表示在该网格一度经线对应的实际长度。任意纬度的一度经线长度一样,而一度纬线的长度与行政区域的经度值θ相关,且有Ux=Uycos(θ)。
步骤2)稳定性计算:从GPS大数据中获取各网格内的行驶记录,并获得行驶距离d,计算各网格的稳定性指标
若σijsk≤0.1,则认为网格之间各点行驶距离稳定,即网格内的交通情况受实际地理环境、交通管制的影响较小。
步骤3)独立区域划分:根据各网格的稳定性指标σijsk,标识不稳定的网格位置,结合城市地理环境(如山、河等需要绕道的天然障碍),以影响稳定性因素为划分准则,将整体空间进行第一层次划分,划分为若干独立区域,各独立区域之间任意两点的行驶距离相对稳定。
步骤4)网格二次划分:对每个独立区域采用数量等分法划分二次网格,标识为(b,i,j),其中(i,j)为网格编号,b为独立区域编号;通过几何构造算法将从GPS大数据中获取的行驶记录与各所述二次网格匹配,具体为:
步骤41)将所述独立区域随机拆分成若干凸多边形,取所述凸多边形的各顶点的经纬度平均值,作为伪中心(x0,y0),其中,三角形是重心,其他凸多边形围成的平面区域,必定覆盖该点;
步骤42)用斜率截距法,计算所述凸多边形任意一条边的直线方程y=kx+b,将伪中心x0代入方程,计算y′=kx0+b,若y′≥y0,表明直线在上方,取不等式y≤kx+b;否则取y≥kx+b;
其中,对于平行于y轴的边,其直线方程为x=b,则只须判断x0与b的大小,就知道(x0,y0)在直线右边还是左边,取对应的不等式x≥b或者x≤b;
步骤43)重复步骤42,将得到的各个不等式进行“与”操作,从总出行记录中进行筛选,获得该凸多边形所包含的点。
步骤5)二次稳定性计算:计算所述二次网格的稳定性指标,得
步骤6)重复步骤4至步骤5,最终使得(b,i,j)网格区域内各点到其他区域内各点的距离基本保持稳定,即
本算法通过独立区域划分,减小初始网格中各点距离受实际地理环境的影响,提升稳定性;再通过二次网格划分,进一步减小交通管制等因素对行驶距离的影响,在提升策略精准度的同时,极大简化了两点行驶距离求解问题。下面纽约市的出租车GPS大数据具体讨论如何进行多层网格优化划分:
如图1所示,从行政地图可以了解,纽约市有五个行政区:曼哈顿(Manhattan)、皇后区(Queens)、布鲁克林区(Brooklyn)、布朗克斯区(The Bronx)、斯塔滕岛(StatenIsland),其中布鲁克林区和皇后区同在长岛,与其他3个区之间彼此分别被江河隔开。从客流量空间分布散点图(如图2所示),可知斯塔滕岛没有出行流量,因此图2的左下角没有出行信息,除曼哈顿区域外,肯尼迪机场、拉瓜迪亚机场为出行相对集中的热点区域。
由图3可以看出行驶距离不稳定的区域集中在曼哈顿岛与其他行政区的交界处,σijsk大于0.15,最高达0.2511;曼哈顿岛以及其他行政区的腹地,σijsk一般稳定在0.06-0.07之间。这些边界区域交通环境比较复杂,有桥、隧道直达对岸,也有些则必须绕道而行,而对于行政区腹地,地形基本单一。综合以上特征,我们将纽约市分为5大空间区域,分别为肯尼迪机场、拉瓜迪亚机场、曼哈顿区、布朗克斯区,以及同在长岛的布鲁林区和皇后区,用折线框在地图上勾勒,并记录各顶点的经纬度坐标,见图4。
对经过多层次网格划分优化之后的通行记录进行行驶距离稳定性计算,最差的稳定性指标值为0.0833,比之前的0.25提升了近3倍,两点之间行驶距离基本趋于稳定,证明了优化算法的有效性。
各位技术人员须知:虽然本发明已按照上述具体实施方式做了描述,但是本发明的发明思想并不仅限于此发明,任何运用本发明思想的改装,都将纳入本专利专利权保护范围内。
机译: 2.75D网格划分算法
机译: 2.75D网格划分算法
机译: 2.75D网格划分算法