首页> 中国专利> 一种基于大数据车辆全轨迹碰撞的伴随车分析方法及系统

一种基于大数据车辆全轨迹碰撞的伴随车分析方法及系统

摘要

本发明涉及一种基于大数据车辆全轨迹碰撞的伴随车分析方法,包括S1、行车轨迹运算;按车牌号码分组、按过车时间排序,对每辆车的过车数据进行聚合,计算出每辆车的行车轨迹;S2、行车轨迹数据存储;将行车轨迹以“时间?卡口?车牌”为行键,以“时间?卡口?过车信息”为主键,建立行车轨迹数据序列存储于Hbase数据库中;S3、判断是否在当前卡口伴随;通过经过同一卡口的时间比较,判断在当前卡口的伴随车辆;S4、判断是否在其他卡口伴随;在同一卡口伴随后,继续基于各自当前的行车轨迹计算是否还有其他的卡口存在伴随,当伴随的卡口数量达到指定的N次,则判定两车符合伴随出行的条件,认定为伴随车。

著录项

  • 公开/公告号CN105825671A

    专利类型发明专利

  • 公开/公告日2016-08-03

    原文格式PDF

  • 申请/专利号CN201610159886.3

  • 发明设计人 任博;罗超;龙剑;

    申请日2016-03-21

  • 分类号G08G1/01(20060101);

  • 代理机构11228 北京汇泽知识产权代理有限公司;

  • 代理人程殿军;张瑾

  • 地址 430074 湖北省武汉市洪山区邮科院路88号

  • 入库时间 2023-06-19 00:12:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-04-05

    授权

    授权

  • 2016-08-31

    实质审查的生效 IPC(主分类):G08G1/01 申请日:20160321

    实质审查的生效

  • 2016-08-03

    公开

    公开

说明书

技术领域

本发明涉及智能交通领域,更具体的说,是涉及一种基于大数据车辆全轨 迹碰撞的伴随车分析方法及系统。

背景技术

随着机动车的普及,在各类刑事案件中使用机动车作案的情况也越来越多。 机动车移动迅速、活动范围大的特点给公安部门的案件侦查增大了难度。近年 来,公路车辆智能检测记录系统(俗称卡口系统)在我国大部分城市道路得到 了广泛的应用,实现了车辆路口图像抓拍、车牌号码识别、车辆行驶状态分析 等车辆经过卡口的信息数据(简称过车数据)的采集,为涉车案件的侦破提供 了丰富的线索。但是卡口系统所采集的数据量及其庞大,许多更为重要的关联 信息有待作进一步的挖掘。伴随车分析就是对海量过车数据进行关联分析后得 到的非常实用的信息。

伴随车是指一辆以上的车辆同时经过某些卡口点位,且各自经过卡口点的 时间差在指定的范围内。犯罪分子在踩点和作案时,通常会使用多辆汽车,以 提高成功率。从卡口系统的角度看,团体作案具体表现为多辆车同时出没于特 定卡口覆盖范围,利用该特征,从海量过车数据中,就可以提取出满足特定条 件的车辆,提高侦破效率,这就是伴随车辆分析。

然而,传统的伴随车分析方法受限于分析服务器内存,以及关系型数据库 字段数量的限定,往往只能基于限定的很短时间范围内的过车数据进行分析。 这样分析出来的伴随车并不能完整的反应车辆之间的伴随出行情况,对案件侦 破的帮助有限。

发明内容

有鉴于此,有必要针对上述问题,提供一种基于大数据车辆全轨迹碰撞的 伴随车分析方法及系统,通过特定行车轨迹格式进行聚合、分析计算,提供准 确的、两两相关的伴随车信息。

为了实现上述目的,本发明的技术方案如下:

一种基于大数据车辆全轨迹碰撞的伴随车分析方法,包括以下步骤:

S1、行车轨迹运算;按车牌号码分组、按过车时间排序,对每辆车的过车 数据进行聚合,计算出每辆车的行车轨迹;

S2、行车轨迹数据存储;将行车轨迹以“时间-卡口-车牌”为行键,以“时 间-卡口-过车信息”为列,建立行车轨迹数据序列存储于Hbase数据库中;

S3、判断是否在当前卡口伴随;通过经过同一卡口的时间比较,判断在当 前卡口的伴随车辆;

S4、判断是否在其他卡口伴随;在同一卡口伴随后,继续基于各自当前的 行车轨迹计算是否还有其他的卡口存在伴随,当伴随的卡口数量达到指定的N 次,则判定两车符合伴随出行的条件,认定为伴随车。

作为优选的,所述步骤S1中和步骤S3中,通过MapReduce算法模型分别 对过车数据和行车轨迹数据进行聚合。

作为优选的,所述步骤S2中,行车轨迹与过车数据一一对应,每一条过车 数据都计算出一条行车轨迹数据,所述行车轨迹数据包括所有当前过车时间之 前的过车数据。

作为优选的,所述步骤S4中,N≧2。

作为优选的,所述步骤S1中,按过车数据中的车牌号码分组,以经过卡口 的时间由大到小排序来进行聚合。

作为优选的,所述步骤S3具体包括:

S301、依次提取步骤S2中的行车轨迹数据,按卡口编号分组、按过车时间 排序,对所有行车轨迹数据进行聚合,聚合后的行车轨迹均为行键“时间-卡口- 车牌”中卡口相同的数据,表示当前时间里车辆均经过同一卡口;

S302、将各个车辆经过该卡口的时间进行比较,只要经过时间在指定的± △T时间内,即认为两车在该卡口伴随行驶。

一种根据上述方法进行伴随车分析的系统,包括过车数据存储模块、行车 轨迹计算模块、行车轨迹存储模块、伴随车分析模块和伴随车结果解析模块;

所述过车数据存储模块用于管理原始过车数据;

所述行车轨迹计算模块用于计算车辆的行车轨迹;

所述行车轨迹数据存储模块用于计算出行车轨迹数据;

所述伴随车分析模块用于基于行车轨迹数据进行聚合、分析,并计算出伴 随车结果;

所述伴随车结果解析模块,用于将计算得到的伴随车结果解析并存储。

作为优选的,所述过车数据存储模块和行车轨迹数据存储模块采用列式数 据库Hbase完成存储。

作为优选的,所述行车轨迹计算模块和伴随车分析模块为大数据计算、分 析中心,通过MapReduce算法模型完成计算。

与现有技术相比,本发明的有益效果在于:本发明首先以天为单位,提取 所有车辆的过车数据。然后对所有的过车数据进行分析、挖掘,以车牌号码为 维度计算出每辆车的行车轨迹,利用Hbase列式数据库列可以无限扩展的特点, 将行车轨迹按车牌号为主键存储于Hbase中,再将所有车的行车轨迹按卡口聚 合后两两进行关联分析,计算出每辆车与之相关联的伴随车。本发明基于大数 据的分布式集群计算模式,避免了计算时服务器内存的限制,同时列式数据库 Hbase能很好的解决数据库字段数量的约束,在此基础上,本发明摒弃了以往基 于限定时间内的过车数据进行分析的方式,改为基于车辆全轨迹数据进行伴随 车分析的方法,该方法计算出的伴随车可有效的反映出每辆车在指定的日期里 的伴随车车牌号码、伴随经过的卡口、伴随时间等信息。

附图说明

图1为本发明实施例1中方法的流程框图;

图2为本发明实施例1中方法的具体流程示意图;

图3为本发明实施例2中系统的结构框图。

具体实施方式

下面结合附图和实施例对本发明所述的一种基于大数据车辆全轨迹碰撞的 伴随车分析方法及系统作进一步说明。

以下是本发明所述的的最佳实例,并不因此限定本发明的保护范围。

实施例1

图1示出了本发明所述的一种基于大数据车辆全轨迹碰撞的伴随车分析方 法,包括以下步骤:

S1、行车轨迹运算;按车牌号码分组、按过车时间排序,对每辆车的过车 数据进行聚合,计算出每辆车的行车轨迹;

S2、行车轨迹数据存储;将行车轨迹以“时间-卡口-车牌”为行键,以“时 间-卡口-过车信息”为列,建立行车轨迹数据序列存储于Hbase数据库中;

S3、判断是否在当前卡口伴随;通过经过同一卡口的时间比较,判断在当 前卡口的伴随车辆;

S4、判断是否在其他卡口伴随;在同一卡口伴随后,继续基于各自当前的 行车轨迹计算是否还有其他的卡口存在伴随,当伴随的卡口数量达到指定的N 次,则判定两车符合伴随出行的条件,认定为伴随车。

在本实施例中,图2示出了本发明所述方法的具体流程步骤,其中,更具 体的:

(1)过车数据聚合与行车轨迹计算;

过车数据是车辆经过卡口监控设备时,设备采集的车辆行驶信息。该步骤 主要是按过车数据中的车牌号码分组,以经过卡口的时间由大到小排序来进行 聚合。具体聚合的操作由MapReduce计算模型进行操作,MapReduce能充分利 用集群分布式计算的特点,按照指定的分组方式和大小排序逻辑对数据进行聚 合。

聚合之后,每一组过车数据都将是来自同一个车牌号码,并且是已经按照 时间由大到小完成排序。实际上,这已经是完整的行车轨迹,之后只需要再将 这些聚合后的数据按照要求的格式完成存储即可,格式如表一。

由于每辆车在行驶过程中,经过的卡口数据都是不确定的,且车辆每经过 一个卡口点位,该车当前时间的行车轨迹也是与之前或者之后经过其他卡口点 位时的行车轨迹存在差别。所以在进行行车轨迹计算时,每辆车每经过一个卡 口点位都将得到一条长度各异的行车轨迹。并且行车轨迹将与过车数据一一对 应,每一条过车数据都计算出一条这样的行车轨迹:包含所有经过时间小于等 于当前过车时间的过车数据,如表一。

表一

(2)行车轨迹聚合;

经(1)得到的行车轨迹是以“时间_卡口_车牌”为行健,与过车数据一一 对应,并且列族中保存着小于等于行健“时间_卡口_车牌”中时间的该车牌所 有行车轨迹。在该行车轨迹上再以行健“时间_卡口_车牌”中卡口分组,以行 健“时间_卡口_车牌”中时间由小到大排序进行聚合。

(3)比较相邻的行车轨迹;

经(2)聚合后的数据每一组都是行健“时间_卡口_车牌”中卡口相同的行 车轨迹,并且都是以行健“时间_卡口_车牌”中时间由小到大完成排序的。对 于每组的数据,首先依次将数据提取、加载到计算节点的缓存中。然后分析缓 存中的数据是否有行健“时间_卡口_车牌”中时间距当前行车轨迹行健“时间_ 卡口_车牌”中时间的差值超过伴随车定义的时间范围±△T的,如果有将其从 缓存中清除。

(4)判断是否在当前卡口伴随;

行车轨迹存入缓存之后,将该行车轨迹数据与缓存中的数据进行比较。因 为缓存中的数据都是距当前数据时间差在指定的±△T内的,同时经过(2)聚 合之后,处于同一计算组的数据的行健“时间_卡口_车牌”中的卡口编号又都 是相同的。

因此,只要缓存中的数据与当前数据不是属于同一车牌号码,则可判定两 车在当前卡口是伴随车。

(5)判断是否在其他卡口伴随;

通常情况下,两车在一个卡口伴随,并不能被判定为伴随车。所以在(4) 中发现缓存中有某一条数据所对应的车辆与当前车辆是伴随车关系时,需要继 续根据这两辆车的行车轨迹进行深度的二次碰撞。

假设在取出车辆A的行车轨迹进行对比分析时,车辆A和车辆B在卡口 K1被判定为伴随行驶,同时车辆A和车辆B的当前行车轨迹数据如表二所示, 分别为:

表二

现在需要将车辆A当前列族中的行车轨迹取出,依次与车辆B当前列族中 的行车轨迹进行比较。因为车辆A在经过卡口K1之前是经过卡口K2,所以首 先查找车辆B当前的行车轨迹是否有经过卡口K2,如果有则将各自经过卡口 K2的经过时刻进行比较,若时间差在±△T内则判断车辆A和车辆B在卡口 K2是伴随出行(即|T12-T22|<=△T)。

按照以上原理,依次将车辆A的行车轨迹数据逐个与车辆B的进行碰撞, 计算出在当前时间两车的伴随出行次数。只要次数达到系统设定的伴随次数时, 即认定两车是相互的伴随车。

实施例2

图3示出了根据实施例1中所述方法进行车辆伴随分析的系统,包括过车 数据存储模块、行车轨迹计算模块、行车估计存储模块、伴随车分析模块和伴 随车结果解析模块;

所述过车数据存储模块用于管理原始过车数据;

所述行车轨迹计算模块用于计算车辆的行车轨迹;

所述行车轨迹数据存储模块用于计算出行车轨迹数据;

所述伴随车分析模块用于基于行车轨迹数据进行聚合、分析,并计算出伴 随车结果;

所述伴随车结果解析模块,用于将计算得到的伴随车结果解析并存储。

作为优选的,所述过车数据存储模块和行车轨迹数据存储模块采用列式数 据库Hbase完成存储。

作为优选的,所述行车轨迹计算模块和伴随车分析模块为大数据计算、分 析中心,通过MapReduce算法模型完成计算。

综上所述,本发明首先以天为单位,提取所有车辆的过车数据。然后对所 有的过车数据进行分析、挖掘,以车牌号码为维度计算出每辆车的行车轨迹, 利用Hbase列式数据库列可以无限扩展的特点,将行车轨迹按车牌号为主键存 储于Hbase中,再将所有车的行车轨迹按卡口聚合后两两进行关联分析,计算 出每辆车与之相关联的伴随车。本发明基于大数据的分布式集群计算模式,避 免了计算时服务器内存的限制,同时列式数据库Hbase能很好的解决数据库字 段数量的约束,在此基础上,本发明摒弃了以往基于限定时间内的过车数据进 行分析的方式,改为基于车辆全轨迹数据进行伴随车分析的方法,该方法计算 出的伴随车可有效的反映出每辆车在指定的日期里的伴随车车牌号码、伴随经 过的卡口、伴随时间等信息。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域 的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和 改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附 权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号