首页> 中国专利> 一种涉车套牌发现方法、装置、设备和介质

一种涉车套牌发现方法、装置、设备和介质

摘要

本发明实施例公开了一种涉车疑似套牌车发现方法,结合实际应用,以海量的卡口车牌识别数据为基础,通过Hadoop大数据平台存储监控卡口的过车数据,采用基于Spark的计算框架,提高运行速率;为公安侦查办案以及打防控预警等工作提供相关的情报线索和数据支撑,并可以进一步开放通用的车辆分析预警功能支持不同警种的应用服务。本发明提供的一种涉车套牌发现方法、装置、设备和介质,通过数据分块和数据碰撞分析提升数据的吞吐量,加快了计算性能,在不牺牲套牌车辆结果的准确性的同时,也能提升性能。

著录项

  • 公开/公告号CN112289028A

    专利类型发明专利

  • 公开/公告日2021-01-29

    原文格式PDF

  • 申请/专利号CN202011166618.7

  • 发明设计人 吴志雄;甘俊奇;陈元春;

    申请日2020-10-27

  • 分类号G08G1/01(20060101);G08G1/017(20060101);

  • 代理机构35205 泉州市文华专利代理有限公司;

  • 代理人陈雪莹

  • 地址 362000 福建省泉州市丰泽区丰海路南威大厦2号楼16层

  • 入库时间 2023-06-19 09:43:16

说明书

技术领域

本发明涉及公路交通监控领域,特别涉及一种涉车套牌发现方法、装置、设备和介质。

背景技术

随着信息化的发展,业主对于平台应用也不断提出新的要求,功能需要高效、实时,通过大数据分析出更多可挖掘内容。为了适应这些不断增长的变化。并大量采集利用全国公安机关的网上警务综合信息,使用大数据平台能力对车辆、居住地、工作地属性构建数据关系网进行深度分布式的数据挖掘分析。除了分析车辆过车记录之外,车辆大数据积分预警系统使用大数据图像处理引擎,实时处理海量的卡口过车图片这种非结构化数据。系统可以给公安侦查办案以及打防控预警等工作提供相关的情报线索和数据支撑,并可以进一步开放通用的车辆分析预警功能支持不同警种的应用服务。

目前使用车辆作案的案件高发,往往犯罪人员为逃避公安人员的追捕会选择使用套牌车辆进行作案,给侦办案件带来了巨大挑战。全量过车轨迹数据,通过人工无法直观有效的观测出真实套牌车辆信息。使用传统软件或数据库进行轨迹碰撞分析,性能具有瓶颈无法使用过于复杂的算法,并且吞吐量有限无法在有效时间内得出准确的套牌车辆信息。

发明内容

本发明要解决的技术问题,在于提供一种涉车套牌发现方法、装置、设备和介质,通过数据分块和数据碰撞分析提升数据的吞吐量,加快了计算性能,在不牺牲套牌车辆结果的准确性的同时,也能提升性能。

第一方面,本发明提供了一种涉车套牌发现方法,包括:

对监控卡口摄像设备的过车图像进行一次快速识别,得到一次识别过车数据;然后再对所述过车图像进行二次精细识别,得到二次识别过车数据;所述一次识别过车数据与二次识别过车数据均包括车牌号、卡口编号和过车时间;

将所述一次识别过车数据和所述二次识别过车数据进行数据清洗,然后存入数据仓库;

定时从所述数据仓库中获取指定时间段的一次识别过车数据和二次识别过车数据,将车牌号识别相同且过车时间在设定时间阀值内的结果作为待分析数据,按设定条件存入多个数据区块;

根据套牌识别需求从一数据区块中获取待分析数据,根据卡口编号将所述待分析数据划分至指定区域,筛选分别在不同区域内且卡口编号对应的经纬度距离大于一设定距离的结果作为套牌车筛选结果。

进一步地,按设定条件存入多个数据区块,具体包括:

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第一数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第二数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别均相同且过车时间在设定时间阀值内的结果存入第三数据区块;

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第四数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第五数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第六数据区块。

进一步地,所述方法还包括:根据套牌车筛选结果在获取套牌车的所有过车记录,然后存储在分布式数据库Hive、elasticsearch和Gbase中,分别用于数据分析和Web查询。

进一步地,所述一次识别过车数据与二次识别过车数据还包括号牌类型,在“根据卡口编号将所述待分析数据划分为几个区域,筛选分别在不同区域内且卡口编号对应的经纬度距离大于一设定距离的结果作为套牌车筛选结果”之前,还包括,将号牌类型与车牌号不匹配的过车数据作为无效过车数据。

第二方面,本发明提供了一种涉车套牌发现装置,包括:数据识别模块、数据处理模块、数据区块模块以及套牌车筛选模块;

所述数据识别模块,用于对监控卡口摄像设备的过车图像进行一次快速识别,得到一次识别过车数据;然后再对所述过车图像进行二次精细识别,得到二次识别过车数据;所述一次识别过车数据与二次识别过车数据均包括车牌号、卡口编号和过车时间;

所述数据处理模块,用于将所述一次识别过车数据和所述二次识别过车数据进行数据清洗,然后存入数据仓库;

所述数据区块模块,用于定时从所述数据仓库中获取指定时间段的一次识别过车数据和二次识别过车数据,将车牌号识别相同且过车时间在设定时间阀值内的结果作为待分析数据,按设定条件存入多个数据区块;

所述套牌车筛选模块,用于根据套牌识别需求从一数据区块中获取待分析数据,根据卡口编号将所述待分析数据划分至指定个区域,筛选分别在不同区域内且卡口编号对应的经纬度距离大于一设定距离的结果作为套牌车筛选结果。

进一步地,所述数据区块模块中,按设定条件存入多个数据区块,具体包括:

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第一数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第二数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别均相同且过车时间在设定时间阀值内的结果存入第三数据区块;

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第四数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第五数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第六数据区块。

进一步地,还包括结果存储模块,用于根据套牌车筛选结果在获取套牌车的所有过车记录,然后存储在分布式数据库Hive、elasticsearch和Gbase中,分别用于数据分析和Web查询。

第三方面,本发明提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。

第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。

本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:

1、通过将过车数据按套牌车辆分析级别分为多个区块,减少数据在内存中的停留数量级,进一步通过监控卡口的点位时间经纬度等信息推断出套牌车辆信息,数据间的碰撞数据量通过分区模块的设计,减少了内存中的数据量,从而提升了数据的吞叶量,并加快了计算的性能;

2、通过将待分析数据按设定条件存入多个数据区块,满足不同级别的套牌识别需求,在满足套牌车辆分析结果的准确性的同时,也能提升性能,减少分析时间。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明实施例一中方法中的流程图;

图2为本发明实施例二中装置的结构示意图;

图3为本发明实施例三中电子设备的结构示意图;

图4为本发明实施例四中介质的结构示意图;

图5为本发明实施例五中实施流程示意图;

图6为本发明实施例五中数据处理示意图。

具体实施方式

实施例一

本实施例提供一种涉车套牌发现方法,如图1所示,包括:

对监控卡口摄像设备的过车图像进行一次快速识别,得到一次识别过车数据;然后再对所述过车图像进行二次精细识别,得到二次识别过车数据;所述一次识别过车数据与二次识别过车数据均包括车牌号、卡口编号和过车时间;通过两次不同精细程度的识别,在保证过程数据识别速度的同时,兼顾识别精准度;

将所述一次识别过车数据和所述二次识别过车数据进行数据清洗,然后存入数据仓库;

定时从所述数据仓库中获取指定时间段的一次识别过车数据和二次识别过车数据,将车牌号识别相同且过车时间在设定时间阀值内的结果作为待分析数据,按设定条件存入多个数据区块;

根据套牌识别需求从一数据区块中获取待分析数据,根据卡口编号将所述待分析数据划分至指定区域,筛选分别在不同区域内且卡口编号对应的经纬度距离大于一设定距离的结果作为套牌车筛选结果。

通过将待分析数据按设定条件存入多个数据区块,满足不同级别的套牌识别需求,在满足套牌车辆分析结果的准确性的同时,也能提升性能,减少分析时间。

在一种可能的实现方式中,按设定条件存入多个数据区块,具体包括:

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第一数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第二数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别均相同且过车时间在设定时间阀值内的结果存入第三数据区块;

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第四数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第五数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第六数据区块。

通过将过车数据按套牌车辆分析级别分为多个区块,减少数据在内存中的停留数量级,进一步通过监控卡口的点位时间经纬度等信息推断出套牌车辆信息,数据间的碰撞数据量通过分区模块的设计,减少了内存中的数据量,从而提升了数据的吞叶量,并加快了计算的性能。

在一种可能的实现方式中,所述方法还包括:根据套牌车筛选结果在获取套牌车的所有过车记录,然后存储在分布式数据库Hive、elasticsearch和Gbase中,分别用于数据分析和Web查询。

在一种可能的实现方式中,所述一次识别过车数据与二次识别过车数据还包括号牌类型,在“根据卡口编号将所述待分析数据划分为几个区域,筛选分别在不同区域内且卡口编号对应的经纬度距离大于一设定距离的结果作为套牌车筛选结果”之前,还包括,将号牌类型与车牌号不匹配的过车数据作为无效过车数据,快速减少由于识别错误导致的无效数据。

基于同一发明构思,本申请还提供了与实施例一中的方法对应的装置,详见实施例二。

实施例二

在本实施例中提供了一种涉车套牌发现装置,如图2所示,包括:数据识别模块、数据处理模块、数据区块模块以及套牌车筛选模块;

所述数据识别模块,用于对监控卡口摄像设备的过车图像进行一次快速识别,得到一次识别过车数据;然后再对所述过车图像进行二次精细识别,得到二次识别过车数据;所述一次识别过车数据与二次识别过车数据均包括车牌号、卡口编号和过车时间;

所述数据处理模块,用于将所述一次识别过车数据和所述二次识别过车数据进行数据清洗,然后存入数据仓库;

所述数据区块模块,用于定时从所述数据仓库中获取指定时间段的一次识别过车数据和二次识别过车数据,将车牌号识别相同且过车时间在设定时间阀值内的结果作为待分析数据,按设定条件存入多个数据区块;

所述套牌车筛选模块,用于根据套牌识别需求从一数据区块中获取待分析数据,根据卡口编号将所述待分析数据划分至指定个区域,筛选分别在不同区域内且卡口编号对应的经纬度距离大于一设定距离的结果作为套牌车筛选结果。

在一种可能的实现方式中,所述数据区块模块中,按设定条件存入多个数据区块,具体包括:

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第一数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内的结果存入第二数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别均相同且过车时间在设定时间阀值内的结果存入第三数据区块;

将一次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第四数据区块;

将二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第五数据区块;

将一次识别过车数据与二次识别过车数据中车牌号识别相同且过车时间在设定时间阀值内且有多条过车记录的结果存入第六数据区块。

在一种可能的实现方式中,还包括结果存储模块,用于根据套牌车筛选结果在获取套牌车的所有过车记录,然后存储在分布式数据库Hive、elasticsearch和Gbase中,分别用于数据分析和Web查询。

由于本发明实施例二所介绍的装置,为实施本发明实施例一的方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。

基于同一发明构思,本申请提供了实施例一对应的电子设备实施例,详见实施例三。

实施例三

本实施例提供了一种电子设备,如图3所示,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,可以实现实施例一中任一实施方式。

由于本实施例所介绍的电子设备为实施本申请实施例一中方法所采用的设备,故而基于本申请实施例一中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中的方法所采用的设备,都属于本申请所欲保护的范围。

基于同一发明构思,本申请提供了实施例一对应的存储介质,详见实施例四。

实施例四

本实施例提供一种计算机可读存储介质,如图4所示,其上存储有计算机程序,该计算机程序被处理器执行时,可以实现实施例一中任一实施方式。

实施例五

一应用于公安领域的具体实际例如下:

模拟业务场景:利用嫌疑犯作案踩点多采用套牌车辆进行,通过本实施例方法可推测疑似的套牌车辆,为警方提供套牌车辆作案的嫌疑进行排查的方向。

模块1、前端设备采集数据,数据接入并经过数据清洗将非结构化数据转为结构化数据;

模块2、建立Hive数据仓库,将历史数据分布式存储;

模块3、设计车辆疑似套牌算法,利用Spark分布式计算获取有关系的车辆数据。

模块4、Web端的涉车大数据平台展示,提供多种研判工具和车辆常套牌车查询。

如图5所示,本实施例提供了涉车套牌发现的实施流程,具体包括以下几个步骤:

步骤1、将路面卡口摄像头拍摄的数据又非结构化的图像视频数据识别转成车辆外形特征、车牌号、过车时间、速度等结构化的数据发送到kafka中的指定topic中;先进行一次快速识别,得到一次识别过车数据;然后再对所述过车图像进行二次精细识别,得到二次识别过车数据;

步骤2、根据约定的kafka数据接口格式,将kafka数据同步到离线分析的集群中,过滤未识别和为空的字段,以及同卡口连续拍摄产生的重复数据,通过数据清洗后的数据存入hive中并创建数据仓库;

步骤3、通过Azkaban创建定时任务,每天的凌晨会入库清洗一次昨天的历史过车数据,将每天的抓拍过车记录划分为几个区域(比如,可以按城市的市辖区作为划分标准),按相近时间段同时在不同区域出现的车辆并且车牌又识别相同并且区域间的经纬度相差有很大的距离,可判断为疑似套牌车辆;

套牌车辆的判断等级需要进行划分,原因避免因识别错误造成的误判的可能性,可根据web端页面选择等级进行自行划分查询。

①等级1:一次识别车牌字段相同

②等级2:二次识别车牌字段相同

③等级3:一二次识别车牌字段均相同

④等级4:一次识别车牌字段相同并且有多条过车记录被抓拍

⑤等级5:二次识别车牌字段相同并且有多条过车记录被抓拍

⑥等级6:一二次识别车牌字段相同并且有多条过车记录被抓拍

有多条过车记录被抓拍可以通过判断两识别车牌字段相同的车辆,在同一区域的一定时间段内均有大于一条的过车记录,以排除由于某单一卡口识别错误造成两不同车辆的车牌号识别为相同的情况。从等级1到等级6,筛选条件逐渐严格,符合条件的筛选结果也会越来越少,可以根据套牌车辆筛选要求选择某一等级的数据作为分析数据进行处理。

步骤4、将计算出的疑似套牌车辆存储在分布式数据库中,这里选择的是elasticsearch与Gbase和Hive,数据同时存储在这三个数据库中,Hive数据库用于数据分析,elasticsearch与Gbase数据库用于Web查询,其中elasticsearch数据库能提供更为快速的查询,而Gbase数据库则能提供长时间的更为稳定地查询;

本实施例的疑似套牌车辆数据包括如下字段:

套牌异常类型:

异地出现

车辆外观品牌不正确

来源标识:

离线

实时

厂商标识

步骤5、将数据库中的结果表通过Web的形式展示给用户,并且提供多种自定义的查询功能和阈值可配置的功能。

本实施例提供了分布式的数据存储,将庞大的全量过车轨迹数据,按天维度分区将数据存储在多台机器的分布式存储节点上,庞大的数据得到了分流存储,使得套牌车辆结果可以基于更大的数据量进行分析得到更准确的结果,如图6所示,将过车数据按套牌车辆级别分为多个区块,为了减少数据在内存中的停留数量级,按区块的划分级别分别从,空间纬度距离、时间区间、区域点位空间、号牌类型维度分析出套牌车辆的行为轨迹信息,进一步通过点位时间经纬度等信息推断出套牌车辆信息,数据间的碰撞数据量通过分区模块的设计,减少了内存中shuffer的数据量,从而提升了数据的吞量,并加快了计算的性能,从而达到不牺牲套牌车辆结果的准确性,也能提升性能的效果。

虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号