首页> 中国专利> 一种非法省际客运经营车辆违法行为智能检测方法

一种非法省际客运经营车辆违法行为智能检测方法

摘要

本发明提供一种非法省际客运经营车辆违法行为智能检测方法,包括步骤一,数据收集与预处理;步骤二,对预处理的数据进行特征提取与处理;步骤三,构建梯度提升树模型,进行模型训练;步骤四,模型验证与优化;步骤五,非法省际客运经营车辆违法行为识别;步骤六,违法行为证据收集与处理。该方法实现对非法省际客运经营车辆违法行为的自动识别和预警。

著录项

  • 公开/公告号CN116935625A

    专利类型发明专利

  • 公开/公告日2023-10-24

    原文格式PDF

  • 申请/专利权人 中路高科交通科技集团有限公司;

    申请/专利号CN202310650657.1

  • 申请日2023-06-05

  • 分类号G08G1/01(2006.01);G06F18/211(2023.01);G06F18/213(2023.01);G06F18/214(2023.01);G06F18/21(2023.01);G06F18/243(2023.01);G06F18/27(2023.01);G06F16/2458(2019.01);G06Q50/26(2012.01);

  • 代理机构北京中和立达知识产权代理有限公司 11756;

  • 代理人熊敬

  • 地址 100088 北京市海淀区西土城路8号

  • 入库时间 2024-04-18 19:48:15

说明书

技术领域

本发明属于交通管理和大数据分析领域,尤其是关于基于ETC数据和历史行政处罚案件信息的非法省际客运经营车辆违法行为智能检测方法属于公路基础设施数字化建模领域,具体涉及一种非法省际客运经营车辆违法行为智能检测方法。

背景技术

现有的非法省际客运经营车辆(未取得道路客运经营许可,擅自从事道路客运经营)违法行为识别技术主要依赖于人工巡查和监控视频抓拍。这些方法存在一定的局限性,如人力成本高、准确率受限、实时性不足等。此外,现有技术对于大规模的车辆数据处理和分析能力有限,难以满足对非法省际客运经营车辆违法行为的实时监控和预防需求。

针对现有技术的不足,本发明提出了一种非法省际客运经营车辆违法行为智能检测方法。该方法基于数据挖掘和机器学习技术的非法省际客运经营车辆违法行为识别方法。该方法利用丰富的ETC通行数据、历史行政处罚案件信息等数据源,通过特征提取与处理、模型训练与验证等步骤,实现对非法省际客运经营车辆违法行为的自动识别和预警。

发明内容

本发明提供了提出了一种非法省际客运经营车辆违法行为智能检测方法。该方法利用丰富的ETC通行数据、历史行政处罚案件信息等数据源,通过特征提取与处理、模型训练与验证等步骤,实现对非法省际客运经营车辆违法行为的自动识别和预警。

为了解决上述技术问题,本发明提出一种非法省际客运经营车辆违法行为智能检测方法,该方法包括以下步骤:

步骤一,数据收集与预处理;采集数据,对采集到的数据进行预处理;

步骤二,对预处理的数据进行特征提取与处理;

步骤三,构建梯度提升树模型,进行模型训练;

步骤四,模型验证与优化;

其中,应用k折交叉验证方法评估梯度提升树机器学习模型的性能;使用网格搜索方法对梯度提升树模型的超参数进行调优,找到最佳参数组合;

步骤五,非法省际客运经营车辆违法行为识别;

其中,使用训练好的梯度提升树模型对新的车辆特征向量进行预测,得到预测结果;设定一个阈值,当预测结果超过阈值时,判断该车辆存在省际客运黑车违法行为;

步骤六,违法行为证据收集与处理;

其中,对于该车的通行数据和监控视频进行抓拍和数据收集;当发现存在违法行为时,通知交通管理部门或车辆所属公司,采取措施;对违法行为进行统计分析。

可选地,所述步骤一,包括,

1.1 从各个数据源定期或实时采集相关数据,包括历史行政处罚案件信息、ETC通行数据和车辆信息,所述ETC通行数据包括日期时间、高速入口、高速出口、高速门架经纬度;

1.2 对收集到的数据进行预处理,包括数据清洗、数据整合和缺失值处理。

可选地,所述步骤二,包括,

2.1 从预处理后的数据中提取关键特征,分为以下几类:

a. 行驶轨迹特征:根据高速门架经纬度数据,计算车辆在高速公路上的行驶轨迹,并进行聚类分析;

b. 行驶时间特征:计算每辆车在高速公路上的行驶时间及特定时间段内的行驶时间占比;

c. 行驶速度特征:计算车辆的平均速度、最高速度、最低速度以及速度分布的偏度和峰度;

d. 高速出入口信息特征:分析每辆车的高速入口和出口数据,统计频率、转换频率及时间间隔;

e. 历史违法行为特征:统计每辆车的历史违法行为次数、违法类型分布以及违法行为发生的时间和地点;

f. 时间与空间特征:提取车辆在不同时间段和地理位置的通行特征;

2.2 特征权重设定,使用LASSO回归作为特征选择算法,所述LASSO回归是一种线性回归的扩展,在损失函数中加入了正则化项,使得所述LASSO回归在拟合过程中能够进行特征选择;通过对LASSO回归的正则化参数进行调优,找到一个合适的参数值,使得模型只保留对目标变量有较大影响力的特征,从而实现特征筛选;

损失函数如下:

其中,

2.3 确定目标,在特征选择过程中,目标是筛选出对非法省际客运经营车辆违法行为识别最具有影响力的特征;使用已知的非法省际客运经营车辆违法行为数据作为训练数据,所述违法行为数据包括特征和对应的标签;对于LASSO回归,目标变量设定一个二分类变量,0表示非省际非法客运经营车辆违法行为,1表示非法省际客运经营车辆违法行为,特征对应步骤二中提取的特征;

2.4 使用LASSO回归进行特征选择后,得到的模型参数,即回归系数,作为特征权重;所述特征权重反映了各个特征在非法省际客运经营车辆违法行为识别中的相对重要性;所述特征权重根据特征在LASSO回归中的回归系数进行分配;对于具有较大回归系数的特征,认为其对非法省际客运经营车辆违法行为识别具有较大的影响力。

可选地,所述步骤三,包括,

3.1 数据准备:使用已知的非法省际客运经营车辆违法行为数据作为训练集,将筛选后的特征向量与对应的标签,是否为非法省际客运经营车辆违法行为,进行匹配;将数据集分为训练集和验证集,以便在训练过程中评估模型性能;

3.2 模型初始化:选择梯度提升树模型作为分类器,并根据问题特点设定初始参数,其中,所述参数包括树的数量、树的最大深度、学习率;

3.3 特征权重:根据步骤二中得到的特征权重,在梯度提升树模型训练过程中,对各个特征进行加权处理;

3.4 模型训练:使用训练集对梯度提升树模型进行训练;在训练过程中,监测模型在验证集上的性能,并记录每次迭代的训练误差和验证误差。

可选地,所述步骤四,包括,

4.1 应用k折交叉验证:使用k折交叉验证方法评估梯度提升树模型的性能;k折交叉验证允许在不牺牲数据集规模的情况下,对模型进行全面评估,从而提高非法省际客运经营车辆识别准确率;

4.1.1将已知的非法省际客运经营车辆违法行为数据划分为k个子集;

4.1.2 在k次迭代中,每次选择一个子集作为验证集,其余子集作为训练集,使用训练集对梯度提升树模型进行训练;

4.1.3 在验证集上评估模型性能,记录准确率、召回率、F1分数等性能指标;重复这个过程k次,使得每个子集都被用作验证集;

4.1.4 计算k次迭代的平均性能指标,作为梯度提升树模型的评估结果;

4.2 应用网格搜索:使用网格搜索方法对梯度提升树模型的超参数进行调优;网格搜索运行系统地遍历所有可能的超参数组合,找到最佳参数组合,从而提高模型的预测精度和稳定性;

4.2.1 确定梯度提升树模型的超参数搜索空间;设置一系列可能的取值范围,以便在网格搜索过程中遍历这些参数组合;

4.2.2 对于每一个超参数组合,利用步骤4.1中的k折交叉验证评估模型性能;计算k次迭代的平均性能指标,作为当前超参数组合的评估结果;

4.2.3遍历所有超参数组合,找到性能最优的超参数组合;

4.2.4使用最优超参数组合,利用整个已知的非法省际客运经营车辆违法行为数据集对梯度提升树模型进行训练;使模型具有更高的准确率和泛化能力。

可选地,所述步骤五,包括,

5.1 模型预测:使用训练好的梯度提升树模型对新的车辆特征向量进行预测,得到预测结果;所述预测结果为每个样本属于非法省际客运经营车辆违法行为的概率;

5.2 阈值设定:设定一个阈值,当预测结果超过阈值时,判断该车辆存在非法省际客运经营车辆违法行为;阈值的设定根据模型在训练集和验证集上的性能表现以及对非法省际客运经营车辆违法行为的实际需求进行调整。

可选地,所述步骤六,包括,

6.1 证据收集:当判断出车辆存在非法省际客运经营违法行为后,基于该车的ETC通行数据和周边监控视频,进行违法行为的抓拍和证据收集;

6.2 证据整理:提取该车的ETC出入口数据、ETC门架通行数据,以及历史行政处罚案件信息等,作为非法省际客运经营违法行为的证据材料;对所述证据进行整理和归类,为后续的处罚和分析提供便利;

6.3 违法行为通报:当发现车辆存在非法省际客运经营违法行为时,立即通知交通管理部门或车辆所属公司,采取相应措施;

6.4 统计分析:对违法行为进行统计分析,根据统计分析结果,优化交通管理策略。

可选地,其中,所述步骤三中的所述梯度提升树模型可以替代为随机森林、逻辑回归、支持向量机、深度学习中的一种或几种的组合。

通过以上方法,本发明可以有如下技术效果:

(1)准确率提升:本发明利用LASSO回归进行特征选择,筛选出对非法省际客运经营车辆违法行为识别具有较大影响力的特征,提高模型的预测准确性。同时,利用梯度提升树(GBT)模型进行分类,进一步提高非法省际客运经营车辆违法行为的识别准确率。

(2)实时性增强:通过对各个数据源的实时采集与处理,本发明能够实时识别出潜在的非法省际客运经营车辆违法行为,为交通管理部门提供实时预警信息,提高对非法省际客运经营车辆违法行为的打击力度。

(3)降低人力成本:本发明实现了对非法省际客运经营车辆违法行为的自动识别,减少了人工巡查的需求,降低了人力成本。

(4)提供决策支持:本发明对违法行为进行统计分析,包括违法行为的类型、时间分布、地理位置分布等,为交通管理部门提供决策支持,有助于优化交通管理策略,提高治理效果。

(5)可扩展性:本发明采用的数据挖掘和机器学习技术具有很好的可扩展性,可以根据需求对新的数据源和特征进行整合,进一步提高非法省际客运经营车辆违法行为识别的效果。

附图说明

为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。

图1是本发明的一种非法省际客运经营车辆违法行为智能检测方法的整体流程图;

图2是本发明的步骤二中特征提取与处理过程的流程图;

图3是本发明的机器学习模型的流程图;

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照参考附图来全面地描述本发明的示例性实施例。虽然各示例性实施例能够以多种具体的方式实施,但不应理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例是为了使本发明的内容更加完整,更加便于将发明构思全面地传达给本领域的技术人员。

在符合本发明的技术构思的前提下,在某个特定的实施例中描述的结构、性能、效果或者其他特征可以任何合适的方式结合到一个或更多其他的实施例中。

在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。

附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等。在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。

附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任何一个或多个的所有组合。

本发明提供一种非法省际客运经营车辆(未取得道路客运经营许可,擅自从事道路客运经营)违法行为智能检测方法,如图1-2所示,包括以下步骤:

步骤一,数据收集与预处理

1.1 从各个数据源定期或实时采集相关数据,包括历史行政处罚案件信息、ETC通行数据(包括日期时间、高速入口、高速出口、高速门架经纬度等)和车辆信息等。

1.2 对收集到的数据进行预处理,包括数据清洗、数据整合和缺失值处理,以便后续分析。

步骤二,特征提取与处理

2.1 从预处理后的数据中提取关键特征,分为以下几类:

a. 行驶轨迹特征:根据高速门架经纬度数据,计算车辆在高速公路上的行驶轨迹,并进行聚类分析。

b. 行驶时间特征:计算每辆车在高速公路上的行驶时间及特定时间段内的行驶时间占比。

c. 行驶速度特征:计算车辆的平均速度、最高速度、最低速度以及速度分布的偏度和峰度。

d. 高速出入口信息特征:分析每辆车的高速入口和出口数据,统计频率、转换频率及时间间隔。

e. 历史违法行为特征:统计每辆车的历史违法行为次数、违法类型分布以及违法行为发生的时间和地点。

f. 时间与空间特征:提取车辆在不同时间段和地理位置的通行特征。

2.2 特征权重设定,使用LASSO回归(Least Absolute Shrinkage and SelectionOperator)作为特征选择算法。LASSO回归是一种线性回归的扩展,LASSO回归在损失函数中加入了正则化项(L1正则化),这使得LASSO回归在拟合过程中能够进行特征选择。通过对LASSO回归的正则化参数进行调优,找到一个合适的参数值,使得模型只保留对目标变量有较大影响力的特征,从而实现特征筛选。

损失函数如下:

2.3 确定目标,在特征选择过程中,我们的目标是筛选出对非法省际客运经营车辆违法行为识别最具有影响力的特征。使用已知的非法省际客运经营车辆违法行为数据(包括特征和对应的标签)作为训练数据。对于LASSO回归,目标变量设定一个二分类变量(0表示非省际非法客运经营车辆违法行为,1表示非法省际客运经营车辆违法行为),特征对应步骤二中提取的特征。

2.4 使用LASSO回归进行特征选择后,得到的模型参数(回归系数)作为特征权重。这些权重反映了各个特征在非法省际客运经营车辆违法行为识别中的相对重要性。特征权重可以根据特征在LASSO回归中的回归系数进行分配。对于具有较大回归系数的特征,认为其对非法省际客运经营车辆违法行为识别具有较大的影响力。

如图3所示,机器学习模型流程具体为:

步骤三,训练梯度提升树(GBT)模型

3.1 数据准备:使用已知的非法省际客运经营车辆违法行为数据作为训练集,将筛选后的特征向量与对应的标签(是否为非法省际客运经营车辆违法行为)进行匹配。将数据集分为训练集和验证集,以便在训练过程中评估模型性能。

3.2 模型初始化:选择GBT作为分类器,并根据问题特点设定初始参数。这些参数包括树的数量、树的最大深度、学习率等。

3.3 特征权重:根据步骤二中得到的特征权重,在GBT模型训练过程中,对各个特征进行加权处理。这有助于提高模型对重要特征的敏感度,从而提高预测准确性。

3.4 模型训练:使用训练集对GBT模型进行训练。在训练过程中,监测模型在验证集上的性能,并记录每次迭代的训练误差和验证误差。

其中,步骤三中的梯度提升树模型还可以替代为随机森林、逻辑回归、支持向量机、深度学习中的一种或几种的组合。选用其他模型,也可以达到对非法省际客运经营车辆违法行为智能检测的效果。

步骤四,模型验证与优化

4.1 应用k折交叉验证:使用k折交叉验证方法评估GBT模型的性能。k折交叉验证允许在不牺牲数据集规模的情况下,对模型进行全面评估,从而提高未取得道路客运经营许可,擅自从事道路客运经营车辆识别的准确率。

4.1.1将已知的非法省际客运经营车辆违法行为数据(包括特征和对应的标签)划分为k个子集。

4.1.2 在k次迭代中,每次选择一个子集作为验证集,其余子集作为训练集。使用训练集对GBT模型进行训练。

4.1.3 在验证集上评估模型性能,记录准确率、召回率、F1分数等性能指标。重复这个过程k次,使得每个子集都被用作验证集。

4.1.4 计算k次迭代的平均性能指标,作为GBT模型的评估结果。

4.2 应用网格搜索:使用网格搜索方法对GBT模型的超参数进行调优。网格搜索可以帮助系统地遍历所有可能的超参数组合,找到最佳参数组合,从而提高模型的预测精度和稳定性。

4.2.1 确定GBT模型的超参数搜索空间,如树的数量、树的深度、学习率等。设置一系列可能的取值范围,以便在网格搜索过程中遍历这些参数组合。

4.2.2 对于每一个超参数组合,利用步骤4.1中的k折交叉验证评估模型性能。计算k次迭代的平均性能指标,作为当前超参数组合的评估结果。

4.2.3遍历所有超参数组合,找到性能最优的超参数组合。

4.2.4使用最优超参数组合,利用整个已知的非法省际客运经营车辆违法行为数据集对GBT模型进行训练。这将使模型具有更高的准确率和泛化能力。

步骤五,非法省际客运经营车辆违法行为识别

5.1 模型预测:使用训练好的GBT模型对新的车辆特征向量进行预测,得到预测结果。预测结果为每个样本属于非法省际客运经营车辆违法行为的概率。

5.2 阈值设定:设定一个阈值,当预测结果超过阈值时,判断该车辆存在非法省际客运经营车辆违法行为。阈值的设定可以根据模型在训练集和验证集上的性能表现以及对非法省际客运经营车辆违法行为的实际需求进行调整。

步骤六,违法行为证据收集与处理

6.1 证据收集:当判断出车辆存在非法省际客运经营违法行为后,基于该车的ETC通行数据和周边监控视频,进行违法行为的抓拍和证据收集。

6.2 证据整理:提取该车的ETC出入口数据、ETC门架通行数据,以及历史行政处罚案件信息等,作为非法省际客运经营违法行为的证据材料。对这些证据进行整理和归类,为后续的处罚和分析提供便利。

6.3 违法行为通报:当发现车辆存在非法省际客运经营违法行为时,立即通知交通管理部门或车辆所属公司,采取相应措施如罚款等。

6.4 统计分析:对违法行为进行统计分析,包括违法行为的类型、时间分布、地理位置分布等,为交通管理部门提供决策支持。根据统计分析结果,优化交通管理策略,如加强某些地区或时段的巡查力度,提高对非法省际客运经营违法行为的打击力度。

综上所述,通过本发明的一种非法省际客运经营车辆违法行为智能检测方法,可以达到如下有益效果:

(1)准确率提升:本发明利用LASSO回归进行特征选择,筛选出对非法省际客运经营车辆违法行为识别具有较大影响力的特征,提高模型的预测准确性。同时,利用梯度提升树(GBT)模型进行分类,进一步提高非法省际客运经营车辆违法行为的识别准确率。

(2)实时性增强:通过对各个数据源的实时采集与处理,本发明能够实时识别出潜在的非法省际客运经营车辆违法行为,为交通管理部门提供实时预警信息,提高对非法省际客运经营车辆违法行为的打击力度。

(3)降低人力成本:本发明实现了对非法省际客运经营车辆违法行为的自动识别,减少了人工巡查的需求,降低了人力成本。

(4)提供决策支持:本发明对违法行为进行统计分析,包括违法行为的类型、时间分布、地理位置分布等,为交通管理部门提供决策支持,有助于优化交通管理策略,提高治理效果。

(5)可扩展性:本发明采用的数据挖掘和机器学习技术具有很好的可扩展性,可以根据需求对新的数据源和特征进行整合,进一步提高非法省际客运经营车辆违法行为识别的效果。

以上说明书及附图中如此叙述仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体加以理解,以上所述仅为本发明示意性的具体实施方式,并非用以限定本发明的范围。任何本领域的技术人员,在不脱离本发明的构思和原则的前提下所作的等同变化、修改与结合,均应属于本发明保护的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号