首页> 中国专利> 一种基于广义极值T分布偏差的非周期拥堵检测方法

一种基于广义极值T分布偏差的非周期拥堵检测方法

摘要

本发明公开了一种基于广义极值T分布偏差的非周期拥堵检测方法,包括1、获取路网速度数据,并进行数据预处理;2、从历史数据中选择与当前时段具有相同时间特征的样本,并与当前速度观测值合并作为检测算法的输入数据集;3、利用基于广义极值T分布偏差的算法检测数据集中的异常值;4、如果当前速度观测值为异常值,则认为当前时段发生了非周期拥堵;5、以交通日志来验证检测结果,并通过性能指标来优化算法参数使得算法性能达到最优。本发明以数据为驱动,运用异常值检测来识别城市路网中非周期拥堵的交通状态,具有较高的精度和可靠性。

著录项

  • 公开/公告号CN112509326A

    专利类型发明专利

  • 公开/公告日2021-03-16

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN202011400595.1

  • 发明设计人 马晓磊;栾森;杜博文;

    申请日2020-12-02

  • 分类号G08G1/01(20060101);G08G1/052(20060101);

  • 代理机构11465 北京慕达星云知识产权代理事务所(特殊普通合伙);

  • 代理人符继超

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-06-19 10:14:56

说明书

技术领域

本发明涉及交通处理技术领域,更具体的说是涉及一种基于广义极值T分布偏差的非周期拥堵检测方法。

背景技术

拥堵一直是交通运行管理中备受关注的问题。根据拥堵成因,路网中的拥堵状态可以分为两种:周期拥堵和非周期拥堵。周期拥堵一般发生在固定的地点和时间范围,例如早晚高峰通勤期间或者道路瓶颈点,具有可预判性。非周期拥堵通常由一些特殊城市事件引起的,例如交通事故、车辆故障、恶劣天气、大型活动、道路施工等,没有规律可循且不可预测,极大地影响着交通稳定运行的可靠性。因此,及时有效的非周期拥堵检测是非常重要的,以便交通管理人员可以实施管理策略,以减弱它带来的负面效应。

过去的几十年里,在提高非周期拥堵检测性能方面,相关研究人员已经做出很大的努力,包括部署了许多新的检测/传感器和发展了各种检测算法。但是,大多数检测算法是为高速公路开发的,只有少数适用于城市路网。原因之一在于城市路网的复杂的交通状态和自身的异质性,原因之二在于周期拥堵与非周期拥堵具有相似的外部特征,难以区分。为了解决上述问题,一些学者开始采用数据驱动的理念,把非周期拥堵检测问题转换为判断当前交通数据是否异常于历史同期的交通数据。

现有的被广泛应用的异常检测算法有标准偏差法、中值偏差法和四分位偏差法。它们从历史数据中获得速度值置信,但是,历史同期的数据中已经存在的异常值会严重干扰对当前值的判断。无论是在高速公路抑或城市路网中,从检测率、误警率和平均检测用时三个性能指标来看,当前的非周期拥堵检测算法在实际应用中的性能仍然有待提高。

因此,如何提高城市路网非周期拥堵检测算法性能是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了一种基于广义极值T分布偏差的非周期拥堵检测方法,相比于标准偏差法、中值偏差法和四分位偏差法,本发明通过迭代检测的方式识别数据集中的所有异常,提高了检测准确率,而且利用概率分布增加了对数据变化的灵敏度,缩短了检测所需时间,对于交通管理者的及时响应具有重要意义。

为了实现上述目的,本发明采用如下技术方案:

一种基于广义极值T分布偏差的非周期拥堵检测方法,包括如下步骤:

步骤1:获取速度数据并进行预处理,所述速度数据包括历史速度数据和当前速度数据;所述预处理包括计算平均速度和对所述平均速度进行两个维度的时间特征索引,获得历史速度样本和当前速度样本;所述历史速度数据为过去n周的速度数据,预处理后的所述当前速度样本表示为

步骤2:数据准备,从过去n周的历史速度样本中选取与当前时段的所述当前速度样本具有相同所述时间特征索引的所述历史速度样本

步骤3:构建基于广义极值T分布偏差的检测算法对数据集X进行检测以识别非周期拥堵,循环执行设定的迭代次数k次,获得检测结果序列;

步骤4:对所述检测结果序列进行判断,在所述检测结果序列中筛选出异常值序列,以所述异常值序列中最后一个异常值为

步骤5:在基于广义极值T分布偏差的检测算法中,对分位点系数c和最初始的所述历史速度数据的长度n逐个进行优化,获得优化检测算法,采用所述优化检测算法对所述数据集X进行检测;其中,选择不同的分位点系数c和最初始所述数据集X的长度n进行非周期拥堵检测,选取性能综合指标PI最小值对应的分位点系数c和长度n作为最优参数代入检测算法中获得最优检测算法。

优选的,所述步骤1中进行所述预处理的具体过程为:

步骤11:计算平均值,以设定的时间间隔为时间单位计算每个路段的历史速度数据的平均速度,获得平均速度样本,目的是为了减弱由随机因素(如信号灯控制,临时路边停车)引起的速度数据噪声;

步骤12:时间特征索引,对获得的所述平均速度样本进行两个维度的时间特征索引,其一是所述时间索引,令所述时间间隔为一个时间周期,一天可以划分为A个时间周期,则T的取值范围为[1,2,,,A];其二是所述星期索引,一星期分为7天,则D的取值范围为[1,2,,,7]。例如:时间间隔为15min,时间周期为96,则第8周第1天中0点25分的数据被表示为

优选的,所述步骤3具体实现过程为:

步骤31:计算T分布的分位数q,公式如下:

其中,qt(·)是T分布分位数的计算函数;df是自由度;m为当前数据集X中的样本个数;p为分位点;c表示分位点系数,是个可优化的参数;

步骤32:计算所述分位数q对应的T分布统计值s,公式如下:

步骤33:计算当前时段的速度阈值τ

其中,M(·)为取中值函数;MAD(X)则为所述数据集X对应的中值偏差;

步骤34:令所述数据集X中的最小值为X

步骤35:为了充分识别所述数据集X中其它可能潜在的异常值,先把X

优选的,所述步骤5中采用最大化检测率DR、最小化误检率FAR和检测所需用时MTTD,最小化性能综合指标PI来确定所述分位点系数c和所述历史速度数据的长度n的最优值,优化公式如公式(4)所示:

其中,误检数=检测到的真正非周期拥堵个数-真正发生的非周期拥堵个数;所述检测算法执行次数为所述迭代次数k;所述非周期拥堵被检测到的时间为检测算法执行并检测到非周期拥堵的时间;所述非周期拥堵真正发生的时间从交通事件日志数据中获取。

优选的,所述步骤1中所述速度数据是指机动车辆在城市路网中的行驶速度。

优选的,计算平均值过程中所述时间间隔为15min,所述时间周期A=96。

优选的,步骤35中所述迭代次数k取值为接近(n+1)/3的整数,其中n表示所述历史速度数据的长度,即所述历史速度数据的周数,即认为在整个数据集中,通常能够表征非周期拥堵的占比不会超过1/3。

经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于广义极值T分布偏差的非周期拥堵检测方法,首先收集路段行程速度的时间序列;其次对速度序列进行时间特征索引,并抽取历史数据中具有相同时间特征的样本;然后从历史样本中学习交通模式,并通过比较当前速度值与交通模式判别非周期性拥堵;最后通过交叉验证,确定算法最优参数。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的方法流程示意图;

图2附图为本发明提供的不同分位点系数值下的算法性能示意图;

图3附图为本发明提供的非周期检测结果示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种基于广义极值T分布偏差的非周期拥堵检测方法,包括如下步骤:

S1:获取速度数据并进行预处理;交通速度数据来源于驾车出行中的导航记录,结合城市路网拓扑结构,获得每个路段对应的行程速度即获得速度数据,速度数据包括历史速度数据和当前速度数据,采用以下两个流程对速度数据进行预处理,:

S11:计算平均值,为了减弱由随机因素(如信号灯控制,临时路边停车)引起的速度数据噪声,以15min为时间单位计算每个路段的历史速度数据的平均速度,那么每条路段每天会有96个平均速度样本值;

S12:时间特征索引,对获得的平均速度样本进行两个维度的时间特征索引,其一是时间索引,一天中以15min为一个时间周期,一天划分为96个时间周期,其时间索引标记取值范围为[1,96],用T进行标记表示;其二是星期索引,一个星期分为7天,其星期索引标记取值范围为[1,7],用D进行标记表示;当前速度数据索引表示为

S2:数据准备,从过去n周的历史速度数据的速度样本中选取与当前时段具有相同时间特征索引的速度数据

S3:构建基于广义极值T分布偏差的检测算法对数据集X进行检测以识别非周期拥堵,循环执行迭代次数k次,获得检测结果序列;

S31:计算T分布的分位数q,公式如下:

其中,qt(·)是T分布分位数的计算函数;df是自由度;m为当前数据集X中的样本个数;p为分位点;c表示分位点系数;

S32:计算分位数q对应的T分布统计值s,公式如下:

S33:计算当前时段的速度阈值τ

其中,M(·)为取中值函数;MAD(X)则为数据集X对应的中值偏差;

S34:令数据集X中的最小值为X

S35:X

S4:非周期拥堵的判断;对检测结果序列进行判断,在检测结果序列中筛选出异常值序列,以异常值序列中最后一个异常值为

S5:在基于广义极值T分布偏差的检测算法中,对分位点系数c和最初始的历史速度数据的长度n逐个进行优化,获得优化检测算法,采用优化检测算法对数据集X进行检测;其中,选择不同的分位点系数c和最初始数据集X的长度n进行非周期拥堵检测,选取性能综合指标PI最小值对应的分位点系数c和长度n作为最优参数代入检测算法中获得最优检测算法;

采用最大化检测率DR、最小化误检率FAR和检测所需用时MTTD,即最小化性能综合指标PI来确定分位点系数c和历史速度数据的长度n的最优值,优化公式如公式(4)所示:

其中,误检数=检测到的真正非周期拥堵个数-真正发生的非周期拥堵个数;检测算法执行次数为迭代次数k;非周期拥堵被检测到的时间为检测算法执行并检测到非周期拥堵的时间;非周期拥堵真正发生的时间从交通事件日志数据中获取。

实施例

一种基于广义极值T分布偏差的非周期拥堵检测方法,具体如下:

S1:以北京市某区域为例,首先获取路网数据及其对应速度数据,并完成数据预处理工作,得到每个路段每15分钟的平均速度;

S2:首先令n=8,即选择过去8周的速度数据

S3:对数据集X执行基于广义极值T分布偏差的非周期拥堵检测,并通过交叉验证,计算不同c值下的算法性能综合指标(PI),如图2所示,横坐标表示分位点系数c,纵坐标表示算法性能综合指标PI,分位点系数c取值分别为(0.2,0.4,0.6,,,,3),根据最小化PI的原则,可得c的最优值为1.6;

S4:保持c=1.6,针对不同n值的数据集,再次执行基于广义极值T分布偏差的非周期拥堵检测,经过交叉验证,获得算法性能综合指标(PI),如下表(1)所示:

表(1)算法性能综合指标数据

由PI可知,当n=8时检测算法的综合性能达到最优。此外还可以看到n过小或者过大都会降低非周期拥堵检测算法的综合性能。

S5:在c=1.6和n=8的最优参数下,进行非周期拥堵检测。以某路段在某个工作日的数据为例,计算每个时间窗T的对应速度阈值τ

本发明的优点在于:

(1)本发明的最大特点就是以数据驱动为理念,把非周期拥堵检测转换为在历史同期数据中的异常值检测问题,从而避开了城市路网异质性的干扰。

(2)本发明的主要目的是基于广义极值T分布偏差构建更为准确、及时的非周期拥堵检测算法。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号