首页> 中国专利> 基于多核支持向量回归机的交通流速度估计方法

基于多核支持向量回归机的交通流速度估计方法

摘要

本发明公开了一种基于多核支持向量回归机的交通流速度估计方法,包括:步骤一,对地感线圈检测到的数据进行预处理,得到地感线圈检测数据;步骤二,获取道路交通流速度真值,得到速度真值数据;步骤三,训练数据与测试数据的建立:融合地感线圈检测数据和速度真值数据构建数据库,再将数据库中的数据划分为训练数据与测试数据;步骤四,利用训练数据训练多核支持向量回归机模型,从而建立流量与速度的关系模型;步骤五,利用建立的多核支持向量回归机模型进行交通流速度的准确估计。本发明避免对核函数和参数的选择,当交通流速度无法直接检测的时利用单环线圈采集到的流量、饱和度等信息对路段的平均速度进行估计,具有较强的实用性与鲁棒性。

著录项

  • 公开/公告号CN102890866A

    专利类型发明专利

  • 公开/公告日2013-01-23

    原文格式PDF

  • 申请/专利权人 上海交通大学;

    申请/专利号CN201210345126.3

  • 发明设计人 项文书;肖建力;魏超;刘允才;

    申请日2012-09-17

  • 分类号G08G1/052;G08G1/042;

  • 代理机构上海汉声知识产权代理有限公司;

  • 代理人郭国中

  • 地址 200240 上海市闵行区东川路800号

  • 入库时间 2024-02-19 16:49:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-09-04

    未缴年费专利权终止 IPC(主分类):G08G1/052 授权公告日:20150121 终止日期:20170917 申请日:20120917

    专利权的终止

  • 2015-01-21

    授权

    授权

  • 2013-04-10

    实质审查的生效 IPC(主分类):G08G1/052 申请日:20120917

    实质审查的生效

  • 2013-01-23

    公开

    公开

说明书

技术领域

本发明涉及交通流速度估计技术领域,具体是一种基于多核支持向量回归机的交通流 速度估计方法。

背景技术

交通流状态识别对交通流的诱导与控制起着致关重要的作用,而交通流的速度估计是 交通状态识别的重要基础和前提,目前已有大量人员将研究的焦点放在了交通流速度估计 上。

当前常用的交通流速度估计方法为利用环型线圈采集交通流数据的方式,大致可分为 单环和双环两种方式。单环方式安装简单,成本低廉,目前大部分的道路都基本采用此安 装方式。单环方式的缺点在于其检测到的交通流参数有限,往往只能获得流量、饱和度等 参数,无法检测到速度等重要的交通流参数;双环检测方式检测精度高,可获得流量、速 度、车辆类型等较全的交通流参数,但是其安装方式复杂,成本高。由于目前大部分的道 路的环型线圈均采用单环方式安装,因而无法采集到速度数据。因此,在单环安装方式仍 占主导地位的现实形势下,利用交通流的流量、饱和度等地感线圈检测数据来估计速度就 具有重要的理论意义和应用价值。

目前已有许多方法应用到根据地感线圈检测数据来估计交通流的速度中,如用多项式 拟合速度、流量之间的关系,又如利用BP神经网络建模两者的关系。SVR(支持向量回归机) 是机器学习中的高级技术,它能提高算法的泛化能力,较好解决非线性问题,但是单核SVR (以后将简称单核SVR为SVR)高度依赖核函数类型和与参数值的选择,然而目前尚没有成 熟的理论指导如何选择核函数以及相应参数,导致其鲁棒性较差,实际应用中常常效果不 佳。

发明内容

本发明针对现有技术中存在的上述不足,提供了一种基于多核支持向量回归机的交通 流速度估计方法。

本发明是通过以下技术方案实现的。

一种基于多核支持向量回归机的交通流速度估计方法,包括以下步骤:

步骤一,对地感线圈检测到的数据进行预处理,得到地感线圈检测数据;

步骤二,获取道路交通流速度真值,得到速度真值数据;

步骤三,训练数据与测试数据的建立:融合地感线圈检测数据和速度真值数据构建数据 库,再将数据库中的数据划分为训练数据与测试数据;

步骤四,利用训练数据训练多核支持向量回归机模型,从而建立流量与速度的关系模型;

步骤五,利用建立的多核支持向量回归机模型进行交通流速度的准确估计。

所述步骤一包括以下子步骤:

第一步,噪声数据的滤除:根据地感线圈检测数据计算交通流参数的数据分布的均值, 再对地感线圈检测到的数据进行校验,当其大于均值的3倍,或者小于均值的0.1倍时,该 数据被认为是噪声数据,由对应的均值替代;

第二步,缺失数据的补全:当某一时刻地感线圈检测到的数据丢失时,将会用数据分布 的均值替代该数据;

第三步,由地感线圈检测点的交通流数据计算路段交通流数据:对于任一条车道而言, 它的交通流数据由其上的若干个地感线圈确定,为了获得整个路段的某一交通流数据,近 似地采用对各个车道的相应交通流数据取算术平均值得到。

所述第一步中交通流参数包括:饱和度、相位时长和折算流量。

所述步骤二包括以下子步骤:

第一步,在路段的入口和出口分别用摄像机拍摄车流,人工浏览视频获得同一辆车进、 出路段的时间,从而获得该车在此路段上的行程时间;

第二步,用该路段长度比上行程时间获得该车在此路段上的平均速度;

第三步,取一段时间内通过此路段的所有车辆的平均速度的均值作为此路段的交通流 的速度的真值。

所述步骤三包括以下子步骤:

第一步,构建一个数据库,所述数据库中的每一个数据由一个地感线圈检测数据段和 一个速度真值数据段构成;

第二步,将数据库中的一部分数据作为训练数据,用于训练多核支持向量回归机模型, 而余下的数据作为测试数据,用于对所建立的模型的性能进行测试。

所述地感线圈检测数据段包括饱和度、相位时长、折算流量以及时间信息;所述速度 真值数据段仅包含该时刻的真实速度。

所述分割训练数据和测试数据的方法为:随机地选择数据库中一半的记录作为训练数 据,其余的都作为测试数据。

所述步骤四包括以下子步骤:

第一步,采用训练数据中的饱和度、相位时长以及折算流量构成的三维向量作为模型 的输入,训练数据中的速度真值作为模型的输出,通过训练学习建立多核支持向量回归机 模型;

第二步,利用测试数据测试多核支持向量回归机模型;

第三步,对多核支持向量回归机模型的性能做出评价,如性能未能满足要求,可对模 型的参数做出调整,直到多核支持向量回归机模型满足性能要求。

所述步骤五为:通过给出饱和度、相位时长和折算流量等信息作为模型输入,准确估 计交通流的速度。

与现有的技术相比,本发明有如下优点:

第一,本发明克服了单环线圈检测的不足,通过挖掘交通流的流量、饱和度、相位时 长与速度的关系,建立对速度的估计模型。而速度信息是对道路交通状态进行分析的关键 因素,因此本发明可以降低对道路交通状态分析的成本,具有良好的社会经济效益;

第二,利用多核支持向量回归机进行建模较传统的多项式拟合以及BP神经网络等方法 有更好的鲁棒性,且整体估计性能更佳。

本发明提供的基于多核支持向量回归机的交通流速度估计方法,很好的克服了SVR的缺 点,能够避免对核函数和参数的选择,在交通流速度无法直接检测的情况下利用单环线圈 采集到的流量、饱和度等信息对路段的平均速度进行估计,具有较强的实用性与鲁棒性。

附图说明

图1地感线圈分布示意图。

具体实施方式

下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施, 给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例一

本实施例包括以下步骤:

步骤一,对地感线圈检测到的数据进行预处理,得到地感线圈检测数据;

包括以下子步骤:

第一步,噪声数据的滤除:根据地感线圈检测数据计算交通流参数的数据分布的均值, 再对地感线圈检测到的数据进行校验,当其大于均值的3倍,或者小于均值的0.1倍时,该 数据被认为是噪声数据,由对应的均值替代;其中,交通流参数包括:饱和度、相位时长 和折算流量;

第二步,缺失数据的补全:当某一时刻地感线圈检测到的数据丢失时,将会用数据分布 的均值替代该数据;

第三步,由地感线圈检测点的交通流数据计算路段交通流数据:对于任一条车道而言, 它的交通流数据由其上的若干个地感线圈确定,为了获得整个路段的某一交通流数据,近 似地采用对各个车道的相应交通流数据取算术平均值得到。假设某一路段在同一方向上存 在n条车道,在路段入口和出口分布检测环,如图1所示,共有2n个检测环,每条车道有 两个检测环。对于任一条车道而言,它的交通流参数由其上的首尾两个检测环确定,一般 取为二者检测的均值。为了获得整个路段的某一交通流参数,我们近似地采用对各个车道 的相应交通流参数取算术平均值得到。总的来说,一个路段的交通流参数为其上的各个检 测环的均值确定。

步骤二,获取道路交通流速度真值,得到速度真值数据;

包括以下子步骤:

第一步,在路段的入口和出口分别用摄像机拍摄车流,人工浏览视频获得同一辆车进、 出路段的时间,从而获得该车在此路段上的行程时间;

第二步,用该路段长度比上行程时间获得该车在此路段上的平均速度;

第三步,取一段时间内通过此路段的所有车辆的平均速度的均值作为此路段的交通流 的速度的真值。

步骤三,训练数据与测试数据的建立:融合地感线圈检测数据和速度真值数据构建数据 库,再将数据库中的数据划分为训练数据与测试数据;

包括以下子步骤:

第一步,构建一个数据库,所述数据库中的每一个数据由一个地感线圈检测数据段和一 个速度真值数据段构成;其中,地感线圈检测数据段包括饱和度、相位时长、折算流量以及 时间信息;速度真值数据段仅包含该时刻的真实速度;将这两个数据段融合便构成数据库中 的一条记录,这样的记录的全体即是我们所需的数据库;

第二步,将数据库中的一部分数据作为训练数据,用于训练多核支持向量回归机模型, 而余下的数据作为测试数据,用于对所建立的模型的性能进行测试。优选地,分割训练数 据和测试数据的方法为:随机地选择数据库中一半的记录作为训练数据,其余的都作为测 试数据。

步骤四,利用训练数据训练多核支持向量回归机模型,从而建立流量与速度的关系模 型;

包括以下子步骤:

第一步,采用训练数据中的饱和度、相位时长以及折算流量构成的三维向量作为模型 的输入,训练数据中的速度真值作为模型的输出,通过训练学习建立多核支持向量回归机 模型;

第二步,利用测试数据测试多核支持向量回归机模型;

第三步,对多核支持向量回归机模型的性能做出评价,如性能未能满足要求,可对模 型的参数做出调整,直到多核支持向量回归机模型满足性能要求。

步骤五,利用建立的多核支持向量回归机模型进行交通流速度的准确估计;具体为, 通过给出饱和度、相位时长和折算流量等信息作为模型输入,准确估计交通流的速度。

为了验证多核支持向量回归机模型的性能,我们也将多项式拟合方法、BP神经网络方 法以及SVR方法应用到Shanghai2010数据库,并将这几个模型的输出结果进行比较。 Shanghai2010数据库的格式如下表所示:

表1 地感线圈检测数据示例

Shanghai2010数据库的样本总数为314,训练样本数目和测试样本数目各占一半,均为 157。

具体步骤为:

步骤一,对地感线圈检测到的数据进行预处理,得到地感线圈检测数据;

步骤二,获取道路交通流速度真值,得到速度真值数据;

步骤三,训练数据与测试数据的建立:根据训练样本的数目对数据集进行采样,获得 训练样本,剩下的样本为测试样本,从而将数据库划分为训练集和测试集两部分;

步骤四,利用训练数据训练多核支持向量回归机模型:利用训练集对多核支持向量回 归机模型进行训练,得到多核支持向量回归机模型。本实施例中使用的多核支持响亮回归 机模型为A.Rakotomamonjy等人提出的一种多核支持向量回归机模型。为了比较算法性能, 我们也利用训练集训练得到了三阶多项式模型、BP神经网络模型和单核SVR模型,但必 须注意,训练后三个模型只是为了与多核支持向量回归机模型的性能进行比较,并非本发 明的必需步骤;利用测试集测试多核支持向量回归机模型;为了比较性能,我们也测试了 三阶多项式模型、BP神经网络模型、单核SVR模型的性能,同样地,后三个模型的性能 测试也并非本发明的必需步骤;对多核支持向量回归机模型的性能做出评价,如性能未能 满足要求,可对模型的参数做出调整直到满足性能要求;

步骤五,利用建立的多核支持向量回归机模型及当前地感线圈检测到的交通流数据对 速度进行估计。

这里采用了三种比较常用的评价指标来对交通流速度估计算法的优劣加以评价,这三 个指标分别是平均绝对误差(MAE)、平均绝对百分比误差(MAPE)以及均方根误差 (RMSE)。这三个指标越小,表明对应的算法的整体估计误差越小,性能越好。

统计这四个不同的算法在Shanghai2010数据库上的运行30次的结果,然后计算前面 提到的三种不同的性能指标的均值,得到的对比数据如表2所示。

表2中的各个评价指标的结果均以“均值±方差”的形式加以表示。对于某一个评价 指标而言,若某一算法在该指标上具有较小的均值且具有较小的方差,则表明该算法在此 评价指标上具有较好的性能。根据此原则,由表2中的结果可知,相比其它三个算法,多 核支持向量回归机模型在各个评价指标上的性能均是最优的。此结果表明多核支持向量回 归机模型能在实际应用中获得较好的效果。

表2 四种算法在Shanghai2010数据库上的速度估计性能的比较

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定 实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本 发明的实质内容。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号