法律状态公告日
法律状态信息
法律状态
2019-11-15
授权
授权
2017-10-20
实质审查的生效 IPC(主分类):G08G1/01 申请日:20170703
实质审查的生效
2017-09-19
公开
公开
技术领域
本发明涉及高速公路管理的技术领域,尤其是指一种支持向量回归机融合的高速公路路段平均速度估计方法。
背景技术
高速公路路段平均速度指单位时间段内,指定方向通过高速公路某一路段的交通车辆平均行程速度。路段平均速度能直观反映高速公路路段的实际运行状况,对高速公路的出行者和管理部门都具有重要的意义。目前,我国高速公路路段平均速度的获取方法主要为固定采集法,即采用布设在高速公路上的车辆检测器、高清摄像头等设备直接获取通过该断面的车辆平均速度,然而,由于布设和维护成本高等问题,车辆检测器、高清卡口等设备的布设密度较低,导致所采集的数据覆盖范围小,且存在损坏率高、维护不及时的问题,无法真实反映高速公路系统的运行状态。因此,国内外专家学者开始研究使用检测器数据以外的其他数据源估计高速公路路段平均速度的方法,例如收费数据、浮动车数据等。采用不同于车辆检测器的数据源,虽然有效避免了车检器覆盖范围小的问题,但是由于每种单一数据源都有其自身的缺陷,例如收费数据具有滞后性、受匝道长度影响的缺陷而浮动车数据具有检测目标随机性的缺陷,并不能够完全准确地反映实际的交通状态。
随着计算机技术的发展,多源数据的融合方法受到越来越多的研究者关注。与单一数据源相比,通过多源数据融合获得的结果将具有更高的准确性和可靠性。但是,前人的融合算法依然较多地在检测器数据的基础上进行优化,而检测器密度稀疏且损坏率较高是当前高速公路数据采集的硬伤,有必要研究避开检测器数据而能通过其他数据融合获取平均速度的方法。通过对高速公路收费数据和浮动车数据进行比较发现:收费数据具有车辆信息全面可靠、辐射路网范围广的优点,却存在滞后性、受道路匝道影响较大的缺陷,而浮动车数据则具有实时性好,路网分布相对均匀分散的优点,却存在检测目标随机性、对象不全面的缺陷,可见它们之间能够很好地优势互补,互相佐证。
因此,本发明提出一种基于支持向量回归机融合的高速公路路段平均速度估计方法,对收费数据和浮动车数据获取的路段平均速度进行融合修正,融合后的路段平均速度更接近真实值,可更好地反映高速公路系统运行状态,为管理者和出行者提供决策依据。
发明内容
本发明的目的在于弥补现有高速公路车辆检测器密度稀疏、损坏率高导致所估计的路段平均速度准确率不高这一缺陷,提出了一种支持向量回归机融合的高速公路路段平均速度估计方法。该方法利用支持向量回归机原理,对高速公路收费数据和“两客一危”卫星定位数据所获取的路段平均速度进行融合处理,得到估计效果更好的路段平均速度,具有实际推广价值。
为实现上述目的,本发明所提供的技术方案为:支持向量回归机融合的高速公路路段平均速度估计方法,包括以下步骤:
1)选定研究的高速公路,获取基础数据资料,包括:高速公路收费数据、高速公路“两客一危”北斗卫星定位数据;
2)根据收费数据,采用基于轨迹法的修正算法求取路段平均速度;
3)将“两客一危”车辆作为浮动车,以其北斗卫星定位系统数据为基础,采用速度-时间积分模型对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度;
4)使用支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度。
在步骤1)中,所述高速公路收费数据资料包括车辆进出口收费站的编号和时间信息,所述“两客一危”北斗卫星定位数据资料包括通过北斗卫星定位系统获得的速度数据。
在步骤2)中,根据收费数据,采用基于轨迹法的修正算法求取路段平均速度,包含如下步骤:
2.1)数据预处理:若所采集的收费数据存在下列问题,则剔除:①数据不完整,出入站编码丢失或进出时间丢失;②出入口站编码相同;③入口时间晚于出口时间;④行程速度超过高速公路限速的120%;⑤行程时间超过样本均值的两倍标准差范围的离群值;
经过处理后,获得从时间区间p内出发,在路段si,j上行驶的车辆平均行程时间
式中,i,j分别表示高速公路入口和出口;
2.2)获取行程时间二维表:高速公路收费数据可处理得到所有节点之间的平均行程时间,将一天划分为P个时段,同一个时间区间p(p=1,2,…,P)的路段行程时间按优先级排序方法排列成一个一维列向量Tp,其中入口i的优先级大于出口j的优先级,即
2.3)计算基本路段的修正行程时间:从节点k到节点k+1的基本路段sk,k+1旅程时间修正算法如下:
a)当k=1时,
其中,
b)当2≤k≤K-2时,
其中,
c)当k=K-1时,
其中,
2.4)计算路段平均速度:通过上述修正行程时间,计算出路段sk,k+1的平均速度
式中,lk,k+1为基本路段sk,k+1的长度;
在步骤3)中,将“两客一危”车辆作为浮动车,以其北斗卫星定位系统获得的速度数据为基础,采用速度-时间积分模型对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度,具体步骤包括:
3.1)计算单一浮动车路段行程速度:在时间区间p内研究路段sk,k+1上的浮动车数据返回点分布情况,以1,2,3,4,……,M表示浮动车q在路段sk,k+1上的定位点序号;定义:
则浮动车q在路段sk,k+1上行驶的平均行程速度
3.2)计算路段平均速度:将时间区间p内路段sk,k+1上各浮动车的平均行程速度
其中,
在步骤4)中,使用基于支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度的步骤如下:
4.1)产生训练集/测试集:将处理出的基于收费数据和“两客一危”北斗卫星定位系统数据所得的两类路段平均速度和真实值根据时间和路段三者一一对应,组成一个三列的矩阵,形成样本集,按照随机抽样的方式产生模型的训练集合和测试集合,保持测试集至少为训练集的20%;
4.2)构建支持向量回归机模型:采用RBF核函数,首先利用交叉验证方法寻找最佳的参数,包括惩罚因子和RBF核函数中的方差,然后利用最佳的参数训练模型;
4.3)模型输出:将测试集中的两类路段平均速度输入向量机中,将预测值与真实值进行比较,计算均方误差E和决定系数R2两项评价指标,具体计算公式如下所示:
其中l为测试集样本个数;yi(i=1,2,…,l)为第i个样本的真实值;
4.4)性能评价:比较均方误差E和决定系数R2与标准值得差异,若E>0.03,或R2<0.8,则重复步骤4.1)、4.2)和4.3),通过修改模型参数、核函数类型的方法重新建立向量回归机,直到满足要求为止,否则,保存向量机的形式,可用于后续高速路段平均速度估计方法。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明不依赖高速公路的车检器进行速度估计,有效避免了车检器损坏率高、精确度低、布置范围不广泛的缺点;
2、本发明首次将我国高速公路上的“两客一危”北斗卫星定位系统数据用于路段平均速度估计中,增加北斗卫星定位系统的实用价值;
3、本发明提出融合收费数据和卫星定位系统数据估计路段平均速度,克服了单一数据源得到的路段平均速度具有滞后性、不够全面等问题,提高了路段平均速度估计方法的精确度;
4、本发明采用支持向量回归机融合,具有在有限样本的情况下获得最优解、解决传统神经网络无法避免局部最优问题、避免传统神经网络需要反复试凑确定网络结构问题和保证模型具有良好的泛化能力的优势;
5、本发明在高速公路运行状态监测系统和用户路径诱导系统中具有广泛的使用空间,具有需要数据源简单、覆盖范围广的优点,对提高高速公路运行状态、发挥其骨干道路作用具有极大好处。
附图说明
图1为高速公路基本路段示意图。
图2为路段sk,k+1上的浮动车定位点分布图。
图3为基于支持向量回归机的融合方法建模流程图。
图4为实施例测试集结果对比图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本实施例所提供的支持向量回归机融合的高速公路路段平均速度估计方法,使用高速公路收费数据和“两客一危”北斗卫星定位数据,分别处理出路段平均速度,再使用支持向量回归机进行融合,估计出高速公路路段平均速度。具体包括以下步骤:
1)选定研究的高速公路,获取基础数据资料,包括:高速公路收费数据、高速公路“两客一危”北斗卫星定位数据;
所述高速公路收费数据资料包括车辆进出口收费站的编号和时间信息。如下表1所示。
表1收费数据示例
所述“两客一危”卫星定位数据资料包括通过北斗卫星定位系统获得的速度数据。
2)根据收费数据,采用基于轨迹法的修正算法求取路段平均速度,包含如下步骤:
2.1)数据预处理:若所采集的收费数据存在下列问题,则剔除:①数据不完整,出入站编码丢失或进出时间丢失;②出入口站编码相同;③入口时间晚于出口时间;④行程速度超过高速公路限速的120%;⑤行程时间超过样本均值的两倍标准差范围的离群值。基本路段的定义如图1所示,相邻两个收费站构成1个基本路段,如s1,2,s2,3,sK-1,K等。
经过处理后,获得从时间区间p内出发,在路段si,j上行驶的车辆平均行程时间
式中,i,j分别表示高速公路入口和出口;
2.2)获取行程时间二维表:高速公路收费数据可处理得到所有节点之间的平均行程时间。将一天划分为P个时段,同一个时间区间p(p=1,2,…,P)的路段行程时间按优先级排序方法排列成一个一维列向量Tp,其中入口i的优先级大于出口j的优先级,即
表2行程时间二维表
2.3)计算基本路段的修正行程时间:从节点k到节点k+1的基本路段sk,k+1旅程时间修正算法如下:
a)当k=1时,
其中,
b)当2≤k≤K-2时,
其中,
c)当k=K-1时,
其中,
2.4)计算路段平均速度:通过上述修正行程时间,可计算出路段sk,k+1的平均速度
式中,lk,k+1为基本路段sk,k+1的长度;
3)将“两客一危”车辆作为浮动车,以其北斗卫星定位系统获得的速度数据为基础,采用速度-时间积分模型对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度,具体步骤包括:
3.1)计算单一浮动车路段行程速度:在时间区间p内研究路段sk,k+1上的浮动车数据返回点分布情况,以1,2,3,4,……,M表示浮动车q在路段sk,k+1上的定位点序号,具体如图2所示。定义:
则浮动车q在路段sk,k+1上行驶的平均行程速度
3.2)计算路段平均速度:将时间区间p内路段sk,k+1上各浮动车的平均行程速度
其中,
4)使用基于支持向量回归机融合算法对两类单一数据源处理出来的结果进行融合,得到基于支持向量回归机融合的高速公路路段平均速度,其逻辑框图如图3所示,具体步骤如下:
4.1)产生训练集/测试集:将步骤2和3中的两类速度和路段平均速度的真实值根据时间和路段一一对应,组成一个三列的矩阵,形成样本集,按照随机抽样的方式产生模型的训练集合和测试集合,保持测试集至少为训练集的20%;
4.2)构建支持向量回归机模型:采用较为经典的RBF核函数,首先利用交叉验证方法寻找最佳的参数(惩罚因子和RBF核函数中的方差),然后利用最佳的参数训练模型;
4.3)模型输出:将测试集中的两类路段平均速度输入向量机中,将预测值与真实值进行比较,计算均方误差(E)和决定系数(R2)两项评价指标,具体计算公式如下所示:
其中l为测试集样本个数;yi(i=1,2,…,l)为第i个样本的真实值;
4.4)性能评价:比较均方误差(E)和决定系数(R2)与标准值得差异,若E>0.03,或R2<0.8,则重复步骤4.1)、4.2)和4.3),通过修改模型参数、核函数类型的方法重新建立向量回归机,直到满足要求为止,否则,保存向量机的形式,可用于后续高速路段平均速度估计方法。
具体的,本实施例选择广东省广乐高速南行方向共18个基本路段,2016年11月6日8:00~21:00的收费数据和“两客一危”卫星定位数据,其中收费数据共计3712条,卫星定位数据5.6万条。
按照步骤2)和3)的方法对数据进行预处理,以30min间隔,共处理出路段平均速度468组,随机选择400组数据作为模型的训练样本集,剩余68组数据作为测试样本集。
采用本文所提出的融合模型,对路段平均速度进行预测。查阅相关文献,确定SVR核函数选择RBF函数,其参数方差σ和惩罚因子C在范围[-10,10]内寻优,不敏感损失系数ε=5。
利用Matlab 2014a软件实现数据融合。经过400组数据的模型训练后,创建SVR模型,并输出测试集的融合结果,拟合结果如图4所示,均方误差E=0.0035,可决系数R2=0.977,表明模型融合结果与实际数据拟合程度高,模型效果良好。下表3为部分测试集的数据与相应真实值对比后得到的平均相对误差,从中可以看出,与单一数据源的估计速度相比,融合后的速度具有更小的相对误差,即融合结果更接近真实值。
表3相对误差
本发明还分别以15min,45min和60min作为统计间隔,使用上述融合方法进行路段平均速度估计,结果显示,模型效果与统计间隔大小有关,时间间隔越大,误差越大,当统计间隔为30min以下时,估计结果更为精确,具体如下表4所示。
表4不同统计间隔下的模型效果
实例分析证明,本发明建立的支持向量回归机融合模型是可行且有效的,能够起到提高路段平均速度估计精度的作用。总结可知该发明方法具有实际推广价值,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
机译: 预测高速公路弯曲过程的方法,涉及确定高速公路路段,将高速公路路段放置在车辆之前
机译: 使用M估计量和多项式核支持向量机的回归以及主成分回归
机译: 使用M估计和多项式核支持向量机的回归以及主成分回归