法律状态公告日
法律状态信息
法律状态
2022-11-18
专利权质押合同登记的注销 IPC(主分类):G06F17/50 授权公告日:20160824 申请日:20130912 专利号:ZL2013104157252 登记号:Y2021980012206 出质人:河北上元智能科技股份有限公司 质权人:北京银行股份有限公司石家庄分行 解除日:20221031
专利权质押合同登记的生效、变更及注销
2019-06-11
专利权的转移 IPC(主分类):G06F17/50 登记生效日:20190523 变更前: 变更后: 申请日:20130912
专利申请权、专利权的转移
2019-05-10
专利权的转移 IPC(主分类):G06F17/50 登记生效日:20190423 变更前: 变更后: 申请日:20130912
专利申请权、专利权的转移
2016-08-24
授权
授权
2014-02-05
实质审查的生效 IPC(主分类):G06Q10/04 申请日:20130912
实质审查的生效
2014-01-01
公开
公开
查看全部
技术领域
本发明涉及交通流状态分析领域,尤其涉及一种高速公路交通流量融合预测方法。
背景技术
近年来,社会经济快速发展,汽车的普及率有了很大的提高,同时随着我国高速公路服务水平的提升,越来越多的人们选择驾驶或者乘坐汽车通过高速公路出行,这给高速公路的管理诱导提出了新的挑战,所以,高速公路交通流量预测的重要性在此就显现出来了。
在交通状态预测模型方面,基于传统数学方法(如数理统计和微积分等)而提出的模型和基于现代科学技术和方法(如神经网络和模拟技术等)而提出的模型都具有其优点和局限性。高速公路的交通流量是由交通需求、路网条件、交通管理控制方案、公共交通出行比例、信息诱导等共同作用的结果,所以交通流量时刻在变化,单一的预测模型当中,还没有哪一个能够在不同时刻保持绝对较好的预测精度,所以通过可以融合不同预测模型的在不同条件下的优点来预测交通,以提高预测精度。不同的预测模型各有其优点和缺点,它们之间并不是相互排斥,而是相互联系、相互补充。融合预测法的关键在于权值的动态确定。权值的确定的合理程度直接决定这预测精度的高低。
清华大学的郑为中和史其信提出一种贝叶斯组合神经网络模型并将其应用于短期交通流量的预测,结果表明:模型的预测性能整体上优于单一的神经网络模型,并且确保了模型预测的稳定性;谭满春和冯荤斌将自回归求和滑动平均(ARIMA)与人工神经网络组合模型用于短时交通流预测,结果表明:融合模型的预测准确性高于各自单独使用时的准确性;丛新宇和虞慧群提出将历史趋势模型和多元回归模型加权融合以建立组合预测模型,并利用加权平均的方法, 对较精确的预测值赋予较大的权重,从而提高了模型预测的精度。
随着时间的推移,高速公路交通流的特性会发生变化,而国内外已经提出的融合模型使用的是静态和离线的算法,无法对融合模型中的基础模型的参数值和内部结构进行在线调整,这将导致预测模型的预测精度下降。
发明内容
有鉴于此,本发明提供一种具有在线自整定优化能力的高速公路交通流量融合预测方法,对模型进行在线优化更新,适应随时间变化的交通流特性,提高预测精度。
本发明通过以下技术手段解决上述技术问题:
具有在线自整定优化能力的高速公路交通流量融合预测方法,包括如下步骤:
1)获取高速公路检测交通数据,每一组高速公路检测交通数据包括时间、流量、速度和占有率;
2)建立滑动时间窗(t-m+1,t),m为时间窗的长度,即需要读取的高速公路检测历史交通数据的组数;通过滑动时间窗读取高速公路检测交通数据,每次读取1组新数据,并删除1组最老的数据;
3)对当前滑动时间窗内的数据进行处理:检测是否有数据缺失,若有,则进行插值处理;
4)对比4种单体预测模型在当前滑动时间窗中的预测精度,将预测精度最差的单体预测模型在当前滑动时间窗下进行训练,,一直训练到下次单体预测模型精度对比的时刻,同时选定另外3种单体预测模型;
5)将步骤4)中选定的三种单体预测模型的预测结果进行数据融合;
6)保存步骤5)融合后的预测数据;
7)判断高速公路检测交通数据是否更新,如更新则读取新的高速公路检测交通数据,判断当前滑动时间窗内的数据是否缺失,若有,则进行插值处理;
8)判断当前已进行预测的次数,如果预测的次数没有达到m次,则返回步 骤5),如果预测的次数达到m次,则返回步骤4)。
进一步,所述高速公路检测历史交通数据为时间、流量、速度和占有率。
进一步,所述步骤3)具体包括如下步骤:
31)在滑动时间窗(t-m+1,t)中,检查该时间段内的数据是否有缺失,如果有缺失就选定该段数据;
32)设定一个时间起始点,然后将时间字段转化成数据字段,作为插值横坐标,将流量、速度和占有率分别作为插值纵坐标;
33)根据三次样条插值法插值。
进一步,所述步骤4)中,4种单体预测模型分别为时间序列预测模型、卡尔曼滤波预测模型、神经网络预测模型以及混沌预测模型;
对于时间序列预测模型,若其为预测精度最差的单体预测模型,则重新训练预测模型,确定最优的样本量;
对于卡尔曼滤波预测模型的训练机制,若其为预测精度最差的单体预测模型,则重新训练预测模型,确定最优的状态向量的维数。
对于BP神经网络预测模型,若其为预测精度最差的单体预测模型则,重新训练预测模型,确定新的预测模型参数。
对于混沌预测模型,若其为预测精度最差的单体预测模型,则重新训练预测模型,确定最优的嵌入维数和延迟时间,以构造满足混沌特性的相空间。
进一步,步骤5)中,将三种单体预测模型的预测结果进行数据融合的方法如下:用三种单体预测模型分别进行预测,利用误差反比例法将预测结果分别给予权重,然后进行预测结果融合。
本发明的具有在线自整定优化能力的高速公路交通流量融合预测方法,基于高速公路交通流的时空特性,能够通过在线自整定优化融合模型中的基础模型,该方法选择四种具有更新训练能力的单体预测模型,通过精度对比的择优机制,选择三种预测模型作为基础融合模型,落选的预测模型通过在线实时训练一段时间与另外三种预测算模型继续择优对比竞争基础融合模型的名额,落选的预测模型继续在线实时训练,依次类推,能很快适应随时间变化的交通流 特性,提高预测精度。
附图说明
图1示出了具有在线自整定优化能力的高速公路交通流量融合预测方法的流程示意图;
图2示出了时间序列预测模型的训练流程图;
图3示出了卡尔曼滤波预测模型的训练流程图;
图4示出了BP神经网络预测模型的训练流程图;
图5示出了混沌预测模型的训练流程图;
图6示出了融合预测结果的流程图。
具体实施方式
以下将结合附图,对本发明进行详细说明。
参见图1,具有在线自整定优化能力的高速公路交通流量融合预测方法,包括如下步骤:
1)获取高速公路检测交通数据,每一组高速公路检测交通数据包括时间、流量、速度和占有率;本实施例的高速公路交通数据字段定义如表1所示:
表1高速公路交通数据字段定义表
2)建立滑动时间窗(t-m+1,t),t为当前时间,m为时间窗的长度,即需要读取的高速公路检测交通数据的组数m的取值综合考虑高速公路的交通特性各个预测模型需要的数据组数来确定,通过测试实验,本实施例中m取值为60; 通过滑动时间窗读取高速公路检测交通数据,每次读取1组新数据,并删除1组最老的数据;
3)对当前滑动时间窗内的数据进行处理:检测是否有数据缺失,若有,则在当前预测进程或下一次预测进程中进行插值处理;具体包括如下步骤:
31)在滑动时间窗(t-m+1,t)中,检查该时间段内的数据是否有缺失,如果有缺失就选定该段数据;
32)设定一个时间起始点,然后将时间字段转化成数据字段,作为插值横坐标,将流量、速度和占有率分别作为插值纵坐标;
33)根据三次样条插值法插值。
在预测时,通常对交通数据的光滑性要求较高,作为逼近函数的分段线性低阶插值并不能满足条件。假设一条逼近曲线,它在给定的节点上具有和函数相同的值,在两个节点之间为一条三次曲线,整条曲线有二阶连续导数,这就是三次样条函数。其数学定义如下:
定义:将三次样条函数记为S(x),它是定义在区间[a,b]上的函数,满足:
(1)S(x)在每一个小区间[xi-1,xi]上是一个三次多项式函数;
(2)在整个区间[a,b]上,其二阶导数存在且连续,即在每个节点处的二阶导数连续。
三次样条函数是最基本、最重要的样条函数,属于分段的代数多项式,它可以通过平面的任意、有限多个节点,且能保证曲线的一阶、二阶导数的连续性。比较适合变化缓慢的情况。三次样条插值是一种既能够克服高次多项式插值缺陷,又能保证有一定的光滑性的分段插值方法,它能够较好地解决实际中的非线性问题。
4)对比4种单体预测模型在当前滑动时间窗中的预测精度,将预测精度最差的单体预测模型在当前滑动时间窗下进行训练,一直训练到下次单体预测模型精度对比的时刻,同时选定另外3种单体预测模型作为基础融合模型;4种单体预测模型分别为时间序列预测模型、卡尔曼滤波预测模型、神经网络预测 模型以及混沌预测模型;
对于时间序列预测模型,若其为预测精度最差的单体预测模型,则重新训练预测模型,确定最优的样本量;参见图2,如果时间序列预测模型的精度不理想,那么可能的原因是模型选择的样本的平稳性不好,这就需要重新训练预测模型,来确定最优的样本量。其训练机制为:
a)选取最优样本量
通过在固定时间窗下训练比较不同样本量下序列能够通过平稳性检验的次数,选取其中使得序列通过平稳性检验次数最多时所对应的样本量为最优样本量。
在进行平稳性检验时,采用游程检验法。游程检验所判断的假设为:“样本数据出现的顺序没有明显的趋势,序列就具有平稳性”。假设采用的样本统计量有:
N1:一种符号出现的总数;
N2:另一种符号出现的总数;
γ:游程的总数;
其中:γ为检验统计量。
对于序列长度较短的小样本时间序列(即N1和N2都小于15),可在确定显著水平α(通常α=0.05)后,通过查看相应的“游程检验γ分布表”,判定γ是否在游程总数下限γL和游程总数上限γU之间,如果是,则接受假设,即判定原序列是平稳序列,反之则否。
当N1或N2超过15时可以用正态分布来近似,此时用的统计量为:
式中,
b)模型参数的求解
该算法采用矩估计法进行模型参数求解。具体可按下式进行计算:
式中,和分别表示序列的自相关函数和模型参数,p表示模型的阶次,在计算自相关函数时,一般取为或N/10,其中N表示样本量,这里选用自相关函数可通过下式进行求解:
式中,xt表示时间序列中的观测值。
对于卡尔曼滤波预测模型的训练机制,若其为预测精度最差的单体预测模型,则重新训练预测模型,确定最优的状态向量维数。
参见图3,如果卡尔曼滤波预测模型的精度不理想,那么可能的原因是模型选择状态变量的个数不是最优,这就需要重新训练预测模型,本发明考虑根据距离来选取上游一个或者多个观测器,来确定最优的最优的状态向量维数。其训练机制为:
a)给初始的状态向量X(0)与协方差矩阵赋值P(0);
b)计算观测值矩阵A(t);
c)根据预测协方差方程P(t|t-1)=B(t-1)P(t-1|t-1)BT(t-1)+Q(t-1)计算协方差矩阵P(t|t-1);
d)根据K(t)=P(t|t-1)AT(t)[A(t)P(t|t-1)AT(t)+R(t)]-1计算卡尔曼增益矩阵K(t);
e)计算状态向量X(t)的最优预报估值
f)根据给出预测的结果。
g)根据预测结果不断调整状态向量的维数,以使预测模型预测效果达到最优。
对于BP神经网络预测模型,若其为预测精度最差的单体预测模型,则重新训练预测模型,确定新的预测模型参数。
参见图4,如果BP神经网络预测模型的精度不理想,那么可能的原因是该模型以前训练的参数已经不适合当前时间窗下的数据,所以有必要重新对BP神经网络预测模型进行训练。其训练机制为:
a)在当前时间窗下,初始化模型参数;
b)取出一个样本序列Xp,将该序列加入到输入端;
c)将各神经元在隐层和输出层的输出opjl计算出来;
d)计算输出层的误差,并把误差平方和作为判断神经网络是否收敛的准侧函数
式中:Tpj为输出层第j个神经元的理想输出值。如果满足要求则学习结束,否则转入下一步;
e)从输出层到第一层,依次计算各层各神经元的局部梯度δpjl;
f)计算每层神经元的调整量修正各层权值
式中,a为学习速率系数,通常在0.01—1之间取值;
g)k=k+1,输入新的样本,返回b),直到EP满足要求为止。
对于混沌预测模型,若其为预测精度最差的单体预测模型,则重新训练预测模型,确定最优的嵌入维数和延迟时间,以构造满足混沌特性的相空间。
参见图5:如果混沌预测模型的精度不理想,那么可能的原因是该模型构造的相空间不具有混沌特性了,这就需要重新训练预测模型,确定最优的嵌入 维数m和延迟时间τ以便构造满足混沌特性的相空间。其训练机制为:
a)在当前时间窗下,计算数列的嵌入维数m和时间延迟τm,得到重构相空间:
X(t)={x(t),x(t-τ),…,x(t-(m-1)τ)},t=1,2,...,M;
式中,M=N-(m-1)τ为重构相空间中点的个数;
b)判断是当前相空间否具有混沌特性,如果有混沌特性,转入下一步,否则继续调整嵌入维数m和时间延迟τm;
c)如果具有混沌特性,根据重构的相空间计算最大Lyapunov指数λ1;
d)根据最大Lyapunov指数定义进行交通流量预测;
e)根据预测效果,不断调整嵌入维数m和时间延迟τm,以使预测模型预测效果达到最优。
5)将步骤4)中选定的三种单体预测模型的预测结果进行数据融合:用三种单体预测模型分别进行预测,利用误差反比例法将预测结果分别给予权重,然后进行预测结果融合;融合预测机制如图6所示:
在相同时间窗下,基础融合模型依然存在预测精度的高低之分,因此,为了进一步提高预测精度,减少预测误差,需要对基础融合模型进行模型融合。融合的思想是充分考虑到基础融合模型在前若干个时段内预测结果的精度以及模型本身的适用环境。对预测结果进行融合,计算公式为:
式中:第i种算法在t时刻的预测值;
的权重;
由此可以看出,最重要的步骤即是权重的确定,它决定了某个模型输出信息对最终预测结果所起的作用,将直接影响到模型融合的精度。期望的权重应是能够根据预测误差的变化不断调整,以使精度最好的预测结果可以对最终的输出起到最大的作用。为此,定义动态误差为:
式中:ed,i(t)_i模型在t时段的动态误差,它实际上是t之前k个时段内i模型ear,i(t)的均值;
k_误差累积数,通常根据预测数据的总数来确定其合适的取值;
ear,i(t)_t时段i模型预测结果的绝对相对误差。
ear,i(t)的计算公式为:
式中:y(t)_t时段的实测数据
模型在t时段的预测值
得到每种预测模型的动态误差之后,便可以据此确定各模型预测结果的融合权重wi(t)。wi(t)是一个随着ed,i(t-1)变化而不断变化的函数。本发明采用反比例法确定权重,其原则是权重与误差大小成反比,即误差大的给予小的权重,误差小的给予大的权重。
其流程图描述如下所示:
a)获得三种预测融合预测模型的近10次的预测误差以及初始化融合权重wi(t)为0;
b)分别获得三种预测模型10次误差之和,并判断误差之和是否为0,如果为0,则重新给该模型误差之和赋值为0.01;
c)以各模型误差之和为数据依据通过反比例法得到每个预测模型的权重;
d)利用权重对各模型的预测结果进行加权求和,获得预测结果,存入到数据库中。
6)保存步骤5)融合后的预测数据;
7)判断高速公路检测交通数据是否更新,如更新则读取新的高速公路检测交通数据,判断当前滑动时间窗内的数据是否缺失,若有,则进行插值处理;;
8)判断当前已进行预测的次数,如果预测的次数没有达到m次,则返回步骤5),如果预测的次数达到m次,则返回步骤4)。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
机译: 反映流量随时间变化的端到端流量分布预测方法及局域网的优化方法
机译: 反映流量随时间变化的端到端流量分布预测方法及局域网的优化方法
机译: 在具有融合点的分布式系统中优化网络流量的方法和系统