法律状态公告日
法律状态信息
法律状态
2023-01-06
未缴年费专利权终止 IPC(主分类):G06F16/29 专利号:ZL2016100575309 申请日:20160128 授权公告日:20190305
专利权的终止
2019-03-05
授权
授权
2016-08-03
实质审查的生效 IPC(主分类):G06F17/30 申请日:20160128
实质审查的生效
2016-07-06
公开
公开
技术领域
本发明涉及具有较大噪声的网络数据源交通信息数据处理与云计算技术领域,具体涉及一种基于模糊去噪与模糊拼接的公交到站信息轨迹提取方法。
背景技术
随着城市公交信息化的建设与云计算的普及,目前国内多个城市均在公交车上安装了GPS全球定位系统,并开放公交实时到站查询服务,用户可在公交信息发布网站上通过浏览器或手机专用软件查询具体线路的公交实时到站信息,提高了公交服务质量和公交出行率,对改善城市交通拥堵具有重要意义。
受GPS定位误差、人工误操作、网络数据传输及电子设备故障等多方面因素的影响,公交到站信息的轨迹时空图存在一定比例的噪声数据和数据缺失现象,影响了行车轨迹的正确提取,具体表现在:1)同一辆车同一班次的行车数据在某些站点上会产生多个到站时间,且相互之间的时间差值在几十秒至几十分钟范围内,该现象在首末站点尤为严重;2)部分车辆在首末站点上下行线路换向后,电子设备未切换,导致车辆在某些班次上产生逆向行驶的行车轨迹;3)各车辆的行车轨迹均存在一定比例的数据缺失,受电子设备或网络传输阶段性故障影响,部分车辆甚至出现连续多站点的数据缺失。此外,在实际的系统中受交通拥堵影响,还存在后发车班次赶上前一班次的情况,表现在时空图上则出现行车轨迹交叉的现象,增加了轨迹正确提取的难度。
发明专利(申请号:201210274483.5)提出了一种基于网络数据源的公交到站信息轨迹生成方法,针对只提供到站信息无公交车辆识别号的数据源,实现了公交行车数据按线路和班次的轨迹提取,该方法对噪声较小的数据集能取得良好效果,但是对噪声较大的数据集依然存在较多的错误提取,或对真实系统的一个完整班次行车轨迹误提取成多个非完整的轨迹片段,不利于后期的数据挖掘及云计算。近年来,随着公交信息化建设的发展,部分城市公交信息发布网站丰富了信息查询内容,不仅提供线路公交的到站时间,还提供了到站车辆的车牌号,因此轨迹提取可充分利用车辆识别号信息,以取得更高的提取正确率。
发明内容
本发明提出了一种基于模糊去噪与模糊拼接的公交轨迹提取方法,充分利用了公交车牌号、到站时间以及历史经验数据等信息,降低了噪声对轨迹提取的影响,提高了轨迹提取的正确率和完整度。
本发明所采用的技术方案是:一种基于模糊去噪与模糊拼接的公交轨迹提取方法,其步骤为,
第一步:获取公交线路、到站车辆车牌号、到站站点和到站时间4种信息,并在数据库中将上述4种信息进行数值化,记j为数据集中第j条记录,则公交线路(上下行线视为2条不同的公交线路)数值化为索引值Lj(从1开始索引,不同的线路索引值不同),车牌号数值化为索引值Mj(不同线路的车牌号索引值均从1开始,不同车牌号索引值不同),到站站点按到站顺序数值化为索引值Ij(起始站索引值为1),到站时间按午夜00:00:00为起始时间,以分钟为单位数值化为Tj,则信息矩阵G的第j条记录Gj可表达为Gj=[Tj,Ij,Mj,Lj],若G共有N条记录,则G是N×4的信息矩阵。信息矩阵G(m,l)可从G中提取,具体为:
G(m,l)={[Tj,Ij]|Gj=[Tj,Ij,Mj,Lj]∈G,Mj=m,Lj=l},
即G(m,l)系G中以车牌索引值m和线路索引值l为筛选条件的信息集,并降维成仅保留到站时间Tj和到站站点索引Ij的二维信息矩阵。
第二步:根据公交站点间行驶时间的历史数据统计经验,获得模糊运算矩阵CM,并通过模糊运算矩阵CM从信息矩阵G(m,l)中提取轨迹片段集
模糊运算矩阵的参数值如下:
>
定义u(t)为关于单位有向行驶时间t的五边形同班次模糊隶属度函数,u(t)的形状由数轴上从小到大排序的五个点c1,c2,…,c5确定,具体定义如下:
>
令
>
定义Uik为到站信息
(A1)计算站距离n=|Ii-Ik|,若n大于CM行数,则u(t)的5个参数c1,c2,,c5由CM最后一行的5个数值给定;否则u(t)的5个参数由CM的第n行给定。
(A2)由公式(1)和(2)计算
定义U为信息矩阵G(m,l)的同班次模糊隶属度矩阵,记M为信息矩阵G(m,l)的总行数,则
定义umin为判断两个到站信息
轨迹片段集
(B1)根据模糊运算矩阵CM,计算信息矩阵G(m,l)的同班次模糊隶属度矩阵U的第1对角线的逻辑向量V(1),记V(1)第i个元素为
(B2)根据V(1)将G(m,l)分割成轨迹片段集
(B2.1)初始化
(B2.2)若V(1)值全为1,则
(B2.3)从索引值Is开始遍历V(1),取出第1个值为1的索引并赋给Ip,更新Is=Ip;通过Ip自增遍历V(1)直至取到值为0的元素,更新Ie=Ip,若Ip已遍历至V(1)最后一个数据依然未取到值为0数,则更新Ie=Ip+1;取出信息矩阵G(m,l)中第Is行至第Ie行的数据,作为第j个轨迹片段并记为
(B2.4)若Is小于等于V(1)向量长度,且自Is至尾部的V(1)数据不全为0,跳至步骤(B2.3),否则继续执行步骤(B2.5);若Is大于V(1)向量长度,执行步骤(B2.5);
(B2.5)取R(m,l)为G(m,l)中不包含
(B2.6)输出
第三步:对轨迹片段集
在实际数据处理中,由于噪声的存在,轨迹片段集
为了更好地描述轨迹片段拼接和轨迹去噪,定义S(m,l)为轨迹片段集
定义G为泛指一轨迹片段,UG为通过模糊运算矩阵CM对G计算的同班次模糊隶属度矩阵,
轨迹去噪算法。记
(C1)初始化
(C2)通过UG和同一班次的模糊隶属度阀值umin计算轨迹片段G的噪声指标向量
(C3)取
(C4)取出
(C5)从G中取出第k*个数据加入
(C6)若G的元素个数大于1,取
(C7)输出
模糊拼接规则:若轨迹片段集
>
且
在公式(3)中,
定义UF为轨迹片段集
>
其中,
模糊拼接算法。将
(D1)由轨迹片段集
(D2)若UF=0,跳至步骤(D5);否则继续执行步骤(D3);
(D3)取UF的最大元素记为
(D4)对
(D5)设置无噪声班次轨迹信息矩阵
本发明的有益效果是:本发明提出了五边形同班次模糊隶属度函数u(t),用于度量两个到站信息属于同一班次轨迹的可能性,该函数相比三角形函数、梯形函数、高斯函数及Bell函数等传统隶属度函数,在刻画分段区间形状上具有更强的灵活性,适用于无需求导(无函数光滑性要求)的场合。在u(t)的基础上,提出模糊运算矩阵CM,使得u(t)在不同的站距下具有不同的函数形状,充分考虑了单站距行驶时间比多站距平均行驶时间波动大的特性,在轨迹去噪及轨迹拼接中具有更强的鲁棒性。本发明提出的轨迹去噪算法中,通过引入噪声指标向量
附图说明
图1是本发明中公交轨迹提取方法总流程图。
图2是本发明中A系列步骤流程图。
图3是本发明中B系列步骤流程图。
图4是本发明中C系列步骤流程图。
图5是本发明中D系列步骤流程图。
图6(A)、图6(B)、图6(C)、图6(D)是本发明中公交到站信息查询系统网页截图(数据源)。
图7是本发明中实施案例2处理前含噪声的公交轨迹时空图。
图8是本发明中实施案例2轨迹去噪后的公交轨迹时空图。
图9是本发明中实施案例3表2数据处理前的公交轨迹时空图。
图10是本发明中实施案例3表2数据处理后的公交轨迹时空图。
图11是本发明中实施案例3表1数据处理后的公交轨迹时空图。
具体实施方式
为了使本发明的内容更容易被理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,
实施案例1:
公交轨迹提取步骤如图1所示,首先采集公交信息发布网站上的公交到站信息,生成公交到站信息矩阵G,根据线路索引号l和车辆在线路中的索引号m,从G中提取特定车辆的到站信息矩阵G(m,l);按图2所示A系列步骤,通过模糊运算矩阵CM,生成G(m,l)的同班次模糊隶属度矩阵U,并按图3所示的B系列步骤将G(m,l)分割成轨迹片段集
图6是苏州公交实时到站信息网站对两条线路在不同时刻下的查询结果截图,假设线路10(北线)在数据库中的线路索引号为1,线路10(南线)的线路索引号为2,车牌尾号为3E853和3D973的车辆在线路10(北线)中的车牌索引号对应值分别为1和2,与此相类似,车牌尾号为3E832和3E856的车辆在线路10(南线)中的车牌索引号分别为1和2。实施案例1结合图6的信息,给出轨迹的提取实施过程。
第一步:获取公交到站信息,生成指定线路及车辆的信息矩阵G(m,l)。根据信息矩阵定义,G中第j行的信息Gj可表达为Gj=[Tj,Ij,Mj,Lj],其中Tj是以00:00:00为基准以分钟为单位的到站时间,Ij是以始发站开始计数的站点索引,Mj是车辆相对于所在线路的索引号,Lj为线路索引号,则图6对应的到站信息矩阵G可表达为:
>
其中矩阵右上标T表示矩阵的转置运算。从信息矩阵G中提取线路10(北线)车牌尾号为3E853的信息集,即取l=1,m=1的G(m,l)信息矩阵,可得:
>
第二步:通过模糊运算矩阵CM,从l=1,m=1信息矩阵G(m,l)中提取轨迹片段集
轨迹片段集
(B1)根据模糊运算矩阵CM,结合图2和图3,计算G(m,l)的同班次模糊隶属度矩阵U的第1对角线的逻辑向量V(1)。G(m,l)为3×3的矩阵,由定义知,V(1)由U12和U23构造。U12由G(m,l)中第1行和第2行到站信息计算获得,其单位有向行驶时间t=(938.3-935.1)/(4-3)=3.2,站距n=4-3=1,因此采用CM中的第1行作为同班次模糊隶属度函数u(t)的5个参数,即c1=0.2,c2=0.5,c3=2,c4=16和c5=25,根据公式(1)定义:
>
可得u(t)=0.957(保留3位小数的结果),即U12=0.957,同理可得U23=0.6。设置同一班次的模糊隶属度阀值umin=0.3,根据V(1)第i个元素Vi(1)的取值为Uii+1≥umin的逻辑值,则有V(1)=[1,1]T。
(B2)根据V(1)将G(m,l)分割成轨迹片段集
第三步:对l=1,m=1的轨迹片段集
>
针对本实施案例,在图4所示的去噪算法中,拼接的轨迹G即为G(m,l)本身,因此对应的同班次模糊隶属度矩阵UG=U,G的噪声指标向量
实施案例2
针对本发明提出的轨迹去噪算法,给出含有较多噪声的某公交到站信息(如表1所示,来自实际采集数据)的去噪实施过程。假定表1的数据是一个轨迹片段G所对应的到站信息,图7为表1所列数据的公交到站时空图,如图所示,序号8数据、序号14数据是噪声数据,应在轨迹中剔除,序号15与序号16的数据到达站点为同一站点,应从中剔除1个,序号1-5的数据呈现逆向行驶轨迹,应全部或部分剔除。
表1实施案例2某公交车辆的到站信息
轨迹去噪算法。记
(C1)初始化
(C2)通过UG和同一班次的模糊隶属度阀值umin计算轨迹片段G的噪声指标向量
(C3)取
(C4)取出
(C5)从G中取出第k*个数据加入
(C6)若G的元素个数大于1,取
(C7)输出
在轨迹去噪过程中,首次实施步骤(C2)时,
>
则根据步骤(C3)和(C4),得k*=14,因此序号14的数据首先被作为噪声加入噪声数据集
>
在第二次循环中根据步骤(C3)和(C4)可找出序号5噪声数据。实施案例2的去噪过程共经历8次循环,前7次循环在每次循环中找出1个噪声数据(噪声剔除顺序为序号14,序号5,序号4,序号8,序号3,序号2和序号16),第8次循环得到全为0的
实施案例2仅仅是针对本发明的一个环节(轨迹去噪)进行算法演示,即将表1中的轨迹数据视为一个轨迹片段的数据,直接应用轨迹去噪算法进行去噪,用于验证去噪的效果,忽略了本发明中的轨迹片段分割和模糊拼接过程。因此本实施案例的处理结果不是最终的结果,从而导致序号1的数据被视为非噪声数据,若要取得完整的处理结果,见实施案例3。
实施案例3
某公交的到站信息如表2所示(来自实际采集数据),即表2的数据与某特定公交车辆的到站信息矩阵G(m,l)对应,该信息矩阵的时空图如图9所示。本实施案例结合表2数据,给出从G(m,l)提取轨迹片段集
第一步:获取公交到站信息,生成以车牌号索引值m以及线路索引值l为分割依据的到站信息矩阵G(m,l)。信息矩阵G(m,l)的信息即为表2所对应的公交到站信息。
第二步:通过模糊运算矩阵CM,从信息矩阵G(m,l)中提取轨迹片段集
表2实施案例3某公交车辆的到站信息
如图3流程图所示,轨迹片段集
(B1)根据模糊运算矩阵CM,计算G(m,l)的同班次模糊隶属度矩阵U的第1对角线的逻辑向量V(1),记V(1)第i个元素为V(1),则有:若Uii+1≥umin(Uii+1为U中第i行第i+1列元素),Vi(1)=1;若Uii+1<umin,Vi(1)=0。在本实施案例中umin=0.3,G(m,l)包含62条到站信息,则对应的V(1)向量长度为61,由公式(1)和逻辑判断可得V(1)的值,具体见表3所示。
表3实施案例3表2数据的逻辑向量值
(B2)根据V(1)将G(m,l)分割成轨迹片段集
(B2.1)初始化
(B2.2)若V(1)值全为1,则
(B2.3)从索引值Is开始遍历V(1),取出第1个值为1的索引并赋给Ip,更新Is=Ip;通过Ip自增遍历V(1)直至取到值为0的元素,更新Ie=Ip,若Ip已遍历至V(1)最后一个数据依然未取到值为0数,则更新Ie=Ip+1;取出G(m,l)中第Is行至第Ie行的数据,作为第j个轨迹片段并记为
(B2.4)若Is小于等于V(1)向量长度,且自Is至尾部的V(1)数据不全为0,跳至步骤(B2.3),否则继续执行步骤(B2.5);若Is大于V(1)向量长度,执行步骤(B2.5);
(B2.5)取R(m,l)为G(m,l)中不包含
(B2.6)输出
根据步骤B2可得,G(m,l)中第1-12个数据为j=1的轨迹片段
第三步:对轨迹片段集
无噪声班次轨迹信息矩阵S(m,l)的生成由轨迹去噪算法和模糊拼接算法两个核心算法实现。
轨迹去噪算法。记
(C1)初始化
(C2)通过UG和同一班次的模糊隶属度阀值umin计算轨迹片段G的噪声指标向量
(C3)取
(C4)取出
(C5)从G中取出第k*个数据加入
(C6)若G的元素个数大于1,取
(C7)输出
模糊拼接算法的实现:将
(D1)由轨迹片段集
(D2)若UF=0,跳至步骤(D5);否则继续执行步骤(D3);
(D3)取UF的最大元素记为
(D4)对
(D5)设置无噪声班次轨迹信息矩阵
在步骤(D1)中,由模糊拼接规则和公式(4)计算UF,其计算过程使用轨迹去噪算法对轨迹片段集
(E1)首先将G(2)信息矩阵合并到G(1)信息矩阵的末行构成新信息矩阵G,即G=[G(1);G(2)],根据步骤(C1)及公式(1)和(2),可得UG;
(E2)根据umin=0.3和步骤(C2),计算可得
(E3)通过步骤(C4)知,集合{k}={12,13},由于UG第13行的行和值比第12行的行和值小,因此k*=13,将G中第13个数据删除,并将此数据加入噪声集
(E4)重回步骤(C2)根据更新后的UG计算
(E5)根据步骤(C3)判断可知噪声剔除已处理完毕,可根据步骤(C5)和(C6)输出
(E6)由于
UF其它值的计算过程类似于步骤(E1)-(E6),最终取得轨迹片段集
>
根据步骤(D2)-(D4),在模糊拼接算法中,优先将G(2)拼接至G(1)尾部,并将此去噪后的拼接轨迹(剔除第13个数据)重新赋给G(1);再将原G(4)拼接至G(3)尾部(剔除第61个数据)重新赋给G(3)。最终输出的无噪声班次轨迹信息矩阵S(m,l)包含两条轨迹,具体如图10所示,圆点数据(●)为无噪声班次轨迹1,方点数据(■)为无噪声班次轨迹2,标星数据(*)为噪声数据,噪声数据共有4个,分别为表2中序号为13,49,50和61的数据。
应用实施案例3所示的完整处理过程,对实施案例2(表1)的轨迹数据进行处理,则序号1-5的数据、序号8数据和序号14-15的数据在第二步轨迹片段集的提取过程中即被逻辑向量V(1)处理为噪声数据。实施案例2的最终处理结果如图11所示,其中黑底白字的为无噪声同班次轨迹数据,白底黑字的为噪声数据。
附图所描述的实施例仅是本发明的优选实施方式,而并非对本发明的保护范围的限定,任何基于本发明精神所做的改进都理应在本发明保护范围之内。
机译: 基于模糊熵的噪声信号处理方法和迭代奇异谱分析软阈值去噪方法
机译: 基于模糊熵的噪声信号处理方法和迭代奇异谱软阈值去噪方法
机译: 基于模糊熵的噪声信号处理方法和迭代奇异谱分析软阈值去噪方法