公开/公告号CN113240198A
专利类型发明专利
公开/公告日2021-08-10
原文格式PDF
申请/专利号CN202110630771.9
申请日2021-06-07
分类号G06Q10/04(20120101);G06Q10/06(20120101);G06F16/29(20190101);G06N3/04(20060101);
代理机构11562 北京东方盛凡知识产权代理事务所(普通合伙);
代理人贾耀淇
地址 730000 甘肃省兰州市城关区天水南路222号
入库时间 2023-06-19 12:10:19
技术领域
本发明涉及船舶轨迹智能预测技术领域,特别是涉及一种基于TCN模型的港口船舶轨迹预测方法。
背景技术
在经济快速发展的情况下,航运业迎来了巨大的变化,船舶数量不断地增长,由此产生了很多航运密切的区域。船舶数量的激增虽然带来了海上贸易的繁荣,但容易产生水上交通安全问题:航线负担过重,航道更加拥挤,由于船舶自身问题和人为因素产生的事故时有发生,对船员和乘客的生命财产安全造成巨大的威胁。因此,对船舶必须进行有效的监控,及时发现船舶的异常行为,降低水上交通事故的风险,成为有关人员研究的重点问题。
三层BP神经网络建立船舶航行动态预测模型,对普通海域进行未来一分钟在线动态经纬度预测,虽然预测精度满足需求,但未预测航速、航向等动态特征。采用BP神经网络进行包括航速、航向在内的未来一分钟预测,但是预测时长过短,且针对复杂轨迹预测问题,BP神经网络难以学习。随着LSTM在时间序列预测任务上的热度不断提升,船舶轨迹预测方面也出现了各种改进LSTM预测模型,Miao Gao等于2018年提出的基于双向LSTM船舶轨迹预测模型、Mengzhen Ding等于2020年提出的基于变分自编码器的VLSTM模型,均实现了包含位置、航速、航向在内的较长时间轨迹迭代预测,其经纬度预测精度较LSTM有所提升。但是LSTM及其改进模型只能实现一步预测,要实现较长时间的多步多变量轨迹预测,需多次迭代预测,预测误差也会在迭代过程中累积。现有的航行轨迹预测研究均是针对普通海域,对港口区域的轨迹预测研究甚少。港口区域与普通海域不同之处在于:在相对辽阔的普通海域,船舶航行自由度高,航速及航向变化平缓,运动模式相对单一,而在港口区域,船舶往来频繁,航行受港口交通状态及船舶调度指挥影响,使得运动模式复杂多变,航速及航向变化频繁,这就使得港口区域的船舶轨迹预测相比普通海域来说,难度有所加大,研究方法也有待更深一步探究。
发明内容
本发明利用特定结构的卷积神经网络-时序卷积网络从空间角度对轨迹序列进行特征提取,构建了港口船舶轨迹预测模型,实现了对船舶航行轨迹的准确多步预测。
为实现上述目的,本发明提供了如下方案:
一种基于TCN模型的港口船舶轨迹预测方法,包括以下步骤:
S1、获取港口AIS数据,并对获取的港口AIS数据进行预处理,获得轨迹预测数据集;
S2、基于扩张因果卷积和残差连接,构建时序卷积块,通过所述时序卷积块堆叠,以及一维卷积层构建TCN模型,将所述TCN模型预测的单步输出作为下一时刻的输入,不断迭代实现多步轨迹预测,构建基于TCN的港口船舶轨迹预测模型;
S3、通过平均绝对误差、均方误差、拟合优度三个指标来评价所述TCN模型的预测效果,得到预测结果。
优选地,S2中,所述构建TCN港口船舶轨迹多步预测模型的具体步骤包括:
S1.1、定义以时间间隔作为船舶航行轨迹的特征,则其在t时刻的输入轨迹特征X(t)为:
X(t)={ΔTime
预测的t+1时刻输出轨迹特征Y(t)表示为:
Y(t+1)={ΔTime
S1.2、将连续L个时刻的船舶轨迹特征X(t-L+1)、…、X(t-1)和所述X(t)作为所述TCN模型的输入,并将输入数据处理成所述TCN模型的输入形式,预测输出t+1时刻的轨迹特征Y(t+1);
S1.3、将所述t+1时刻的轨迹特征Y(t+1)与船舶类型特征拼接进行更新,同所述X(t-L+2)、…、X(t-1)、X(t-1)构造成下一时刻预测的输入序列,进行t+2时刻的轨迹预测,如此依次迭代,构建基于TCN的港口船舶轨迹预测模型。
优选地,S2中,所述时序卷积块包括两层扩张因果卷积、两层非线性映射以及一次残差连接。
优选地,所述非线性映射采用Leaky Relu激活函数,每层时序卷积层中的扩张因果卷积后均加入WeightNorm对权重进行归一化处理,还加入了Dropout层,用于正则化网络,减轻过拟合现象。
优选地,所述TCN模型包括三个时序卷积块以及一个一维卷积层,用于构建长期记忆,使所述TCN模型产生和输入序列等长的输出序列。
优选地,所述TCN模型的输入特征还包括:时间间隔、经纬度、对地航速、对地航向、船舶类型。
优选地,所述TCN港口船舶轨迹预测模型中的优化器采用采用Adam函数。
优选地,所述TCN港口船舶轨迹预测模型通过梯度裁剪策略,设定梯度阈值,限制梯度上限,用于避免梯度爆炸现象。
优选地,所述TCN港口船舶轨迹预测模型中的权值初始化采用He初始化替代常规的服从正态分布的初始化,用于确保每一层的输入输出方差不变。
本发明的有益效果为:
本发明构建的基于TCN的船舶轨迹预测模型,相比于同为多步迭代的港口轨迹预测模型来说,预测精度更高,证明了特定形式的卷积神经网络TCN同样适用于船舶轨迹预测这类时序预测任务,为港口船舶轨迹预测提供更多模型结构创新的思路,在实际应用中,为港口安全生产及高效管理提供更精准的技术支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图;
图2为本发明时序卷积块构成示意图;
图3为本发明实施例中LSTM模型训练loss曲线示意图;
图4为本发明实施例中LSTM模型不同时间步预测绝对误差示意图;
图5为本发明TCN模型训练loss曲线;
图6为本发明TCN和LSTM迭代预测误差曲线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提供一种基于TCN模型的港口船舶轨迹预测方法(如图1所示),包括以下步骤:
S1、获取港口AIS数据,并对获取的港口AIS数据进行预处理,获得轨迹预测可用数据集;
S2、基于扩张因果卷积和残差连接,构建时序卷积块,通过所述时序卷积块堆叠,以及一维卷积层构建TCN模型,将所述TCN模型预测的单步输出作为下一时刻的输入,不断迭代实现多步轨迹预测,构建基于TCN的港口船舶轨迹预测模型;
S3、通过平均绝对误差、均方误差、拟合优度三个指标来评价所述TCN模型的预测效果,得到预测结果。
进一步优化方案,所述构建TCN港口船舶轨迹预测模型的具体步骤包括:
S1.1、将时间间隔作为船舶航行轨迹的特征,其在t时刻的输入轨迹特征X(t)为:
X(t)={ΔTime
预测的t+1时刻输出轨迹特征Y(t)表示为:
Y(t+1)={ΔTime
S1.2、将连续L个时刻的船舶轨迹特征X(t-L+1)、…、X(t-1)和所述X(t)作为所述TCN模型的输入,并将输入数据处理成所述TCN模型的输入形式,预测输出t+1时刻的轨迹特征Y(t+1);
S1.3、将所述t+1时刻的轨迹特征Y(t+1)与船舶类型特征拼接进行更新,同所述X(t-L+2)、…、X(t-1)、X(t-1)构造成下一时刻预测的输入序列,进行t+2时刻的轨迹预测,如此依次迭代,构建基于TCN的港口船舶轨迹预测模型。
进一步优化方案,所述时序卷积块包括两层扩张因果卷积、两层非线性映射以及一次残差连接,如附图2所示。通过多个时序卷积块的堆叠,不仅可以加深网络深度,一定程度上提升了预测精度,其时序卷积层的并行运算,使得模型计算速度更快。
图2中k表示第k个时序卷积层,
进一步优化方案,所述TCN模型包括三个时序卷积块以及一个一维卷积层,用于构建长期记忆,使所述TCN模型产生和输入序列等长的输出序列。
通过3个时序卷积块堆叠,最后接一个一维卷积层替代常规的全连接层,一是有助于感受整个输入序列的信息帮助构建长期记忆,二是可以使TCN产生和输入序列等长得输出序列,通过此模型结构实现单步轨迹特征预测输出。该模型输入特征为时间间隔、经纬度、对地航速、对地航向、船舶类型,但需要将输入数据处理成适合TCN模型的输入形式:(Sample,Feature,Timestep),模型输出即为下一时刻的轨迹特征:时间间隔、经度、纬度、对地航速、对地航向。
在此模型中,优化器采用Adam函数,其有着收敛速度快、调参容易的优点;此外,为了解决模型可能出现的梯度爆炸或梯度弥散问题,一是采用了梯度裁剪(GradientClipping)策略,即设定梯度阈值,限制梯度上限,有效避免梯度爆炸;二是权值初始化方式用He初始化替代常规的服从正态分布的初始化,He初始化方法意义在于当模型使用LeakyReLU激活函数时,确保每一层的输入输出方差不变,防止输出趋向于0,从而避免梯度弥散情况。
为了验证本发明的技术效果,在本实施例中,将基于LSTM港口船舶轨迹预测模型与本发明TCN港口船舶轨迹预测模型进行对比分析。
和TCN港口船舶轨迹预测模型一样,LSTM港口船舶轨迹预测模型也是将LSTM模型预测的单步输出作为下一时刻的输入,进而不断迭代进行多步轨迹预测,最终构建基于LSTM港口船舶轨迹预测模型。
首先配置实验环境和模型评价指标:
1.实验环境
实验环境包括软件配置和硬件配置两部分,配置信息如表1所示:
表1
2.模型评价指标
LSTM轨迹预测和TCN轨迹预测模型采用平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Square Error,MSE)及拟合优度(R
其中y
基于构建的LSTM网络模型进行单步轨迹预测实验,训练集、验证集和测试集划分按照8:1:1的比例,优化器采用Adam,损失函数采用MSE,评价标准为MAE、MSE和R
由附图3可知,loss为损失函数MSE,Epoch为训练轮次,可以看出,LSTM模型的训练集和验证集loss在前三个Epoch内不断减小,说明模型在此阶段正处于学习阶段,而后loss曲线趋于平稳不再下降,说明模型已收敛,模型训练完成,使用该训练好的模型在测试集上进行单步轨迹预测,得到预测绝对误差MAE为0.031234,其中单个特征的预测性能用三个评价指标衡量结果如表2所示:
表2
由表2可知,基于LSTM的港口船舶轨迹预测模型在对纬度、经度、对地航速、对地航向四个特征进行单步预测时均能取得较好的效果,预测的绝对误差MAE分别为0.0075889、0.0088575、0.0170881、0.0213580,纬度和经度的预测确定系数R
在时间序列预测任务中,LSTM预测效果很大程度上依赖于时间步的大小,通俗理解即要预测的值与前多少个时间点的信息有关系,时间步太小,提供的信息量太少影响预测精度。同时时间步也并不是越大预测效果越好,虽然时间步越大其提供的信息量越大,但是存在时间点越往前的信息与预测时刻点的信息关联越小,超过一定时间步再往前的历史时间信息为无用冗余信息,对预测精度的提升并无帮助,而且对于LSTM模型来说,时间步长越长,梯度消失或爆炸的风险也就越高。
对LSTM模型时间步参数的设置是根据不同时间步下的实验结果选取的,对时间步在[3,9]之间取整数,每个时间步进行多次实验,实验结果用MAE评估,得到不同时间步下的平均绝对预测误差如附图4所示,可知,时间步取6时预测误差最小。
基于TCN的港口船舶轨迹预测实验结果分析:
1.TCN单步预测分析
基于构建的TCN模型进行单步船舶航行轨迹预测实验,同LSTM单步预测模型一样,依旧按照8:1:1的比例将数据集划分为训练集、验证集和测试集,MSE作为损失函数,评价标准为MAE、MSE和R
由附图5可知,TCN模型的训练集和验证集loss在第一个Epoch急剧减小,在两个Epoch内loss曲线已趋于平稳达到收敛,其收敛速度较LSTM模型更快。使用该训练好的模型在测试集上进行单步轨迹预测,得到预测绝对误差MAE为0.0285365,比LSTM模型预测误差更低,其中单个特征的预测性能用MSE、MAE、R
表3
由表3可得TCN模型单步预测结果与表3-3的LSTM模型的单步预测结果对比可以看出,TCN模型对时间、纬度、经度、航速、航向的预测误差均低于LSTM模型对这五个特征的预测误差,确定系数也均有提高,其中对船舶实时纬度、经度预测的确定系数甚至达到了0.999以上,这也说明了TCN模型在单步船舶轨迹预测方面性能更佳。
基于LSTM、TCN模型的多步轨迹预测误差对比:
基于训练好的LSTM单步船舶轨迹预测模型和训练好的TCN单步船舶轨迹预测模型,通过递归迭代的方式进行未来8个连续时刻的轨迹预测实验,以探讨迭代次数也即预测步长N对模型轨迹预测误差的影响。在不同迭代次数下,两个模型预测的绝对误差MAE如附图6所示,由图6可看出,TCN和LSTM模型预测的绝对误差均随着迭代次数增加而增大,这是一个误差累积的过程。
对于港口船舶轨迹预测来说,由于港口范围小,因此对预测步长N的要求并不用太长,预测未来5个点接近6分钟的轨迹已基本满足港口需求,本发明关注预测步长N为5的船舶航行轨迹预测性能。用训练好的LSTM和TCN单步轨迹预测模型分别进行迭代预测,以实现对港口船舶未来连续5个时刻的轨迹点预测,五个轨迹点各个特征的预测评估结果如表4所示:
表4
从表中可以看出,两个模型均对船舶位置-纬度和经度实现了较高的预测精度,总体来看,基于TCN模型的未来五个时刻的轨迹点特征预测误差较基于LSTM模型预测的误差更低,拟合系数更高,轨迹预测性能更好。与表2和表3对比可以发现,经过多步迭代后,两个模型的预测误差均有所增大,拟合系数下降,说明了通过迭代预测的方式实现多步预测,会使得预测误差随着迭代次数的增加而累积增大,预测时间越长,误差越大,这使得基于LSTM和TCN的港口船舶轨迹预测模型只适用于未来较短时间内的轨迹预测。
本发明搭建了LSTM和TCN模型通过迭代预测的方式实现了未来五个时刻的船舶轨迹预测,并使用均方误差MSE、绝对误差MAE、确定系数R
本发明构建的基于TCN的船舶轨迹预测模型,相比于同为多步迭代的港口轨迹预测模型来说,预测精度更高,证明了特定形式的卷积神经网络TCN同样适用于船舶轨迹预测这类时序预测任务,为港口船舶轨迹预测提供更多模型结构创新的思路,在实际应用中,为港口安全生产及高效管理提供更精准的技术支撑。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
机译: 一种用于在停泊在港口的船舶上发电的系统,以及适用于该系统的港口和船舶。
机译: 用于移动设备的全球导航卫星系统(GNSS)轨迹预测方法,例如智能手机,涉及通过使用估计的卫星轨迹预测模型传播一组卫星轨迹扩展数据
机译: 港口船舶营运极限的预测系统及预测方法