首页> 中国专利> 一种TBM刀盘扭矩实时预测模型的处理方法、装置以及设备

一种TBM刀盘扭矩实时预测模型的处理方法、装置以及设备

摘要

本申请提供一种TBM刀盘扭矩实时预测模型的处理方法、装置以及设备,用于训练一预测效果更为稳定的TBM刀盘扭矩实时预测模型。方法包括:处理设备获取TBM在不同时间点的第一工作状态数据;处理设备对第一工作状态数据进行预处理,剔除与TBM刀盘扭矩无关的数据,得到第二工作状态数据;处理设备对第二工作状态数据进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数;处理设备将标注有对应特征参数的TBM刀盘扭矩,依次输入BLSTM模型,使得BLSTM模型以时序为基础预测下一时间段的TBM刀盘扭矩,实现正向传播,并依次根据BLSTM模型输出的TBM刀盘扭矩预测结果计算损失函数,以损失函数计算结果优化模型参数,实现反向传播,当达到训练条件时完成模型训练,得到TBM刀盘扭矩实时预测模型。

著录项

说明书

技术领域

本申请涉及工程领域,具体涉及一种TBM刀盘扭矩实时预测模型的处理方法、装置以及设备。

背景技术

公路铁路和跨流域调水工程的大规模建设,需要建设大量深埋长大隧道,全断面隧道掘进机(Tunnel Boring Machine,TBM)工法具有高效、经济、环保、施工扰动小等显著优势,已成为这些深埋长大隧道施工的首选和发展方向。然而,掘进过程地层复杂多变,掘进参数的选择和调整往往依靠人为经验,导致TBM掘进参数与地质条件不匹配,出现破岩效率低、刀盘刀具磨损严重、异常损毁、主轴承断裂甚至卡机、整机报废等灾害。

其中,刀盘扭矩是TBM重要的掘进参数之一,可提供刀盘破岩时所需的切削力,对破岩效率和岩-机相互作用具有重要影响,优化刀盘扭矩使其保持稳定性对刀盘应力、驱动电机具有良好的作用,有利于加快施工进度,减少机械损耗,降低施工成本,刀盘扭矩的预测对于避免刀盘受困,科学指导TBM掘进参数及时地进行适应性调整具有重要意义。

而在现有的相关技术的研究过程中,本申请发明人发现,尽管在TBM刀盘扭矩的预测处理中引入了刀盘扭矩预测模型,然而现有的刀盘扭矩预测模型,在实际应用中仍存在预测效果不稳定的情况,不利于后续展开的TBM工作。

发明内容

本申请提供一种TBM刀盘扭矩实时预测模型的处理方法、装置以及设备,用于训练一预测效果更为稳定的TBM刀盘扭矩实时预测模型。

第一方面,本申请提供了一种TBM刀盘扭矩实时预测模型的处理方法,方法包括:

处理设备获取TBM在不同时间点的第一工作状态数据,第一工作状态数据标注有对应的时间标识,第一工作状态数据包含TBM刀盘扭矩;

处理设备对第一工作状态数据进行预处理,剔除与TBM刀盘扭矩无关的数据,得到第二工作状态数据;

处理设备对第二工作状态数据进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数;

处理设备将标注有对应特征参数的TBM刀盘扭矩作为训练样本,依次输入双向长短期记忆模型(Bidirectional Long Short-Term Memory,BLSTM)模型,使得BLSTM模型以时序为基础预测下一时间段的TBM刀盘扭矩,实现正向传播,并依次根据BLSTM模型输出的TBM刀盘扭矩预测结果计算损失函数,以损失函数计算结果优化模型参数,实现反向传播,当达到训练条件时完成模型训练,得到TBM刀盘扭矩实时预测模型。

结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,处理设备对第二工作状态数据进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数,包括:

处理设备根据第一公式计算第二工作状态数据中,不同候选特征参数与TBM刀盘扭矩的样本相关系数r

处理设备根据第二公式计算不同候选特征参数与TBM刀盘扭矩的相关性评分,并保留前k个评分最高的候选特征参数作为与TBM刀盘扭矩相关的特征参数,第二公式包括:

其中,与TBM刀盘扭矩相关的特征参数包括电机扭矩之和T

结合本申请第一方面第一种可能的实现方式,在本申请第一方面第二种可能的实现方式中,处理设备对第一工作状态数据进行预处理,剔除与TBM刀盘扭矩无关的数据,得到第二工作状态数据,包括:

处理设备在第一预处理中,通过预先配置的掘进状态判别函数,剔除第一工作状态数据中无效的、与传感器异常相关的数据,掘进状态判别函数包括:

G=f(v

f(v

其中,T为TBM刀盘扭矩;

处理设备在第二预处理中,在第一预处理得到的工作状态数据中加入岩体现场贯入度指数FPI以及岩体可切削指数TPI的特征参数,并进行归一化处理,得到第二工作状态参数。

结合本申请第一方面,在本申请第一方面第三种可能的实现方式中,处理设备在BLSTM模型的训练过程中,方法还包括:

处理设备在每一轮的正向传播过程中,在丢弃(Dropout)算法下随机使得BLSTM模型的神经元失效;

以及,

处理设备在反向传播过程中,采用均方根传递(Root Mean Square Prop,RMSProp)优化器进行特征参数对应权重的处理。

结合本申请第一方面第三种可能的实现方式,在本申请第一方面第四种可能的实现方式中,处理设备在BLSTM模型的训练过程中,方法还包括:

处理设备结合贝叶斯优化算法以及K-flod交叉验证算法,对BLSTM模型超参数中的神经元个数m、RMSProp优化器的学习率lr、Dropout算法下Dropout层的随机失效概率dp进行超参数优化。

结合本申请第一方面,在本申请第一方面第五种可能的实现方式中,处理设备在BLSTM模型的训练过程中,方法还包括:

对于多个轮次的模型训练过程,处理设备根据早停算法(EarlyStopping)以及模型检查点算法(ModelCheckPoint),实现训练过程的优化,对比前后轮次的训练过程的预测能力,及判断当前轮次的训练过程的训练轮次与模型检查点算法保存模型的训练轮次之间的差值是否超过设定的容忍值,确定最优的模型训练结果。

结合本申请第一方面,在本申请第一方面第六种可能的实现方式中,处理设备将标注有对应特征参数的TBM刀盘扭矩作为训练样本,依次输入BLSTM模型,包括:

处理设备在第二工作状态参数中,提取TBM刀盘扭矩的波动周期;

处理设备在每轮训练过程中,在将标注有对应特征参数的TBM刀盘扭矩的时间序列中,挑选出2至12个扭矩波动周期的时长跨度的时间序列作为训练样本,依次输入BLSTM模型。

第二方面,本申请提供了一种TBM刀盘扭矩实时预测模型的处理装置,装置包括:

获取单元,用于获取TBM在不同时间点的第一工作状态数据,第一工作状态数据标注有对应的时间标识,第一工作状态数据包含TBM刀盘扭矩;

预处理单元,用于对第一工作状态数据进行预处理,剔除与TBM刀盘扭矩无关的数据,得到第二工作状态数据;

特征提取单元,用于对第二工作状态数据进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数;

训练单元,用于将标注有对应特征参数的TBM刀盘扭矩作为训练样本,依次输入BLSTM模型,使得BLSTM模型以时序为基础预测下一时间段的TBM刀盘扭矩,实现正向传播,并依次根据BLSTM模型输出的TBM刀盘扭矩预测结果计算损失函数,以损失函数计算结果优化模型参数,实现反向传播,当达到训练条件时完成模型训练,得到TBM刀盘扭矩实时预测模型。

第三方面,本申请提供了一种TBM刀盘扭矩实时预测模型的处理设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。

第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。

从以上内容可得出,本申请具有以下的有益效果:

针对于TBM刀盘扭矩实时预测模型,本申请提出一种新的预测模型训练机制,首先在数据准备阶段获取TBM在不同时间点的第一工作状态数据,经过预处理,剔除与TBM刀盘扭矩无关的数据后进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数,再将标注有对应特征参数的TBM刀盘扭矩作为训练样本,训练BLSTM模型,在该训练过程中,尤其是将TBM刀盘扭矩看作是一种具有时序特征的数据进行训练,如此相比于现有技术中的TBM刀盘扭矩实时预测模型,本申请训练得到的TBM刀盘扭矩实时预测模型不仅是基于给定的特征参数进行适配的TBM刀盘扭矩的预测,并且还可结合历史特征参数及其历史TBM刀盘扭矩,对TBM刀盘扭矩进行更为稳定的、系统的精确预测,从而为TBM运行提供更为稳定的精确掘进控制参数指导。

附图说明

图1为本申请TBM刀盘扭矩实时预测模型的处理方法的一种流程示意图;

图2为本申请示例性工程布置的一种场景示意图;

图3为现有LSTM模型的一种结构示意图;

图4为本申请BLSTM算法计算过程的一种场景示意图;

图5为本申请Dropout算法的一种场景示意图;

图6为本申请模型训练的一种场景示意图;

图7为本申请K-flod交叉验证算法的一种场景示意图;

图8为本申请超参数优化处理的一种场景示意图;

图9为本申请模型训练的又一种场景示意图;

图10为本申请MSE和MAE在训练过程中的变化的一种场景示意图;

图11为本申请对比部分实测值与预测值的一种场景示意图;

图12为本申请全部实测值与预测值统计分析的一种场景示意图;

图13-16分别为本申请关于Ⅱ类、Ⅲ类、Ⅳ类以及Ⅴ类围岩,对比部分实测值与预测值的一种场景示意图;

图17-20分别为本申请关于Ⅱ类、Ⅲ类、Ⅳ类以及Ⅴ类围岩,全部实测值与预测值的统计分析的一种场景示意图;

图21为本申请TBM刀盘扭矩实时预测模型的处理装置的一种结构示意图;

图22为本申请TBM刀盘扭矩实时预测模型的处理设备的一种结构示意图。

具体实施方式

在介绍本申请提供的TBM刀盘扭矩实时预测模型的处理方法之前,首先介绍本申请所涉及的背景内容。

本申请提供的TBM刀盘扭矩实时预测模型的处理方法、装置以及计算机可读存储介质,应用于TBM刀盘扭矩实时预测模型的处理设备,可用于训练一预测效果更为稳定的TBM刀盘扭矩实时预测模型。

本申请提及的TBM刀盘扭矩实时预测模型的处理方法,其执行主体可以为TBM刀盘扭矩实时预测模型的处理装置,或者集成了该装置的服务器、物理主机、用户设备(UserEquipment,UE)、TBM控制设备甚至TBM本身等不同类型的TBM刀盘扭矩实时预测模型的处理设备。其中,TBM刀盘扭矩实时预测模型的处理装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、台式电脑或者个人数字助理(PersonalDigital Assistant,PDA)等终端设备,TBM刀盘扭矩实时预测模型的处理设备还可以通过设备集群的方式设置。

下面,开始介绍本申请提供的TBM刀盘扭矩实时预测模型的处理方法。

首先,参阅图1,图1示出了本申请TBM刀盘扭矩实时预测模型的处理方法的一种流程示意图,本申请提供的TBM刀盘扭矩实时预测模型的处理方法,具体可包括如下步骤:

步骤S101,处理设备获取TBM在不同时间点的第一工作状态数据,第一工作状态数据标注有对应的时间标识,第一工作状态数据包含TBM刀盘扭矩;

可以理解,对于TBM的第一工作状态数据,其可以理解为TBM的原始工作状态数据。

而对于第一工作状态数据的获取,既可以为直接在TBM的工作过程中,对TBM的工作状态进行监测得到,也可以为从TBM的设备本身提取得到,也可以是从存储有TBM的工作状态数据的其他设备处提取得到,具体可随实际情况调整。

与此同时,在本申请中,由于是将TBM刀盘扭矩看作是一种时序特征的时序数据,因此,对于用于训练的样本TBM刀盘扭矩以及相关的样本工作状态数据,应当都具有时间标识,该时间标识可以理解为时间戳,用于标识数据对应时间点。

可以理解,对于获取到的工作状态数据,其本身可以直接配置有时间标识,或者,在获取过程中,工作状态数据可能未直接配置有时间标识,因此,还可以涉及到对于时间标识的标注处理。

举例而言,在实际应用中,对于训练用的初始工作状态数据的获取,还可存在一定的筛选处理,以便具有更好的样本质量及其训练效果。

例如,可以从TBM处于稳定掘进阶段的工作数据中,提取出对应Ⅱ、Ⅲ、Ⅵ、Ⅴ类围岩比例符合预设比例范围的掘进段的工作状态数据,作为该第一工状态数据。

可以理解,在该设置下,对于TBM可能的处于不同环境的情况,该工作状态数据都具有较佳的表征效果。

以一组实例为例,对于某供水工程,其总干线全长110km,其中施工四标段总长度22955m,由桩号71+855m向48+900m掘进,其中钻爆法施工2757m,TBM施工20198m,最大埋深260m,其具体工程布置还可参考图2示出的本申请示例性工程布置的一种场景示意图。

四标段采用开敞式单对水平支撑TBM施工,变频电机驱动刀盘,开挖直径7.93m,刀盘安装滚刀55把,转速范围为0~7.6r/min,额定扭矩8420kN·m(@3.97r/min),最大总推力23060kN。

四标段岩体以花岗岩和石灰岩为主,采用水利水电HC法对围岩进行分类,TBM掘进段Ⅱ、Ⅲ、Ⅵ、Ⅴ类围岩占比分别为5.26%,67.88%,22.47%,4.39%。桩号为70+120m~68+990m,共计1110m的掘进段距离,TBM始发位置1381m,TBM经过试掘阶段进入稳定掘进阶段,且该掘进段包含Ⅱ、Ⅲ、Ⅵ、Ⅴ类围岩(具体情况见下表1),各类围岩比例分别为5.41%,65.41%,24.41%,4.77%,与四标段TBM总掘进里程各类围岩比例相近,因此可选取该掘进段采集数据用于模型输入参数选取及训练。

表1-70+120m~68+990m围岩类别统计

步骤S102,处理设备对第一工作状态数据进行预处理,剔除与TBM刀盘扭矩无关的数据,得到第二工作状态数据;

在得到初始工作状态数据后,则可对其做预处理,以得到更为有效的、可更好地展开后续处理的工作状态数据。

可以理解,该预处理,主要是剔除无效数据,例如在TBM正常工作中参数值不应为0的数据,除了数值异常的数据,也可以剔除出现乱码、空值等异常的数据。

经过了预处理的数据清洗后,则可投入后续的特征提取。

步骤S103,处理设备对第二工作状态数据进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数;

可以理解,此时的工作状态数据仍旧是原来的数据格式,而对于待训练的模型而言,中间则需要对数据格式进行进一步的转化,尤其是对于TBM刀盘扭矩预测处理中涉及的特定数据的转化。

此时,则可引入特征参数的提取处理,可以理解,该特征参数的提取处理用于从工作状态数据中提取出对于TBM刀盘扭矩的预测具有贡献的参数,其在实际应用中,与TBM刀盘扭矩存在一定的逻辑关系,因此,在TBM刀盘扭矩的预测处理中,可以将TBM刀盘扭矩看作是一种因变量,将此处涉及的特征参数看作是一种自变量。

显然,此处所涉及的特征提取处理,不仅涉及到数据格式的转化,也涉及到特定数据的筛选,为后续的模型训练提供有价值的数据依据。

此外,预处理还可能是对样本的增强处理,以扩大样本的数据量,例如对扭矩较小的样本进行过采样或重采样,以增加扭矩较小样本的比例。

步骤S104,处理设备将标注有对应特征参数的TBM刀盘扭矩作为训练样本,依次输入BLSTM模型,使得BLSTM模型以时序为基础预测下一时间段的TBM刀盘扭矩,实现正向传播,并依次根据BLSTM模型输出的TBM刀盘扭矩预测结果计算损失函数,以损失函数计算结果优化模型参数,实现反向传播,当达到训练条件时完成模型训练,得到TBM刀盘扭矩实时预测模型。

可以理解,对于BLSTM模型,其是在长短期记忆人工神经网络(Long Short-TermMemory,LSTM)模型的基础上改进得到的。

LSTM模型,是一种循环神经网络,由输入门(Input Gate)、输出门(Output Gate)、遗忘门(Forget Gate)和细胞状态(Cell State)组成,可参考图3所示的现有LSTM模型的一种结构示意图。

与支持向量机(Support Vector Machines,SVR)、随机森林(Random Forests,RF)等神经网络仅基于同一时刻的输入参数预测同一时刻的输出参数相比,LSTM加入的门操作,可以提取一段连续时间序列不同时刻参数的关联信息,并用于预测未来时刻的输出参数,具有实时预测的能力,其中,LSTM各个门和细胞状态的更新过程如下式所示:

i

a

o

h

f

C

其中,σ为激活函数,W

基于LSTM,提出了LSTM的变种算法BLSTM,该算法在LSTM正向序列层的基础上增加了反向序列层,从输入参数中提取出来的用于预测的信息更全面,建立的模型更具有鲁棒性。

相比于回归树、回归森林、支持向量机等算法利用当前时刻的输入参数预测当前时刻的输出参数,BLSTM具有的实时预测能力,对于TBM提前作出预警和掘进参数的适应性调整则可更有工程应用意义。

BLSTM算法计算过程可参考图4所示的本申请BLSTM算法计算过程的一种场景示意图,从图4中可看出,正向序列层与反向序列层的输出拼接作为输出。

可以理解,在现有技术中,刀盘扭矩预测模型从建模方法来看也可以分为两类:一是基于传统统计回归分析方法,建立具体的数学模型;二是基于人工智能方法,建立黑箱子模型。传统统计回归分析方法基于对输入变量和输出变量的统计分析,对二者的关系进行近似假设,采用具体的数学函数描述二者的关系;人工智能方法使用样本训练模型,通过调整模型权重寻找输入输出参数的映射关系,建模过程不需要近似假设,也没有具体的数学函数,在大数据样本中建立的模型更优。上述基于回归树、回归森林、支持向量回归等人工智能方法建立的模型输出结果只取决于当前时刻的输入,没有考虑到之前时刻的参数信息,建立的模型无法实时预测未来时刻的刀盘扭矩。

而本申请则将TBM刀盘扭矩看作是一个时变参数,在实际运行中表现为时间序列特性,构建得到的TBM刀盘预测模型不仅可由于预测实时的TBM刀盘扭矩,更可结合时序特征预测未来的TBM刀盘扭矩。

总体来说,相比于现有技术中的TBM刀盘扭矩实时预测模型,本申请训练得到的TBM刀盘扭矩实时预测模型不仅是基于给定的特征参数进行适配的TBM刀盘扭矩的预测,并且还可结合历史特征参数及其历史TBM刀盘扭矩,对TBM刀盘扭矩进行更为稳定的、系统的精确预测,从而为TBM运行提供更为稳定的精确掘进控制参数指导。

此外,在进一步的实际应用中,本申请还提出多种优化方案,具体详见下文。

作为一种示例性的实现方式,在上述步骤S103涉及的特征提取处理中,本申请具体可采用Pearson、SelectKBest、f_regression、mutual_info_regression等算法,进行与TBM刀盘扭矩相关的特征参数的提取。

以SelectKBest算法为例,SelectKBest算法是一种单变量特征选择算法,该算法依次计算单个特征与输出参数的检验值,通过各个特征的检验值大小选择与输出变量相关性更大的特征,与递归消除法、主成分分析等多变量特征选择方法相比意义更明确,选择结果解释性更强,因此在机器学习中广泛应用。

具体的,SelectKBest算法的特征处理可包括:

根据第一公式计算第二工作状态数据中,不同候选特征参数与TBM刀盘扭矩的样本相关系数r

根据第二公式计算不同候选特征参数与TBM刀盘扭矩的相关性评分,并保留前k个评分最高的候选特征参数作为与TBM刀盘扭矩相关的特征参数,第二公式包括:

其中,本申请选取评分由高到低的前10个特征参数作为使用,具体的,筛选出的与TBM刀盘扭矩相关的特征参数,如下面表2示出的评分列表,包括电机扭矩之和T

表2-基于SelectKBest算法选择的评分最高的十个特征参数

进一步的,对于步骤S102中对于过滤异常数据的预处理,可以包括两个阶段,在第一预处理中,可以通过预先配置的掘进状态判别函数,剔除第一工作状态数据中无效的、与传感器异常相关的数据。

可以理解,在初步的预处理中,首先可以去除桩号、掘进参数设定值等明显与刀盘扭矩无关的参数。其次,考虑到TBM在掘进循环间存在大量无效数据,此时则可根据掘进时掘进参数均大于零的特点建立掘进状态判别函数,剔除掘进过程中传感器异常和掘进循环间记录的无效数据。

以上述的涉及的具体特征参数为例,可以针对这些特征参数进行预处理,在该情况下,掘进状态判别函数具体可以包括:

G=f(v

f(v

其中,T为TBM刀盘扭矩;

在第二预处理中,还可在第一预处理得到的工作状态数据中加入岩体现场贯入度指数(Field Penetration Index,FPI)以及岩体可切削指数(Torque Penetration Index,TPI)的特征参数,并进行归一化处理,得到第二工作状态参数。

可以理解,FPI以及TPI是在特征参数的具体数值的基础上计算得到的,因此此时在计算得到后,则可作为有效数据加入到工作状态参数中,作为数据的补充。

其中,FPI表示单位贯入度所需单把滚刀的推力,TPI表示单位贯入度所需的单把滚刀与岩体的周向摩擦阻力和切削力,二者均可在一定程度上反应TBM掘进时的岩体条件,计算公式为:

FPI=F

TPI=T

其中,F

进一步的,还可将Fn和Tr的计算公式配置为:

式中,N为刀盘上安装的滚刀数量,D为TBM直径,F为总推进力,T为刀盘扭矩。

融合上述公式,则可得到FPI和TPI的计算公式为:

而对于归一化处理,其可以理解为消除不同特征参数量纲和数量级不同的情况,对后续特征选择和模型训练产生的不利影响所采取的处理,其可通过下式实现:

其中,x为特征参数数据集,i为特征参数种类,n为特征参数序号。

下面则继续对BLSTM模型在具体训练过程中可以采用的优化方案进行介绍。

在实际应用中,过拟合问题是神经网络模型中的常见问题,其会导致模型的泛化能力降低,针对该问题,作为又一种适于实用的实现方式,可结合图5示出的本申请Dropout算法的一种场景示意图以及图6示出的本申请模型训练的一种场景示意图,本申请在BLSTM模型的训练过程中,方法还可包括:

处理设备在每一轮的正向传播过程中,在Dropout算法下随机使得BLSTM模型的神经元失效。

可以理解,Dropout算法在每次训练时,都可按照一定比例,随机地让一部分神经元失效,使得每次参与训练的神经元不完全一致,权值的更新不再依赖于有固定关系神经元的共同作用,避免了某些特征仅在其它特定特征下才有效果的情况,可以有效改善过拟合问题,同时还可减少模型训练时间。

上述是从正向传播环节改善模型训练效果的,在实际应用中,本申请还可从反向传播入手,进一步改善模型训练效果。

作为又一种适于实用的实现方式,本申请还可在反向传播过程中,采用RMSProp优化器进行特征参数对应权重的处理。

可以理解,目前神经网络训练过程中常用的优化器包括随机梯度下降法(Stochastic gradient Descent,SGD)、标准动量优化算法(Momentum)和RMSProp算法等。其中,SGD计算速度快,但同时会引入噪声,使得权值更新容易陷入局部最优解;Momentum在SGD的基础上引入了一个记录历史梯度信息的动量,可以加速梯度下降;RMSProp则可更新权重时开方,使得较大梯度方向上的波动随之减小,加速梯度下降,同时RMSProp适合处理非平稳目标,适用于循环神经网络(RNN)及其变种,因此,本申请基于BLSTM的TBM刀盘扭矩实时预测模型具体可采用RMSProp优化器。

进一步的,本申请在模型训练过程中还可涉及到超参数优化,在实际应用中,超参数对神经网络模型的性能具有重要影响。作为又一种适于实用的实现方式,本申请具体可结合贝叶斯优化算法以及K-flod交叉验证算法,对BLSTM模型超参数中的神经元个数m、RMSProp优化器的学习率lr、Dropout算法下Dropout层的随机失效概率dp进行超参数优化。

其中,本申请认为,神经元个数m对于BLSTM模型的学习能力和学习速度具有重要影响;学习率lr可决定模型训练期间每次权重更新的量,对于模型的收敛速度和学习效果具有重要影响;随机失效概率dp则可决定Dropout算法防止模型过拟合的效果。

目前常用的超参数优化算法包括网格搜索(Grid Search)、随机搜索(RandomSearch)、贝叶斯优化(Bayesian Optimization)等。网格搜索在人为给定的超参数组合中寻找最优组合,优化结果受人为因素影响较大;随机搜索对超参数进行随机组合,选择性能最好的一组超参数,优化结果随机性较大。贝叶斯优化是一种自适应的超参数搜索方法,根据已经测试过的超参数组合建立优化超参数与优化目标的代理函数,通过该函数判断使优化目标更优的方向,指导新的超参数组合的选择,且测试过的超参数组合会加入历史数据库不断修正代理函数,使超参数组合与优化目标的映射关系越来越准确。基于上述对几种常用的超参数优化算法的比较,本申请具体采用贝叶斯优化作为超参数优化算法。其中,优化超参数个数的增加可能会使优化空间和优化耗时明显增大,因此本申请还可对关键超参数进行优化,且其数量不超过3个。

而对于模型的训练及其校验环节的处理,本申请则可引入K-flod交叉验证算法,可参考图7所示的本申请K-flod交叉验证算法的一种场景示意图,K-flod交叉验证算法将训练集平分为K份,每次用K-1份数据训练模型,用剩下的一份测试模型,循环进行K次训练和测试,将得到的K个平分的平均值作为该模型的最终评分,该算法可有效减小测试集划分的偶然性对模型性能评价的影响。

因此,融合上述两个优化方案,在实际应用中,本申请在进行模型训练时,可以以均方误差(Mean Square Error,MSE)为优化目标,使用贝叶斯和K-flod交叉验证算法的融合算法对m、lr和dp进行优化,以k为5的5折交叉验证为例,该融合的优化算法过程可以参考图8示出的本申请超参数优化处理的一种场景示意图。

具体的,可设定超参数寻优次数I为100,m的优化范围为[1,20],lr和dp的优化范围均为(0,1),得到的优化超参数组合(m,lr,dp)为(15,0.004128,0.113819)。

可以理解,BLSTM模型在训练过程中,一般是可以分为多轮的,与此同时,模型训练过程中训练轮次的设定对模型的预测能力有重要的影响,训练集中的所有样本训练一次称为一个训练轮次,即一个Epoch,训练轮次过小会导致模型学习不充分,预测能力较低;反之,会导致模型训练时间过长,且容易出现过拟合。

而针对于多轮的模型训练过程,考虑到上述问题,作为又一种适于实用的实现方式,本申请在BLSTM模型的训练过程中,还可包括:

对于不同轮次的模型训练过程,处理设备根据早停算法(Early Stopping)以及模型检查点算法(Model Check Point),融合不同轮次的模型训练结果。

具体来说,模型检查点算法(又可称为模型检验算法)在每个Epoch开始时,将完整训练集划分为训练集(train set)和验证集(validation set),使用训练集训练训练模型,然后使用验证集验证模型的预测能力P

早停算法检验当前训练轮次与模型检验算法保存模型的训练轮次之间的差值p,若p大于早停算法中给定的容忍度(Patience)Pat则停止继续训练,此时模型检验算法保存的模型即为最优模型。此处所涉及的训练过程,还可参考图9示出的本申请模型训练的又一种场景示意图。

在实际应用中,采用上述提出的基于多算法融合的训练过程对本文模型进行训练,本申请可将训练过程涉及的损失函数设为均方误差MSE,验证集预测性能评价指标为平均绝对误差(Mean Absolute Error,MAE)。根据相关文献研究经验,训练集与验证集的损失值和平均绝对误差在初始几十个训练轮次内就可以达到稳定状态,之后验证集损失值和平均绝对误差处于波动状态,出现较多的极小值,容忍度参数的作用是当验证集上出现极小值后检验之后一定训练轮次内是否出现更小的极小值。验证集上的一个平均绝对误差极小值若经过之后200个训练轮次内出现的数十个极小值检验仍为最小值,则可以认为在有限训练轮次内该极小值对应模型为最优模型,因此本申请考虑将容忍度设为200。最大训练轮次参数的作用是当模型训练集损失值已达到稳定,但无法满足容忍度参数的要求时及时停止训练。最大训练轮次设为1000足以保证训练集损失值达到稳定。

作为一种实例,训练过程中训练集损失值MSE、验证集损失值val_MSE、训练集平均绝对误差MAE和验证集平均绝对误差val_MAE的变化可参考图10示出的本申请MSE和MAE在训练过程中的变化的一种场景示意图。其中,最终训练轮次为268,可知训练轮次为68时得到最优模型。在训练68轮次之后,训练集上的MSE和MAE整体上仍有略微降低,但验证集上的val_MSE和val_MAE波动较大,但始终比训练轮次68的大,说明训练轮次68之后的模型均出现了一定程度的过拟合。因此,在训练轮次达到268而远未达到最大训练轮次1000前提前终止训练可以认为是合理的。

此外,本申请认为刀盘扭矩实测值在TBM稳定掘进过程中还可呈现波动变化,一个上升或下降波动周期均在5s左右,输出时间序列过大会导致模型收敛困难且预测精度降低,因此本申请选择一个波动周期(即时间步5s)作为输出时间序列,可以同时达到扭矩值和扭矩变化趋势的实时预测。

另一方面,BLSTM模型其实时预测依赖输入输出参数在时间序列上的连续性,若输入时间序列过小,模型提取信息不足,预测精度降低;若输入时间序列过大,与输出时间序列相隔较远的参数连续性减弱,模型收敛困难。

在该情况下,作为又一种示例性的实现方式,本申请则以TBM刀盘扭矩的扭矩波动周期为基础,约束每轮训练过程的涉及时长。

具体的,该设置是在模型的输入处理上体现的,其可包括:

在第二工作状态参数中,提取TBM刀盘扭矩的扭矩波动周期;

在每轮训练过程中,在将标注有对应特征参数的TBM刀盘扭矩的时间序列中,挑选出2至12个扭矩波动周期的时长跨度的时间序列作为训练样本,依次输入BLSTM模型。

可以理解,本申请具体以扭矩波动周期为间隔,分别以2~12个扭矩波动周期即输出时间序列长度的2~12倍为输入时间序列,测试不同输入时间序列验证集的损失值MSE和MAE与验证集的损失值val_MSE和val_MAE,作为一个实例,如下表3所示,四个对比指标MSE、val_MSE、MAE和val_MAE越小,则模型性能越好,将四个指标进行排序,值越小排名也越小,综合来看,输入时间序列为6个扭矩波动周期即30时较优,因此具体可以选择6个波动周期即时间步30作为输入时间序列。

表3-不同输入时间序列训练集和验证集上损失值和平均绝对误差对比

在完成本申请涉及的模型训练后,结合一组实例进行测试,使用MSE、MAE、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、决定系数(R2)、相关系数(r)、解释方差得分(Explain Variance Score,EVS)来评价模型预测效果,对应计算方法如下所示:

其中,y

对应的模型评价得分如下表4所示:

表4-模型评价得分

部分实测值与预测值对比参考图11示出的本申请对比部分实测值与预测值的一种场景示意图,全部实测值与预测值统计分析如图12示出的本申请全部实测值与预测值统计分析的一种场景示意图,统计预测值的误差分布如下表5所示:

表5-预测值误差统计

由表4和图12可知,94.33%的样本实时预测结果平均绝对百分误差在10%以内,且大部分误差在5%以内,实测值与预测值的决定系数和相关系数均达到0.95以上,表明基于BLSTM建立的神经网络模型具有很好的预测能力,适用于TBM刀盘扭矩的实时预测。

在完成模型训练后,则可投入实际应用,进行TBM刀盘扭矩的预测处理,可以理解,模型的输入参数可以为采集到的实时的或者预测得到的不同特征参数,输入模型后则可由BLSTM模型进行对应时间点的TBM刀盘扭矩的预测处理,稳定地为TBM运行提供更为稳定的精确掘进控制参数指导。

或者,TBM刀盘扭矩预测结果,还可以继续投入其他与TBM刀盘扭矩相关的特征参数的预测处理。

其中,BLSTM模型在实际应用中,还可继续结合实测数据,继续进行机器学习,继续模型的训练优化。

在该情况下,在TBM掘进初始阶段的数据集训练得到的模型,可称为基模型;随掘过程使用新增数据对基模型不断进行优化调整得到的模型,则可称为增量学习模型。

随着掘进里程的增加,累积的掘进工况也会越来越多,这些工况体现在TBM随掘采集的数据中。一段连续掘进里程的工况具有相似性,实时预测模型对新工况的预测依赖于对相似工况的学习,增量学习方法基于基模型,只需对样本库中新增数据(新的工况)进行学习,使基模型具有对新工况的预测能力,而无需对全部样本进行学习,可以大大节约学习时间。

以Ⅱ、Ⅲ、Ⅳ、Ⅴ类围岩的样本数据为例,本申请在Ⅱ、Ⅲ、Ⅳ、Ⅴ类围岩中各任选一段200m的掘进数据,其中前100m的掘进数据作为新增数据在基模型的基础上进行增量学习,后100m的掘进数据用来测试增量学习前后模型的预测能力。

基模型和增量学习模型的预测能力对比如下表6所示:

表6-增量学习前后模型预测能力对比

部分实测值与预测值的对比,可以参考图13至16分别示出的本申请分别关于Ⅱ、Ⅲ、Ⅳ、Ⅴ类围岩对比部分实测值与预测值的一种场景示意图,全部实测值与预测值的统计分析,可以参考图17至20分别示出的本申请分别关于Ⅱ、Ⅲ、Ⅳ、Ⅴ类围岩全部实测值与预测值的统计分析的一种场景示意图,结合可发现,增量学习方法还可以有效地继续提高模型的预测精度。

以上是本申请提供TBM刀盘扭矩实时预测模型的处理方法的介绍,为便于更好的实施本申请提供的TBM刀盘扭矩实时预测模型的处理方法,本申请还从功能模块角度提供了一种TBM刀盘扭矩实时预测模型的处理装置。

参阅图21,图1为本申请TBM刀盘扭矩实时预测模型的处理装置的一种结构示意图,在本申请中,TBM刀盘扭矩实时预测模型的处理装置2100具体可包括如下结构:

获取单元2101,用于获取TBM在不同时间点的第一工作状态数据,第一工作状态数据标注有对应的时间标识,第一工作状态数据包含TBM刀盘扭矩;

预处理单元2102,用于对第一工作状态数据进行预处理,剔除与TBM刀盘扭矩无关的数据,得到第二工作状态数据;

特征提取单元2103,用于对第二工作状态数据进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数;

训练单元2104,用于将标注有对应特征参数的TBM刀盘扭矩作为训练样本,依次输入BLSTM模型,使得BLSTM模型以时序为基础预测下一时间段的TBM刀盘扭矩,实现正向传播,并依次根据BLSTM模型输出的TBM刀盘扭矩预测结果计算损失函数,以损失函数计算结果优化模型参数,实现反向传播,当达到训练条件时完成模型训练,得到TBM刀盘扭矩实时预测模型。

在一种示例性的实现方式中,特征提取单元2103,具体用于:

根据第一公式计算第二工作状态数据中,不同候选特征参数与TBM刀盘扭矩的样本相关系数r

根据第二公式计算不同候选特征参数与TBM刀盘扭矩的相关性评分,并保留前k个评分最高的候选特征参数作为与TBM刀盘扭矩相关的特征参数,第二公式包括:

其中,与TBM刀盘扭矩相关的特征参数包括电机扭矩之和T

在又一种示例性的实现方式中,预处理单元2102,具体用于:

在第一预处理中,通过预先配置的掘进状态判别函数,剔除第一工作状态数据中无效的、与传感器异常相关的数据,掘进状态判别函数包括:

G=f(v

f(v

其中,T为TBM刀盘扭矩;

在第二预处理中,在第一预处理得到的工作状态数据中加入岩体现场贯入度指数FPI以及岩体可切削指数TPI的特征参数,并进行归一化处理,得到第二工作状态参数。

在又一种示例性的实现方式中,训练单元2104,还用于:

在每一轮的正向传播过程中,在Dropout算法下随机使得BLSTM模型的神经元失效;

以及,

在反向传播过程中,采用RMSProp优化器进行特征参数对应权重的处理。

在又一种示例性的实现方式中,训练单元2104,还用于:

结合贝叶斯优化算法以及K-flod交叉验证算法,对BLSTM模型超参数中的神经元个数m、RMSProp优化器的学习率lr、Dropout算法下Dropout层的随机失效概率dp进行超参数优化。

在又一种示例性的实现方式中,训练单元2104,还用于:

对于多个轮次的模型训练过程,根据早停算法以及模型检查点算法,实现训练过程的优化,对比前后轮次的训练过程的预测能力,及判断当前轮次的训练过程的训练轮次与模型检查点算法保存模型的训练轮次之间的差值是否超过设定的容忍值,确定最优的模型训练结果。

在又一种示例性的实现方式中,训练单元2104,具体用于:

在第二工作状态参数中,提取TBM刀盘扭矩的扭矩波动周期;

在每轮训练过程中,在将标注有对应特征参数的TBM刀盘扭矩的时间序列中,挑选出2至12个扭矩波动周期的时长跨度的时间序列作为训练样本,依次输入BLSTM模型。

本申请还从硬件结构角度提供了一种TBM刀盘扭矩实时预测模型的处理设备,参阅图22,图22示出了本申请TBM刀盘扭矩实时预测模型的处理设备的一种结构示意图,具体的,本申请处理设备可包括处理器2201、存储器2202以及输入输出设备2203,处理器2201用于执行存储器2202中存储的计算机程序时实现如图1对应实施例中TBM刀盘扭矩实时预测模型的处理方法的各步骤;或者,处理器2201用于执行存储器2202中存储的计算机程序时实现如图21对应实施例中各单元的功能,存储器2202用于存储处理器2201执行上述图1对应实施例中TBM刀盘扭矩实时预测模型的处理方法所需的计算机程序。

示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器2202中,并由处理器2201执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。

TBM刀盘扭矩实时预测模型的处理设备可包括,但不仅限于处理器2201、存储器2202、输入输出设备2203。本领域技术人员可以理解,示意仅仅是TBM刀盘扭矩实时预测模型的处理设备的示例,并不构成对TBM刀盘扭矩实时预测模型的处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如TBM刀盘扭矩实时预测模型的处理设备还可以包括网络接入设备、总线等,处理器2201、存储器2202、输入输出设备2203等通过总线相连。

处理器2201可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是TBM刀盘扭矩实时预测模型的处理设备的控制中心,利用各种接口和线路连接整个设备的各个部分。

存储器2202可用于存储计算机程序和/或模块,处理器2201通过运行或执行存储在存储器2202内的计算机程序和/或模块,以及调用存储在存储器2202内的数据,实现计算机装置的各种功能。存储器2202可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据TBM刀盘扭矩实时预测模型的处理设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器2201用于执行存储器2202中存储的计算机程序时,具体可实现以下功能:

处理设备获取TBM在不同时间点的第一工作状态数据,第一工作状态数据标注有对应的时间标识,第一工作状态数据包含TBM刀盘扭矩;

处理设备对第一工作状态数据进行预处理,剔除与TBM刀盘扭矩无关的数据,得到第二工作状态数据;

处理设备对第二工作状态数据进行特征参数提取,得到与TBM刀盘扭矩相关的特征参数;

处理设备将标注有对应特征参数的TBM刀盘扭矩作为训练样本,依次输入BLSTM模型,使得BLSTM模型以时序为基础预测下一时间段的TBM刀盘扭矩,实现正向传播,并依次根据BLSTM模型输出的TBM刀盘扭矩预测结果计算损失函数,以损失函数计算结果优化模型参数,实现反向传播,当达到训练条件时完成模型训练,得到TBM刀盘扭矩实时预测模型。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的TBM刀盘扭矩实时预测模型的处理装置、设备及其相应单元的具体工作过程,可以参考如图1对应实施例中TBM刀盘扭矩实时预测模型的处理方法的说明,具体在此不再赘述。

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。

为此,本申请提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1对应实施例中TBM刀盘扭矩实时预测模型的处理方法的步骤,具体操作可参考如图1对应实施例中TBM刀盘扭矩实时预测模型的处理方法的说明,在此不再赘述。

其中,该计算机可读存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。

由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1对应实施例中TBM刀盘扭矩实时预测模型的处理方法的步骤,因此,可以实现本申请如图1对应实施例中TBM刀盘扭矩实时预测模型的处理方法所能实现的有益效果,详见前面的说明,在此不再赘述。

以上对本申请提供的TBM刀盘扭矩实时预测模型的处理方法、装置、设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号