公开/公告号CN113869572A
专利类型发明专利
公开/公告日2021-12-31
原文格式PDF
申请/专利权人 远见(无锡)大数据科技有限公司;
申请/专利号CN202111105702.2
申请日2021-09-22
分类号G06Q10/04(20120101);G06Q50/08(20120101);G06K9/62(20060101);G06N3/04(20060101);
代理机构32200 南京经纬专利商标代理有限公司;
代理人罗运红
地址 214109 江苏省无锡市锡山区安镇街道山河路50号10号楼2层203
入库时间 2023-06-19 13:29:16
技术领域
本发明属于混凝土结构健康监测技术领域,更具体地说,涉及一种基于全连接神经网络的受火混凝土破坏度预测方法。
背景技术
近年来,建筑火灾的频繁发生给人们带来严重的生命财产安全和环境资源威胁。混凝土材料作为建筑材料使用最为广泛,在不同的环境条件下都有良好的结构性能。即使在高温下,混凝土仍能保持相当的强度。混凝土温度受火时,内部会发生复杂的物理化学变化。受火影响后混凝土的性能被混凝土内材料的分解温度决定。传统的受火混凝土的结构破坏程度评估方法需要大量的实验工作,而其他一些新技术成本较高,适用性仍需进一步研究。针对这一问题,目前基于深度学习神经网络方法的混凝土破坏度预测技术已成为研究热点之一。
发明内容
针对现有对受火混凝土的结构破坏程度评估工作量大以及评估成本高的问题,本发明提供一种基于全连接神经网络的受火混凝土破坏度预测方法,本发明由改进的全连接神经网络做出高准确率的预测识别,确定不同的混凝土混合物性能和最终合成过程的视觉之间表示的关系,定量推定混凝土混合物性能并预测获得破坏度,极大程度的提高受火混凝土破坏度预测的正确率,节省了任务运行的时间,有效地节约了资源成本。
为解决上述问题,本发明采用如下的技术方案。
一种基于全连接神经网络的受火混凝土破坏度预测方法,包括如下步骤,
步骤S1,获取受火混凝土的样本图像数据,并对受火混凝土的样本图像数据进行预处理;
步骤S2,获取预处理后的样本图像数据对应的属性数据;
步骤S3,对预处理后的样本图像数据和其对应的属性数据进行标准化处理,输入到全连接神经网络模型中,进行模型训练。
步骤S4,获取待预测的受火混凝土的样本图像数据,并对待预测的受火混凝土的样本图像数据进行预处理;
步骤S5,获取预处理后的待预测的样本图像数据对应的属性数据;
步骤S6,对预处理后的待预测的样本图像数据和其对应的属性数据进行标准化处理,输入到全连接神经网络模型中,获取待预测的样本图像数据破坏度的预测。
进一步的技术方案,步骤S3具体包括如下步骤,
步骤S301,对步骤S1中预处理后的样本图像数据和步骤S2中的属性数据均采用标准差标准化处理,进行均值和方差归一化;
步骤S302,分别随机选取标准化处理后的10个样本图像数据和属性数据作为验证集;将剩下的样本图像数据和属性数据作为训练集;设置随机数种子为任意常数,使迭代训练生成的随机样本固定;
步骤S303,设置模型训练超参数:设置迭代数,批量尺寸和交叉熵数;
步骤S304,采用训练集训练全连接神经网络模型;
步骤S305,采用验证集验证步骤S304训练好的全连接神经网络模型,根据全连接神经网络模型输出的模型预测值,采用均方差MSE、均方根差RMSE、平均绝对误差MAE和结构相似性SSIM指标对模型预测值进行预测效果评估;均方差MSE、均方根差RMSE和平均绝对误差MAE值越低且结构相似性SSIM值越高,表明全连接神经网络模型的预测越精准,效果越好;
步骤S306,通过matplotlib可视化方法输出与提供的混凝土样本图像维度相同的预测图像,进一步可视化验证模型预测效果;
步骤S307,保存模型。
进一步的技术方案,步骤S304中,对L2正则化基线模型和三层隐藏层正则化模型利用权重正则化方法进行处理,L2正则化基线模型的惩罚系数λ为0.1,0.01或0.001,三层隐藏层正则化模型的惩罚系数λ为0.001。
进一步的技术方案,步骤S304中,全连接神经网络模型为三层隐藏层正则化模型;对三层隐藏层正则化模型利用权重正则化方法进行处理,三层隐藏层正则化模型的惩罚系数λ为0.001。
进一步的技术方案,步骤S304中,全连接神经网络模型为L2正则化基线模型,对L2正则化基线模型利用权重正则化方法进行处理,L2正则化基线模型的惩罚系数λ为0.1,0.01或0.001。
进一步的技术方案,步骤S304中,全连接神经网络模型为基线模型。
进一步的技术方案,全连接神经网络模型的神经元由五部分组成:
输入x:输入一个或多个预处理后的样本图像数据和属性数据;
权重w:每个输入都有一个权重w,w∈R;
偏置顶b:b∈R;
激活函数:利用ReLU(y)=max(0,y)计算;
输出y:y=f(w*x+b)。
进一步的技术方案,步骤S2中,还包括对预处理后的样本图像数据进行可视化分析,具体步骤为:
步骤S201,将预处理后的样本图像数据所对应的属性数据进行转置,转置后的属性数据与样本图像数据维度对应,从而获取样本图像数据对应的特征属性或信息熵;
步骤S202,获取预处理后的样本图像数据的数量和维度信息;
步骤S203,基于预处理后的样本图像数据和其对应的混凝土特征属性或信息熵,对样本图像数据进行维度数组与矩阵运算,获取数据类型、数量和维度,对预处理后的样本图像数据进行可视化处理,获取密度图、直方图和关系矩阵,从而得到可视化结果图。
进一步的技术方案,步骤S1中,预处理步骤包括:
步骤S101,将提供的样本图像数据扁平化为1*m维数组并压缩;
步骤S102,将扁平化的数组数据分别除以255,使每个像素值在0-1之间;
步骤S103,将步骤S102处理后的数据存入数组中。
有益效果:相比于现有技术,本发明的技术方案的有益效果为:
本发明的一种基于全连接神经网络的受火混凝土破坏度预测方法,克服了传统的受火混凝土破坏度预测方法执行成本高、耗时长、误差大等缺点;极大程度的提高了破坏度预测执行的准确率,有效地节约了成本和时间,大大提升了整个任务的运行速度,缩短了任务执行所需要消耗的资源。
附图说明
图1为本发明预测方法的流程示意图;
图2为本发明的全连接神经网络的方法路线图;
图3为本发明全连接神经网络的结构图;
图4为本发明的混凝土样本图像;
图5为本发明的预测方法的验证结果图。
具体实施方式
下面结合具体实施例和附图对本发明进一步进行描述。
实施例
本实施例提供了一种基于全连接神经网络的受火混凝土破坏度预测方法,如图1所示为本发明的流程示意图,该受火混凝土破坏度学习方法包括如下步骤:
步骤S1,如图4所示为输入的混凝土样本图像,获取受火混凝土样本图像数据,并对受火混凝土样本图像数据进行预处理;
步骤S2,对S1中预处理后的样本图像数据进行可视化分析得到可视化结果图;
步骤S3,对S1中预处理后的样本图像数据标准化处理后,输入到改进的全连接神经网络模型中,深度学习全连接神经网络模型,获取样本数据破坏度的精准预测。
步骤S1中的预处理方法包括数组转化、压缩和归一化。为了将混凝土样本图像和属性数据结合,分析混凝土条件属性,需要将图像转化为一维数组进行数据分析。目前转化一维数组的方法是通过Numpy库中的flatten函数实现;由于计算机显卡容量限制,需要将数组成比例压缩,以便适应机器训练,目前压缩数据的常用方法是基于python脚本语言开发的数字图片处理包Scikit-Image中的transform子模块方法;将样本图像数据进行归一化,为了将图片数据转化为实数类型,使其在0.0~1.0范围内,提高图像处理精度,通过将每个图像预处理矩阵除以255实现。具体地,数据的转化、压缩和归一化通过现有的软件自定义函数实现。
为此步骤S1具体包括如下步骤:
步骤S101,将原始图像扁平化为1*m维数组并按60%压缩;
步骤S102,将扁平化的图像像素分别除以255,使每个像素值在0-1之间;
步骤S103,如果数据量较大,对预处理后的数据保存为Numpy专用的二进制文件简称为npy类型文件。
优选地,步骤S2的具体操作步骤包括:
步骤S201,读取已知的受火混凝土样本图像数据对应的属性数据,并将属性数据进行矩阵转置,转置后的属性数据与样本图像数据尺寸大小、数量一一对应,从而获取所述样本图像对应的特征属性或者信息熵;
步骤S202,读取步骤S1预处理后的样本图像数据,获取样本图像数据数量和维度;
步骤S203,基于预处理后的样本图像数据和其对应的混凝土特征属性或信息熵,对预处理后的样本数据利用基于Python语言的一个扩展程序库Numpy(Numerical Python)进行维度数组与矩阵运算,获取数据类型、数量和维度等信息;利用基于Python的Matplotlib、OpenCV绘图库,对预处理后的数据信息可视化,获取密度图、直方图、关系矩阵等可视化信息,从而可以获取提出的预测模型的输入数据信息属性,进行更精准的模型设计及模型验证。具体地,每个属性描述和可视化结果获取采用现有技术。
步骤S3中的全连接神经网络模型在使用之前需要进行训练,训练的目的是全连接神经网络的输出和混凝土真实数据的输出基本相同,其训练的实质是规定隐藏层和输出层,输入样本(预处理后的样本图像数据)和标签(混凝土特征属性),进行模型训练,将问题变成求隐藏层的w、b和输出层的w、b的参数过程,通过训练能够使全连接神经网络模型不断地学习而提高对受火混凝土破坏度预测的准确率。如图2所示,训练步骤具体包括:
步骤S301,对预处理后的样本图像数据和步骤S201读取的属性数据均采用标准差标准化(StandardScaler)处理,为了加快模型梯度下降收敛速度和模型训练精度;其中标准化处理的作用是将预处理后的样本图像数据的均值和方差归一化,其原理是针对每一个特征维度来做的,目的是为了使得经过处理的数据符合标准正态分布,从而使模型更好的训练,即均值为0,标准差为1,其转化函数为:
其中,x为预处理后的样本图像数据,μ为所有预处理后的样本图像数据的均值,σ为所有预处理后的样本图像数据的标准差。
步骤S302,分别随机选取10个标准化处理后的样本图像数据和属性数据组成10个验证集,每个验证集内包括1个样本图像数据和其对应的属性数据,验证集用于评估验证模型。将剩下的样本图像数据和属性数据作为训练集,并设置随机数种子model_seed为任意常数,使后面每次迭代训练依次生成的随机样本固定;
步骤S303,设置模型训练超参数:最大迭代Epoch为100,批量尺寸bach_size为5,交叉熵数Cross Entropy为10;
步骤S304,基于keras分别创建基线模型、L2正则化基线模型(惩罚系数λ分别为0.1,0.01,0.001)、三层隐藏层正则化模型(惩罚系数λ为0.001);采用训练集分别训练三个模型;
基线模型构建过程:由输入样本数据(样本图像数据和属性数据)、一层隐藏层、模型输出组成。
L2正则化基线模型构建过程:由输入样本数据(样本图像数据和属性数据),一层带有L2正则化的隐藏层、模型输出组成。
三层隐藏层正则化模型构建过程:由输入样本数据(样本图像数据和属性数据),三层带有L2正则化的隐藏层、模型输出组成。
其中正则化基线模型利用权重正则化方法进行处理,防止过拟合。在keras中,通过权重正则化(weight regularizer)方法即向层传递权重正则化项实例作为关键字参数,从而减轻深度神经网络模型的过拟合问题,提升对新数据的泛化能力。利用keras提供的reguraizers.l2(λ)方法,即L2正则化(L2 regularization),具体指添加的样本数据成本与权重系数的平方成正比。在用于评价以上创建好的全连接神经网络模型的预测值和真实值差异的损失函数中通过添加惩罚系数λ使用。λ越大,对参数的约束越强,惩罚力度越大,在本发明实验研究中将L2正则化基线模型的λ系数分别选用0.1、0.01、0.001,为了控制更好地拟合训练数据和保持参数值较小两者之间的平衡关系。三层隐藏层正则化模型的惩罚系数λ设置为0.001。
步骤S305,如图3所示,本发明实验创建的全连接神经网络模型的神经元由五部分组成:
输入x:输入一个或多个预处理后的样本图像数据和属性数据;
权重w:每个输入都有一个权重w,w∈R;
偏置顶b:b∈R;
激活函数:利用ReLU(y)=max(0,y)计算;
输出y:y=f(w*x+b)。
具体包括,将训练集输入到三个全连接神经网络模型中对三个模型分别进行训练。训练样本送进深度学习的操作流水线pipline进行处理,逐个调用节点的fit一次把训练数据全部加载到内存中,将每次批处理batch_size个数据来更新模型参数和利用转换器(transform)方法转换数据,进行最终的标准化,用最后一个节点的fit方法拟合数据。其中pipeline是基于sklearn数据包的函数,可以把多个处理数据的节点按照顺序打包。使用方法是流水线的输入为一连串的数据挖掘步骤,最后一步是估计器(Estimator),即分类器。前几步是transform。输入的数据集经过转换器的处理后,输出的结果作为下一步输入,最后用位于流水线最后一步的Estimator对数据进行分类。
步骤S306,用设置好的10个验证集评估训练好的模型,根据全连接神经网络模型输出的模型预测值,采用均方差MSE、均方根差RMSE、平均绝对误差MAE和结构相似性SSIM指标对模型预测值进行预测效果评估;均方差MSE、均方根差RMSE和平均绝对误差MAE值越低且结构相似性SSIM值越高,表明全连接神经网络模型的预测越精准,效果越好。
模型实验输出的评估指标如表1和表2所示,
表1
表2
由表1可以看出中,本发明的申请人创建的模型得出的MSE最低可以达到0.01,SSIM最高可以达到99.5%。表2由10个验证集分别对训练后的模型用SSIM评估指标评估得出,可以看出,模型测试样例SSIM最高可以达到99.8%,因此,reguraizers.l2(λ=0.001)的三层隐藏层模型为本发明实验中的最佳模型,也进一步验证了本发明方法的有效性。
步骤S307,通过matplotlib可视化方法输出与提供的混凝土样本图像维度相同的预测图像,如图4所示为本发明提供的混凝土样本图像,横纵坐标均表示为dpi,根据上述试验步骤,输出的预测图像如图5所示,横纵坐标均表示为dpi。根据图4和图5可以看出,输出的预测图像和提供的混凝土样本图像相似度极高,进一步可视化验证模型预测效果。
步骤S308,保存模型。
本发明所述实例仅仅是对本发明的优选实施方式进行描述,并非对本发明构思和范围进行限定,在不脱离本发明设计思想的前提下,本领域工程技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的保护范围。
机译: 基于分子描述子和人工神经网络的蒽醌和染料火危险性快速预测方法
机译: 基于神经网络的SQL列和表预测方法,用于基于神经网络的SQL查询翻译
机译: 基于神经网络的SQL列和表预测方法,用于基于神经网络的SQL查询翻译