技术领域
本发明涉及一种基于深度神经网络的多组分反应性溶质运移参数反演方法,属于地下水数值模拟反问题研究。
背景技术
多组分反应性溶质运移模拟是分析多孔介质水流系统及化学组分迁移规律的重要工具,在地下水污染、二氧化碳地质储存与核废料埋藏安全评估等方面有着广泛的研究应用。
在用数值模型解决实际问题的研究过程中,准确设定模型参数是数值模型获得可靠模拟结果的前提。在多组分反应性溶质运移模拟问题中,许多参数难以通过目前的测量手段直接获取。针对这一问题,利用实际观测数据,结合数据同化方法的反演计算是目前主要的解决方案。
发明内容
本发明要解决的技术问题是提供一种基于深度神经网络的多组分反应性溶质运移参数反演方法,可以用于估计和设置多组分反应性溶质运移模型中的关键参数,从而解决多组分反应性溶质模拟过程中的参数识别问题。
一种基于深度神经网络的多组分反应性溶质运移参数反演方法,该方法包括以下步骤:
步骤1:通过资料收集或实地采集等方式,得到各化学组分的实际浓度观测数据;根据研究对象实际情况,构建实际观测数据所对应的多组分反应性溶质运移模型;同时确定模型待反演参数和各参数的取值范围;
步骤2:根据模型参数取值范围,随机采样若干组参数样本,逐一代入步骤1中所建立的多组分反应性溶质运移模型,得到每组样本对应的模型响应,形成由“模型参数—模型响应”样本对构成的训练样本集;
步骤3:对步骤1中的实际观测数据和步骤2中的训练样本集作归一化处理;
步骤4:构建一个由模型参数作为输入,模型响应作为输出的正演神经网络;用步骤3中归一化处理后的训练样本集对本步骤中的正演神经网络进行训练;
步骤5:构建一个由模型响应观测数据作为输入,模型参数作为输出的反演神经网络;将该反演神经网络的输出作为步骤4中的正演神经网络的输入,得到一个串联式连接的神经网络架构;在此架构下用步骤3中归一化后的实际观测数据对反演神经网络进行训练;
步骤6:将步骤3中的归一化后的实际观测数据输入步骤5中的反演神经网络,网络输出得到归一化后的模型参数估计结果;将其反归一化,即为步骤1中所建立的待研究对象的多组分反应性溶质运移模型参数估计值;
步骤7:计算步骤6得到参数估计值处的正演神经网络相对于多组分反应性溶质运移模型的误差;
步骤8:判断步骤7中误差是否小于容许误差;如果是,则认为步骤6中所得到的模型参数估计值即为所求的反演结果;否则,执行后续步骤;
步骤9:如果步骤7中正演神经网络在参数估计点处的误差大于容许误差,则在步骤6中所得到的模型参数估计值附近增加n个参数样本,并逐一代入步骤1中所建立的地下水多组分反应性溶质运移模型,得到对应的模型响应,得到局部样本集;计算步骤2中的训练样本集中的所有样本点的参数与步骤6得到的参数估计值之间的欧氏距离,将欧式距离最大的n个样本删除,并加入局部样本集得到更新后的训练样本集;同时对新的样本集做归一化处理;
步骤10:利用步骤9中得到的归一化处理后的新训练样本集,用迁移学习的方法对步骤4中的正演神经网络进行更新,得到更新后的正演神经网络;再执行步骤5~步骤8中的操作;
步骤11:如果步骤8中的判断条件依然不满足,则继续执行步骤9~步骤10,直到循环次数达到最大终止条件,输出所有循环中近似误差最小的那一次参数估计结果作为最终的反演结果。
所述步骤1中多组分反应性溶质运移模拟程序为TOUGHREACT。
所述步骤1中的模型参数一般包括渗透率,阳离子交换系数,各化学组分初始浓度,各化学组分边界浓度和阳离子交换容量等。
所述步骤2中随机采样通过拉丁超立方采样方法实现。
所述步骤2中通过编写程序,实现TOUGHREACT程序的输入文件中模型参数改写,TOUGHREACT程序可执行程序的调用和输出文件中结果的读取,从而得到由模型参数和模型响应构成的训练样本集。
所述步骤3中的数据归一化通过“0-1归一化”方法进行处理;其中,参数归一化的方法如下:
设:
公式(1)中:
模型响应的归一化方法如下:
设:
公式(2)中:
观测数据的归一化方法与模型响应的归一化方法类似,第i种化学组分的观测数据向量
同理,可以得到观测数据的总的归一化向量
所述步骤4和步骤5中的正演神经网络和反演神经网络均通过基于二维卷积的神经网络进行构建;神经网络包括一个前处理模块,三个卷积特征提取运算模块和一个全连接模块依次连接而成;其中,前处理模块将向量形式的输入数据映射为一个32×32×1的矩阵数据,每个卷积模块由一个卷积层、一个批标准化层和一个池化层组成,全连接模块由一个展平层和一个前连接层组成,连接各层的激活函数为Swish函数:
所述步骤4和步骤5中的正演神经网络和反演神经网络的搭建及训练均在pytorch框架下实现;
所述步骤4中正演神经网络训练的损失函数为基于L1范数的目标函数:
公式(5)中θ
所述步骤5中反演神经网络训练的损失函数根据贝叶斯定理推导而来,具体如下:
公式(6)中,θ
所述步骤6中的参数反归一化处理通过以下公式实现:
公式(7)中,
所述步骤7中,计算步骤6得到参数估计值处的正演神经网络相对于多组分反应性溶质运移模型的误差为基于归一化数据的均方根误差(RMSE),具体计算方法如下:
将
将
则RMSE通过如下公式计算得到:
所述步骤8中的容许近似误差根据不同的研究对象和求解精度需求通过人为设定。
所述步骤9中的n个参数样本的采集通过下述方式实现:以
所述步骤9中的某个参数
所述步骤10中利用步骤9中得到的更新后的训练样本集,仅对步骤4中的正演神经网络的输出层的神经网络连接权重参数进行更新训练,对其余连接权重参数固定,从而得到更新后的正演神经网络。
所述步骤11中的最大循环次数通过人为设定。
本发明的有益效果:
1、本发明降低了反演结果的误差。
2、本发明解决了多组分反应性溶质运移参数反演问题及模型校正问题,为多组分反应性溶质运移模拟技术的应用提供技术保障。
附图说明
图1为步骤4中的由正演神经网络和反演神经网络构成的串联式架构。
图2为构成正演神经网络和反演神经网络的预处理模块,卷积特征提取运算模块和全连接模块的示意图。
图3为实施案例中各离子的模拟计算结果(a),加入噪声扰动后的结果(b)。
图4参数反演结果对应的拟合图。
具体实施方式
实施例:
本实施例是一个假想的多孔介质中反应性溶质运移模拟柱实验模型,长为0.08m。初始状态溶液中的溶质主要为1mmol/LNaNO
Na
Na
K
各离子的初始浓度和边界浓度如表1:
表1柱子系统种各化学组分的初始浓度和边界浓度
基于上述信息,用TOUGHREACT进行模型构建,并计算出柱子末端Ca
本模型中的待反演参数为:K
在本实施例中:
步骤2中各参数先验区间见表2;
步骤2中的样本采样数为200;
步骤8中设置的容许误差为0.003;
步骤9中的局部采样参数个数n为20;
步骤11中的最大循环次数设置为20;
本实施例,经过18次循环,达到循环终止条件;得到各参数的反演结果及相对误差见表2;
表2待反演参数的真实值,先验区间,反演估计值和相对误差
根据表3的结果,参数反演值与其真实值都非常接近,相对误差均小于5%;
再将参数代入步骤1中建立的多组分反应性溶质运移模型,得到对应的模拟结果,绘制拟合曲线,如图4所示;
根据图4,在将参数估计值代入模型后,得到的模拟曲线与观测点数据的分布基本拟合。
由此可见,本发明能解决参数识别及模型校正问题。
机译: 一种计算机实现的减少基于支付的交易中的风险的方法,其中使用支付银行系统从帐户持有人向交易对手进行支付,该系统采用风险过滤例程,该例程确定是否基于至少一个用户提供的风险选择性拒绝支付参数,包括未付款限制
机译: 一种用于确定运动参数的方法和系统,包括基于心率曲线分析的有氧耐久性
机译: (54)标题:一种扩展商务智能系统的形式和功能的基于内容的方法(57)摘要:商务智能(BI)系统具有通过以下方式将其功能扩展到项目生命周期之外的能力:具体内容。复杂的多维查询被解释为原子子表达式的树,这些原子子表达式组合成类似解析树的结构以形成整体查询。每个子树在提供适当的上下文时都是有效的。任何子树都可以是作为应用程序内容存储的表达模板,该表达模板在生成时使用带有实例特定参数的简单文本替换来生成多维表达语法。该系统包括一个复杂的类型系统和语义层,使用户摆脱了使用OLAP数据库所固有的复杂性。商业智能专家可以为每个作为内容的表达模板提供类型和语义提示。