首页> 中国专利> 基于长短时记忆神经网络的地热产能预测方法及系统

基于长短时记忆神经网络的地热产能预测方法及系统

摘要

本发明涉及一种基于长短时记忆神经网络的地热产能预测方法及系统。所述方法包括:获取待预测地热系统的历史数据集;所述历史数据集包括注水速率、采水速率、井间距、储层温度、储层渗透率和储层导热系数;将所述待预测地热系统的历史数据集输入地热产能预测模型得到产能的预测值,所述产能包括生产温度和输出热功率。本发明提高了地热系统生产温度及输出热功率的预测精度。

著录项

  • 公开/公告号CN112926774A

    专利类型发明专利

  • 公开/公告日2021-06-08

    原文格式PDF

  • 申请/专利权人 中国石油大学(华东);

    申请/专利号CN202110201144.3

  • 申请日2021-02-23

  • 分类号G06Q10/04(20120101);G06N3/04(20060101);G06N3/08(20060101);G06Q50/06(20120101);

  • 代理机构11569 北京高沃律师事务所;

  • 代理人王爱涛

  • 地址 266580 山东省青岛市黄岛区长江西路66号

  • 入库时间 2023-06-19 11:19:16

说明书

技术领域

本发明涉及地热技术领域,特别是涉及一种基于长短时记忆神经网络的地热产能预测方法及系统。

背景技术

地热能是指地壳内能够科学、合理地开发出来的岩石中的热量和地热流体中的热量。地热资源凭着自身一系列的可再生优点且蕴藏量丰富,随着石油、煤炭等传统化石能源的逐渐枯竭,必将成为未来新资源的一个重要组成部分。

目前在地热系统产能预测中使用的方法主要为数值模拟和理论计算,但是数值模拟过程中往往简化了边界条件和地层物质属性,而且由于模型离散化结构不同,会导致精度上的差异,随机性大,计算耗时长。

发明内容

本发明的目的是提供一种基于长短时记忆神经网络的地热产能预测方法及系统,提高了地热系统生产温度及输出热功率的预测精度。

为实现上述目的,本发明提供了如下方案:

一种基于长短时记忆神经网络的地热产能预测方法,包括:

获取待预测地热系统的历史数据集;所述历史数据集包括注水速率、采水速率、井间距、储层温度、储层渗透率和储层导热系数;

将所述待预测地热系统的历史数据集输入地热产能预测模型得到产能的预测值,所述产能包括生产温度和输出热功率;所述地热产能预测模型为以待训练地热系统的历史数据集为输入,以所述待训练地热系统的产能的真实值为输出对长短时记忆神经网络进行训练得到的。

可选的,所述地热产能预测模型的确定方法为:

获取所述待训练地热系统的训练数据,所述训练数据包括历史数据集和产能的真实值;

将所述训练数据按设定比例划分为训练集和验证集;

在当前迭代次数下,以所述训练集中第t时刻的历史数据集作为输入,以所述训练集中第t+1时刻的产能的真实值作为输出对所述长短时记忆神经网络进行训练得到当前迭代次数下的训练长短时记忆神经网络;

以所述验证集中第k时刻的历史数据集作为输入,以所述验证集中第k+1时刻的产能的真实值作为输出,以当前迭代次数下的学习率,对所述当前迭代次数下的训练长短时记忆神经网络的超参数进行优化,得到优化后的长短时记忆神经网络;

判断当前迭代次数下的损失值是否达到设定阈值范围,若是,则将所述优化后的长短时记忆神经网络确定为所述地热产能预测模型,若否,则进行下一次迭代;所述超参数包括隐藏层节点数、网络层的层数、优化器、损失函数、学习率、批大小、周期和正则化方法,所述损失值为根据产能的真实值和优化后的长短时记忆神经网络输出的产能的预测值得到的。

可选的,在所述将所述训练数据按设定比例划分为训练集和验证集之前,还包括:

采用零-均值规范化方法对所述训练数据进行预处理得到预处理后的训练数据。

可选的,所述损失值的确定公式为:

其中,MSE表示损失值,n表示验证集中历史数据集的总个数,y

可选的,当前迭代次数下的学习率为上一次迭代次数下的学习率的伽马次方。

一种基于长短时记忆神经网络的地热产能预测系统,包括:

获取模块,用于获取待预测地热系统的历史数据集;所述历史数据集包括注水速率、采水速率、井间距、储层温度、储层渗透率和储层导热系数;

预测值确定模块,用于将所述待预测地热系统的历史数据集输入地热产能预测模型得到产能的预测值,所述产能包括生产温度和输出热功率;所述地热产能预测模型为以待训练地热系统的历史数据集为输入,以所述待训练地热系统的产能的真实值为输出对长短时记忆神经网络进行训练得到的。

可选的,所述基于长短时记忆神经网络的地热产能预测系统,还包括:地热产能预测模型确定模块,所述地热产能预测模型确定模块包括:

第一获取单元,用于获取所述待训练地热系统的训练数据,所述训练数据包括历史数据集和产能的真实值;

划分单元,用于将所述训练数据按设定比例划分为训练集和验证集;

训练单元,用于在当前迭代次数下,以所述训练集中第t时刻的历史数据集作为输入,以所述训练集中第t+1时刻的产能的真实值作为输出对所述长短时记忆神经网络进行训练得到当前迭代次数下的训练长短时记忆神经网络;

验证单元,用于以所述验证集中第k时刻的历史数据集作为输入,以所述验证集中第k+1时刻的产能的真实值作为输出,以当前迭代次数下的学习率,对所述当前迭代次数下的训练长短时记忆神经网络的超参数进行优化,得到优化后的长短时记忆神经网络;

地热产能预测模型确定单元,用于判断当前迭代次数下的损失值是否达到设定阈值范围,若是,则将所述优化后的长短时记忆神经网络确定为所述地热产能预测模型,若否,则进行下一次迭代;所述超参数包括隐藏层节点数、网络层的层数、优化器、损失函数、学习率、批大小、周期和正则化方法,所述损失值为根据产能的真实值和优化后的长短时记忆神经网络输出的产能的预测值得到的。

可选的,所述地热产能预测模型确定模块还包括:预处理单元,所述预处理单元用于采用零-均值规范化方法对所述训练数据进行预处理得到预处理后的训练数据。

可选的,所述损失值的确定公式为:

其中,MSE表示损失值,n表示验证集中历史数据集的总个数,y

可选的,当前迭代次数下的学习率为上一次迭代次数下的学习率的伽马次方。

根据本发明提供的具体实施例,本发明公开了以下技术效果:通过长短时记忆神经网络(Long Short-Term Memory,LSTM),利用地热系统的注水速率、采水速率、井间距、储层温度、储层渗透率和储层导热系数来实现地热系统的生产温度及输出热功率的预测,提高了地热系统生产温度及输出热功率的预测精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的长短时记忆神经网络的结构图;

图2为本发明实施例提供的基于长短时记忆神经网络的地热产能预测方法的流程图;

图3为本发明实施例提供的更加具体的基于长短时记忆神经网络的地热产能预测方法的流程图;

图4为使用本实施例提供的基于长短时记忆神经网络的地热产能预测方法对某地热田第25年至第30年的生产井平均生产温度进行预测得到的预测值与真实值的对比图;

图5为本发明实施例提供的基于长短时记忆神经网络的地热产能预测系统的结果示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

LSTM作为一种特殊的循环神经网络,能够很好地捕捉生产温度随着历史生产动态数据的变化,LSTM的结构图如图1所示,其内存单元包括以下几个部分:

遗忘门:f

其中,f

输入门:i

C

式中,i

输出门:O

h

式中,O

101:获取待预测地热系统的历史数据集;所述历史数据集包括注水速率、采水速率、井间距、储层温度、储层渗透率和储层导热系数。地热系统有多个地热井组成。

102:将所述待预测地热系统的历史数据集输入地热产能预测模型得到产能的预测值,所述产能包括生产温度和输出热功率;所述地热产能预测模型为以待训练地热系统的历史数据集为输入,以所述待训练地热系统的产能的真实值为输出对长短时记忆神经网络进行训练得到的。

在实际应用中,所述地热产能预测模型的确定方法为:

获取所述待训练地热系统的训练数据,所述训练数据包括历史数据集和产能的真实值;训练数据的形式为由[样本数,时间步长,特征数]构成的三维矩阵,在数据库中不同列代表不同特征,不同行代表不同时刻,矩阵的一行是同一时刻的历史数据集组成的。

将所述训练数据按设定比例划分为训练集和验证集。

在当前迭代次数下,以所述训练集中第t时刻的历史数据集作为输入,以所述训练集中第t+1时刻的产能的真实值作为输出对所述长短时记忆神经网络进行训练得到当前迭代次数下的训练长短时记忆神经网络。

以所述验证集中第k时刻的历史数据集作为输入,以所述验证集中第k+1时刻的产能的真实值作为输出,以当前迭代次数下的学习率,对所述当前迭代次数下的训练长短时记忆神经网络的超参数进行优化,得到优化后的长短时记忆神经网络;学习率衰减调控有指数衰减、固定步长衰减、多步长衰减和余弦退火衰减等多个方法,在本发明中我们采用指数衰减,即选定一个系数伽马(如=0.99),使得当前迭代次数下的学习率可以为上一次迭代次数下的学习率的伽马次方。

判断当前迭代次数下的损失值是否达到设定阈值范围,若是,则将所述优化后的长短时记忆神经网络确定为所述地热产能预测模型,若否,则进行下一次迭代;所述超参数包括隐藏层节点数、网络层的层数、优化器、损失函数、学习率、批大小、周期和正则化方法,所述损失值为根据产能的真实值和优化后的长短时记忆神经网络输出的产能的预测值得到的。损失值的确定公式可以为:

不同超参数的设定会导致收敛速度的快慢以及学习精度的高低,在实际应用中,可以采取控制变量法针对具体的数据样本进行由于不同超参数的选取导致结果优劣的对比,如控制网络层数、隐藏层节点数、正则化方法等不变,选取SGD、AdaGrad、Adam、RMSProp等优化器,发现选取RMSProp时收敛更快,精度更高。

在实际应用中,本实施例可以基于python语言和pytorch框架构造LSTM模型。

在实际应用中,训练数据中由于人为或其他原因可能导致样本中数据存在缺失值和离群点。可以采用插值法填充和删除变量对缺失值进行处理,采用箱线图识别离群点并对离群点采用对数变换来减少样本的信息损失。为了消除不同特征间单位和尺度差异的影响,在所述将所述训练数据按设定比例划分为训练集和验证集之前,还包括:采用零-均值规范化方法对所述训练数据进行预处理得到预处理后的训练数据,公式如下:

式中,x′是处理后数据,x是原数据,

在实际应用中,可以将预处理完毕后的训练数据按照7:2:1的比例构建训练集、验证集和测试集,训练集的地热系统历史数据作为用于模型拟合的数据样本,其数据的优劣对预测模型的解释力起了至关重要的作用;验证集的地热系统历史数据用于调整预测模型的超参数以及对预测模型的能力进行初步评估;测试集的地热系统历史数据用来评估模最终预测模型的泛化能力及实用价值。

如表1所示,本实施例提供了以某地热田前25年的历史生产动态数据为训练集完成模型最优化及训练后,预测的结果平均绝对误差为0.0786,平均相对误差为1.93%,R平方为0.99,以该地热田第25年至第30年的历史生产动态数据为验证集,进行模型的最优化及训练后,预测的结果平均绝对误差为0.1665,平均相对误差为3.37%;R平方为0.97,均高于准确度95%的预期指标,图4展现了以时间维度为横向坐标轴,以生产井平均生产温度为纵向坐标轴,使用本实施例提供的预测方法对该地热田第25年至第30年的生产井平均生产温度进行预测得到的预测值与真实值的对比图,说明本实施例提供的预测方法的适用性和有效性。

表1

本实施例还提供了一种与上述实施例对应的地热产能预测系统,如图5所示,所述系统包括:

获取模块A1,用于获取待预测地热系统的历史数据集;所述历史数据集包括注水速率、采水速率、井间距、储层温度、储层渗透率和储层导热系数。

预测值确定模块A2,用于将所述待预测地热系统的历史数据集输入地热产能预测模型得到产能的预测值,所述产能包括生产温度和输出热功率;所述地热产能预测模型为以待训练地热系统的历史数据集为输入,以所述待训练地热系统的产能的真实值为输出对长短时记忆神经网络进行训练得到的。

作为一种可选的实施方式,所述基于长短时记忆神经网络的地热产能预测系统,还包括:地热产能预测模型确定模块,所述地热产能预测模型确定模块包括:

第一获取单元,用于获取所述待训练地热系统的训练数据,所述训练数据包括历史数据集和产能的真实值。

划分单元,用于将所述训练数据按设定比例划分为训练集和验证集。

训练单元,用于在当前迭代次数下,以所述训练集中第t时刻的历史数据集作为输入,以所述训练集中第t+1时刻的产能的真实值作为输出对所述长短时记忆神经网络进行训练得到当前迭代次数下的训练长短时记忆神经网络。

验证单元,用于以所述验证集中第k时刻的历史数据集作为输入,以所述验证集中第k+1时刻的产能的真实值作为输出,以当前迭代次数下的学习率,对所述当前迭代次数下的训练长短时记忆神经网络的超参数进行优化,得到优化后的长短时记忆神经网络;当前迭代次数下的学习率可以为上一次迭代次数下的学习率的伽马次方。

地热产能预测模型确定单元,用于判断当前迭代次数下的损失值是否达到设定阈值范围,若是,则将所述优化后的长短时记忆神经网络确定为所述地热产能预测模型,若否,则进行下一次迭代;所述超参数包括隐藏层节点数、网络层的层数、优化器、损失函数、学习率、批大小、周期和正则化方法,所述损失值为根据产能的真实值和优化后的长短时记忆神经网络输出的产能的预测值得到的。所述损失值的确定公式可以为:

作为一种可选的实施方式,所述地热产能预测模型确定模块还包括:预处理单元,所述预处理单元用于采用零-均值规范化方法对所述训练数据进行预处理得到预处理后的训练数据。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

1、LSTM作为一种RNN模型的变体,不仅能够有效地避免梯度消失的问题,而且在模型的解释力足够的情况下,能快速高效地捕捉到特征和目标值之间的非线性关系,同时能够考虑到数据在时间维度上的相关性。在实际地热区块的应用中,预测精度高,可以作为一种新的方法应用于地热系统产能预测。

2、本发明采用学习速率策略,使学习率随时间变化逐渐减小,更利于模型快速有效收敛,一般来说,学习率大,网络收敛快,学习率小,网络更容易收敛到最优解;因此,我们希望在训练初期学习率大一些,使得网络收敛迅速,在训练后期学习率小一些,使得网络更好的收敛到最优解。

3、本发明首次将LSTM应用于地热系统的生产温度预测与输出热功率预测中,有效地解决了传统地热产能预测所使用地数值模拟和计算方法中存在的简化边界条件和计算耗时长的问题。

4、本发明本发明使用的LSTM单元结构不仅可以考虑到注水速率、采水速率、井间距、储层温度、储层渗透率、储层导热系数等对产能的影响,而且还可以捕捉到目标数据在时间上的相关性,并且预测精度高,在多实例验证中可达百分之九十五以上,可以作为一种新的方法应用于地热系统产能预测,对地热系统的开发策略制定和生产投资具有重要意义。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号