首页> 中国专利> 建立煤层含气量预测模型的方法、装置、终端与存储介质

建立煤层含气量预测模型的方法、装置、终端与存储介质

摘要

本发明实施例公开了建立煤层含气量预测模型的方法、装置、终端与存储介质,方法包括以下步骤:步骤1、获取原始数据;步骤2、对原始数据进行数据预处理,得到样本数据;步骤3、对样本数据进行主成分分析,得到分析后的特征数据集;步骤4、通过对特征数据集进行划分,得到训练集与测试集;步骤5、基于训练集训练LSTM模型,得到训练后的LSTM模型;步骤6、采用测试集对训练后的LSTM模型进行测试;步骤7、若测试通过,则将训练后的LSTM模型设置为煤层含气量预测模型。通过本方案建立的煤层含气量预测模型,预测煤层气的速度快,效率高,可以实现大规模应用。

著录项

  • 公开/公告号CN112990567A

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利权人 中国矿业大学(北京);

    申请/专利号CN202110260677.9

  • 发明设计人 师素珍;齐佑朝;段培飞;韩琦;

    申请日2021-03-10

  • 分类号G06Q10/04(20120101);G06Q50/02(20120101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11463 北京超凡宏宇专利代理事务所(特殊普通合伙);

  • 代理人张欣欣

  • 地址 100082 北京市海淀区学院路丁11号

  • 入库时间 2023-06-19 11:29:13

说明书

技术领域

本发明涉及煤层气的预测领域,尤其涉及建立煤层含气量预测模型的方法、装置、终端与存储介质。

背景技术

我国的能源资源中,煤炭占比很大,在总能源消耗中,煤炭也占有重要的地位,而随着社会经济的不断发展,清洁使用煤炭越来越成为主流,其中,使用煤层气是一种重要的煤炭清洁使用方式。在此情况下,煤层气的准确预测成为清洁使用煤炭资源中重要的一环。目前预测煤层气含量的方法很多,其中,有一种方法是对煤层进行采样取芯,后运送至实验室进行测定。这种方式的精度很高,但是这种方式的成本高昂,且时间长,对设备要求高,无法大规模应用。

发明内容

有鉴于此,本发明提出了建立煤层含气量预测模型的方法、装置、终端与存储介质,通过本方案建立的煤层含气量预测模型,可以预测煤层气,且预测速度快,效率高,可以实现大规模应用。

具体的,本发明提出了以下具体的实施例:

本发明实施例提出了一种建立煤层含气量预测模型的方法,包括以下步骤:

步骤1、获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;

步骤2、对所述原始数据进行数据预处理,得到样本数据;

步骤3、对所述样本数据进行主成分分析,得到分析后的特征数据集;

步骤4、通过对所述特征数据集进行划分,得到训练集与测试集;

步骤5、基于所述训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:

y

步骤6、采用所述测试集对所述训练后的LSTM模型进行测试;

步骤7、若测试通过,则将所述训练后的LSTM模型设置为煤层含气量预测模型。

在一个具体的实施例中,所述训练包括以下步骤:

步骤51、将所述训练集中的特征输入所述LSTM模型,得到所述LSTM模型的输出值;

步骤52、通过所述输出值与所述训练集中的所述标签值的比较;

步骤53、若比较结果为达到预期,则得到训练后的LSTM模型;若比较结果为未达到预期,则调整所述LSTM模型的参数后执行步骤51。

在一个具体的实施例中,该方法还包括:

步骤8、若测试不通过,则对所述训练后的LSTM模型进行参数调整后执行步骤5。

在一个具体的实施例中,所述步骤4包括:

将所述特征数据集划分为训练集、测试集与验证集;

该方法还包括:通过所述验证集对所述煤层含气量预测模型进行验证,以确定所述煤层含气量预测模型的预测性能。

在一个具体的实施例中,所述数据预处理包括:

基于箱线图分析所述原始数据中的异常值,并对分析出的所述异常值进行删除;

当检测所述原始数据存在缺失的值时进行差值补全处理;

对进行了删除和差值补全处理后的所述原始数据进行归一化处理。

在一个具体的实施例中,各所述特征是对所述测井的同一深度位置进行探测得到;

所述地层特征包括厚度、顶底板岩性特征;

所述地球物理测井特征包括电阻率、密度、自然伽马值、孔隙度;

所述地球物理地震特征包括振幅、波阻抗;

所述煤的工业组分特征包括固定碳含量、挥发分含量、灰分含量。

在一个具体的实施例中,

所述内部记忆单元包括遗忘门、输入门和输出门;其中,所述遗忘门通过以下公式表示:

z

所述输入门通过以下公式表示:

z

z=tanh(W[h

本发明实施例还提出了一种建立煤层含气量预测模型的装置,包括:

获取模块,用于获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;

预处理模块,用于对所述原始数据进行数据预处理,得到样本数据;

分析模块,用于对所述样本数据进行主成分分析,得到分析后的特征数据集;

划分模块,用于通过对所述特征数据集进行划分,得到训练集与测试集;

训练模块,用于基于所述训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:

y

测试模块,用于采用所述测试集对所述训练后的LSTM模型进行测试;

设置模块,用于当测试通过时,将所述训练后的LSTM模型设置为煤层含气量预测模型。

本发明实施例还提出了一种终端,包括处理器与存储器,所述存储器中存储有应用程序,所述应用程序在所述处理器上运行时执行上项所述的建立煤层含气量预测模型的方法。

本发明实施例还提出了一种存储介质,所述存储介质中存储有应用程序,所述应用程序在处理器上运行时执行上述的建立煤层含气量预测模型的方法。

以此,本发明实施例提出了建立煤层含气量预测模型的方法、装置、终端与存储介质,该方法包括以下步骤:步骤1、获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;步骤2、对所述原始数据进行数据预处理,得到样本数据;步骤3、对所述样本数据进行主成分分析,得到分析后的特征数据集;步骤4、通过对所述特征数据集进行划分,得到训练集与测试集;步骤5、基于所述训练集训练LSTM模型,得到训练后的LSTM模型;步骤6、采用所述测试集对所述训练后的LSTM模型进行测试;步骤7、若测试通过,则将所述训练后的LSTM模型设置为煤层含气量预测模型。通过本方案,通过主成分分析对数据进行处理,实现了对原始数据的降维,也保证了得到的数据保留原始数据的内在信息并彼此具有最大的不相关性,同时基于对LSTM模型进行训练建立的煤层含气量预测模型,可以预测煤层气,且预测速度快,效率高,可以实现大规模应用。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对本发明保护范围的限定。在各个附图中,类似的构成部分采用类似的编号。

图1示出了建立煤层含气量预测模型的方法的流程示意图;

图2示出了具体应用场景下的建立煤层含气量预测模型的方法的流程示意图;

图3示出了建立煤层含气量预测模型中LSTM的整体框架图;

图4示出了建立煤层含气量预测模型中单个LSTM单元的结构示意图;

图5示出了建立煤层含气量预测模型中PCA-3层LSMT神经网络模型结构示意图;

图6示出了一种建立煤层含气量预测模型的装置的结构示意图;

图7示出了一种更具体的建立煤层含气量预测模型的装置的结构示意图。

图示说明:

201-获取模块;202-预处理模块;203-分析模块;204-划分模块;

205-训练模块;206-测试模块;207-设置模块;208-验证模块。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

在下文中,可在本发明的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。

此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本发明的各种实施例中被清楚地限定。

实施例1

本发明实施例1公开了一种建立煤层含气量预测模型的方法,如图1以及图2所示,包括以下步骤:

步骤S100、获取原始数据;原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;

具体的,各特征是对测井的同一深度位置进行探测得到;特征包括:地层特征、地球物理测井特征、地球物理地震特征、煤的工业组分特征。

首先收集研究区煤层含气量数据作为标签值,收集不同位置的测井在相同深度的地层特征(厚度、顶底板岩性特征等)、地球物理测井特征(电阻率、密度、自然伽马值、孔隙度等)、地球物理地震特征(振幅、波阻抗等)、测井地震道、煤的工业组分特征(固定碳含量、挥发分含量、灰分含量等)作为原始数据。

步骤S200、对原始数据进行数据预处理,得到样本数据;

具体的,数据预处理包括:

基于箱线图分析所述原始数据中的异常值,并对分析出的所述异常值进行删除;当检测所述原始数据存在缺失的值时进行差值补全处理;对进行了删除和差值补全处理后的所述原始数据进行归一化处理。

在步骤S100获取了原始数据之后,对原始数据是否存在异常值和缺失值进行检查。具体的,通过对始数据制作箱线图分析删除异常值,对缺失值则用插值补全处理;此外,为了消除原始数据的特征之间的量纲影响,对原始数据进行归一化处理,使得不同指标之间具有可比性。具体的,可以对所有原始数据进行线性函数归一化,使结果映射到[0,1]的范围,实现对原始数据的等比缩放。归一化公式如下:

其中,X为原始数据;X

步骤S300、对样本数据进行主成分分析,得到分析后的特征数据集;

具体的,主成分分析,也即PCA(principal component analysis,主成分分析)。其作用是优选低维特征,将输入的高维特征数据重新整理,使之适应LSTM网络的输入,并提高与标签数据的相关性;重构输入的数据使得到的低维向量具有最大的不相关性,并能够最大化保持数据的内在信息,以此作为下一个步骤的输入,进而预测煤层含气量。

具体的,通过正交变换将原始的高维数据集变换到一个新的被称为主成分的数据集中,即从现有的大量变量中提取一组新的变量。主成分是原始变量的线性组合,第一个主成分具有最大的方差值,第二主成分试图解释数据集中的剩余方差,并且与第一主成分不相关(正交),第三主成分试图解释前两个主成分没有解释的方差,依此类推。这样实现了对原始数据的降维,也保证了新的变量保留原始数据的内在信息并彼此具有最大的不相关性。

进行主成分分析转换后,构成特征数据集合X={x

步骤S400、通过对特征数据集进行划分,得到训练集与测试集;

具体的,步骤S400包括:将特征数据集划分为训练集、测试集与验证集。具体的,步骤S300中,在进行主成分分析转换后,构成特征数据集合中,设定一共有n组预测数据,以此可以按照一定比例划分为训练集、测试集和验证集。

步骤S500、基于训练集训练LSTM(Long Short-Term Memory,长短期记忆人工神经网络)模型,得到训练后的LSTM模型;

在一个具体的实施例中,LSTM模型是由多个LSTM单元级联得到的。

具体的,所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:

y

具体的,需要首先构建LSTM模型,先初始化网络参数,并根据实验确定网络层数,隐藏神经元个数等超参数。

具体的,如图3所示,LSTM模型有三个输入分别是x

LSTM的内部构造比较复杂,存在着两种不同的激活函数。首先,将x

同样的道理,将x

c

然后得到c

h

最后可以得到本轮的输入y

y

综上所述,得到了一个完整的单个LSTM的内部结构如图4所示。

图4中,示意了本轮的输入x

LSTM深度学习网络的关键就是内部记忆单c

z

下一步需要确认什么样的新信息存放在神经元的状态中,这个部分有两输入,一个sigmoid层决定什么值LSTM需要更新,一个tanh层创建一个新的候选值向量,这个值会被加入到状态当中,然后需要将这两个信息来产生对状态的更新,叫做输入门。输入门对应的公式表示为:

z

z=tanh(W[h

确定了需要更新的信息之后,就可以更新c

c

同时也要更新系统的神经元状态h

z

h

y

至此便结束了单个LSTM的流程。可以将多个的LSTM单元级联起来就可以成为用于预测煤层含气量的LSTM深度学习网络,如图5所示。

步骤S600、采用测试集对训练后的LSTM模型进行测试;

具体的,步骤51、将训练集中的特征输入LSTM模型,得到LSTM模型的输出值;

步骤52、通过输出值与训练集中的标签值的比较;

步骤53、若比较结果为达到预期,则得到训练后的LSTM模型;若比较结果为未达到预期,则调整LSTM模型的参数后执行步骤51。

具体的,假设预测数据集合X={x

其中n为训练数据集样本组数,y

具体的测试是利用划分出的测试集对已训练好的LSTM神经网络模型展开测试,将得到的模型预测值进行反标准化处理,得到与实际值相对应的物性参数预测值。对比分析预测值和实际值,开展误差分析,进一步改进模型。

步骤S700、若测试通过,则将训练后的LSTM模型设置为煤层含气量预测模型。

具体的,若是测试通过,也即预测值和实际值的差值在预设范围内,则将训练后的LSTM模型设置为煤层含气量预测模型。

若是预测值和实际值的差值在预设范围外,则测试未通过,则执行步骤S800;具体的,步骤S800为:若测试不通过,则对训练后的LSTM模型进行参数调整后执行步骤S500。具体的,如图5所示,若测试不通过,则将训练后的LSTM模型作为LSTM模型被训练数据继续进行训练。

进一步的,在得到煤层含气量预测模型后,该方法还包括:通过验证集对煤层含气量预测模型进行验证,以确定煤层含气量预测模型的预测性能。

具体的,与前述训练与测试的过程类型,将验证集中的特征输入煤层含气量预测模型,得到输出值,将输出值与验证集中的标签值进行比较,基于这两者的差值确定煤层含气量预测模型的预测性能,差值越小,代表预测性能越好。

在获取了煤层含气量预测模型后,可以基于煤层含气量预测模型后进行煤层含气量的预测工作。在煤层含气量预测中,测井曲线、地震属性等由浅到深反映了不同地质时期的地层特征,这些属性的历史序列中存在着潜在的内部联系,其变化趋势包含了预测物性参数的重要信息,LSTM神经网络具有长期记忆功能,能处理序列数据间的长期依赖关系,可有效降低此类关系的影响,其内部的门结构还可以自动的学习序列特征。本方案将多属性预测煤层含气量定义为一个回归问题,即利用多组与煤层含气量有相关性的多属性参数,预测出每组所对应的煤层含气量。利用划分出的验证数据集,输入至LSTM网络中,内部记忆单元C

实施例2

本发明实施例2还公开了一种建立煤层含气量预测模型的装置,如图6所示,包括:

获取模块201,用于获取原始数据;原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;

预处理模块202,用于对原始数据进行数据预处理,得到样本数据;

分析模块203,用于对样本数据进行主成分分析,得到分析后的特征数据集;

划分模块204,用于通过对特征数据集进行划分,得到训练集与测试集;

训练模块205,用于基于训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:

y

测试模块206,用于采用测试集对训练后的LSTM模型进行测试;

设置模块207,用于当测试通过时,将训练后的LSTM模型设置为煤层含气量预测模型。

在一个具体的实施例中,训练模块205包括:

输入模块,用于将训练集中的特征输入LSTM模型,得到LSTM模型的输出值;

比较模块,用于通过输出值与训练集中的标签值的比较;

处理模块,用于若比较结果为达到预期,则得到训练后的LSTM模型;若比较结果为未达到预期,则调整LSTM模型的参数后执行输入模块。

在一个具体的实施例中,该方法还包括:调整模块,用于若测试不通过,则对训练后的LSTM模型进行参数调整后执行训练模块205。

在一个具体的实施例中,划分模块204,用于:

将特征数据集划分为训练集、测试集与验证集;

如图7所示,该装置还包括:验证模块208,用于通过验证集对煤层含气量预测模型进行验证,以确定煤层含气量预测模型的预测性能。

在一个具体的实施例中,数据预处理包括:

基于箱线图分析原始数据中的异常值,并对分析出的异常值进行删除;

当检测原始数据存在缺失的值时进行差值补全处理;

对进行了删除和差值补全处理后的原始数据进行归一化处理。

在一个具体的实施例中,各特征是对测井的同一深度位置进行探测得到;

所述地层特征包括厚度、顶底板岩性特征;所述地球物理测井特征包括电阻率、密度、自然伽马值、孔隙度;所述地球物理地震特征包括振幅、波阻抗;所述煤的工业组分特征包括固定碳含量、挥发分含量、灰分含量。

在一个具体的实施例中,LSTM模型是由多个LSTM单元级联得到的。

所述内部记忆单元包括遗忘门、输入门和输出门;其中,所述遗忘门通过以下公式表示:z

所述输入门通过以下公式表示:

z

z=tanh(W[h

实施例3

本发明实施例3还公开了一种终端,包括处理器与存储器,存储器中存储有应用程序,应用程序在处理器上运行时执行实施例1中的建立煤层含气量预测模型的方法。

实施例4

本发明实施例4还公开了一种存储介质,存储介质中存储有应用程序,应用程序在处理器上运行时执行实施例1中任意一项的建立煤层含气量预测模型的方法。

以此,本发明实施例提出了建立煤层含气量预测模型的方法、装置、终端与存储介质,该方法包括以下步骤:步骤1、获取原始数据;原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;步骤2、对原始数据进行数据预处理,得到样本数据;步骤3、对样本数据进行主成分分析,得到分析后的特征数据集;步骤4、通过对特征数据集进行划分,得到训练集与测试集;步骤5、基于训练集训练LSTM模型,得到训练后的LSTM模型;步骤6、采用测试集对训练后的LSTM模型进行测试;步骤7、若测试通过,则将训练后的LSTM模型设置为煤层含气量预测模型。通过本方案,通过主成分分析对数据进行处理,实现了对原始数据的降维,也保证了得到的数据保留原始数据的内在信息并彼此具有最大的不相关性,同时基于对LSTM模型进行训练建立的煤层含气量预测模型,可以预测煤层气,且预测速度快,效率高,可以实现大规模应用。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号