首页> 中国专利> 一种基于CART算法的油气钻井机械钻速预测与优化方法

一种基于CART算法的油气钻井机械钻速预测与优化方法

摘要

本发明涉及一种基于CART算法的油气钻井机械钻速预测与优化方法,包括:步骤1,收集数据;步骤2,分开次进行数据预处理,将8个钻井参数作为不同的特征属性及其包含的钻井数据作为输入变量X,机械钻速作为输出变量Y,得到初始数据集D1;步骤3,数据相关性分析,得到不同开次的训练数据集D2;步骤4,利用CART算法,建立不同开次的训练数据集D2中输入变量与机械钻速之间的回归树模型;步骤5,分析生成的二叉树的每个叶节点信息,叶节点的均值作为机械钻速的预测值;步骤6,由上至下遍历每一层的节点划分结果,得出不同的钻井参数推荐值;步骤7,机械钻速最优判断。本发明能够缩短钻井周期,降低钻井成本,从而大幅提高油气资源的开发效率。

著录项

  • 公开/公告号CN112487582A

    专利类型发明专利

  • 公开/公告日2021-03-12

    原文格式PDF

  • 申请/专利权人 西南石油大学;

    申请/专利号CN202011454345.6

  • 申请日2020-12-10

  • 分类号G06F30/17(20200101);G06F30/27(20200101);G06K9/62(20060101);G06Q10/04(20120101);G06Q50/04(20120101);E21B49/00(20060101);E21B45/00(20060101);G06F111/10(20200101);

  • 代理机构51218 成都金英专利代理事务所(普通合伙);

  • 代理人袁英

  • 地址 610500 四川省成都市新都区新都大道8号

  • 入库时间 2023-06-19 10:11:51

说明书

技术领域

本发明涉及石油勘探开发领域一种机械钻速的预测与优化方法,特别是涉及一种基于CART算法的机械钻速预测与优化方法。

背景技术

近年来,随着油气资源勘探规模的增加和开发力度的加强,各油田的油气勘探目标逐渐由浅部地层转向深部地层,而深井、超深井、水平井及大位移井是实现深部地层油气资源高效开发的最佳方式。在深井超深井钴采过程中,由于地质条件复杂、井下条件严苛等原因,工程施工作业面临很大挑战。为了更好地开发深部油气资源,缩短钻井周期,降低钻井成本和提高钻井效率是大势所趋,而解决这些问题最直接、最有效的途径就是提高机械钻速。因此,能够较好地预测机械钻速,对于优化钻井工艺,缩短钻井周期,降低钻井成本,有着十分重要的意义。

从20世纪50年代开始,一些学者(Young F S.Computerized Drilling Control[J].Journal of Petroleum Technology,1969,21(04):483-496)就考虑钻压、转速、排量等钻井工艺主要因素,利用回归分析的方法得出钻速方程(Bourgoyne A T,Young F S.AMultiple Regression Approach to Optimal Drilling and Abnormal PressureDetection[J].Society of Petroleum Engineers Journal,1974,14(04):371-384),提出了结合现场钻井数据用多元回归的方法来确定钻速方程中的各项系数,以此建立了用于实际现场需求的钻速方程来指导机械钻速预测和优化。后来,有学者(Warren TM.Penetration-rate performance of roller-cone bits[J].SPE DrillingEngineering,1987,2(01):9-18)综合考虑了钻压、转速、钻头尺寸、钻头型号、岩石强度和钻井液性质等多个影响因素对机械钻速的影响,建立了适用于软地层的机械钻速方程。近年来,随着大数据技术的快速发展以及钻井数据的急速增长,用机器学习的方法对数据进行挖掘并应用到钻井工业中的情况已有多例,在钻头优选(毕雪亮,闫铁,陶丽杰.庆深油田神经网络法优选钻头研究[J].哈尔滨工程大学学报,2006,27(z1):111-114)、岩性识别(单敬福,陈欣欣,赵忠军,等.利用BP神经网络法对致密砂岩气藏储集层复杂岩性的识别[J].地球物理学进展,2015(3):1257-1263)等领域中已经得到了有效的应用,但是在用机器学习的方法预测和优化机械钻速方面却鲜有研究和报道。

发明内容

本发明的目的在于提供一种基于CART算法的油气钻井机械钻速预测与优化方法,该方法原理可靠,操作简便,能够提高钻井效率,缩短钻井周期,降低钻井成本,从而大幅提高油气资源的开发效率,具有广阔的市场应用前景。

为达到以上技术目的,本发明采用以下技术方案。

本发明基于现场录井测井的钻井数据,通过从钻井数据中筛选出能够影响机械钻速的钻井工程参数,利用相关分析模型确定各钻井工程参数与机械钻速之间的相关性大小,然后利用CART算法对钻井工程参数进行回归计算,得到机械钻速影响因素的权重模型,从而更好地对机械钻速进行预测和优化。

一种基于CART算法的油气钻井机械钻速预测与优化方法,依次包括以下步骤:

步骤1:收集数据。一个模型适用于一个特定的区块,因此需要选定一个区块,将所有可用的钻井数据,即整米录井数据和测井数据,整理到统一的Excel表格或TXT文本中,作为原始钻井数据。

步骤2:分开次进行数据预处理。将原始钻井数据中的井深、钻头类型、钻头尺寸、地层类型4个参数作为划分不同开次的依据进行数据预处理,影响机械钻速的钻井参数包括钻井工程参数和原始地层参数,所述钻井工程参数为钻压、转速、扭矩、钻井液密度、排量和立管压力,所述原始地层参数为声波时差AC和自然伽马GR,将8个钻井参数作为不同的特征属性,每个特征属性所包含的钻井数据作为输入变量X,机械钻速作为输出变量Y,得到初始数据集D

步骤3:数据相关性分析。利用相关系数法分析初始数据集D

步骤4:模型建立与训练。利用CART算法(李航.统计学习方法.第2版[M],北京:清华大学出版社,2019),建立不同开次的训练数据集D

步骤5:预测机械钻速。利用CART算法得到的具有二叉树结构的回归树模型,分析生成的二叉树的每个叶节点信息,采用叶节点的均值(value)作为机械钻速的预测值。

步骤6:推荐钻井参数。利用CART算法得到的具有二叉树结构的回归树模型,从顶端到底端表征输入变量对机械钻速的影响强弱,最顶端表示最强,最底端表示最弱,每一层节点给出了输入变量的最优推荐值,由上至下遍历每一层的节点划分结果,得出不同的钻井参数推荐值。

步骤7:机械钻速最优判断。将钻井参数推荐值代入CART算法回归树模型,得到机械钻速优化值,将机械钻速优化值与机械钻速预测值的差值小于10%做为最优判断条件,若是达到最优判断条件,则推荐使用步骤6得到的钻井参数,否则,返回步骤3重新进行相关性分析。

进一步地,所述步骤2中分开次进行数据预处理,所述的开次是指钻井过程中使用不同尺寸钻头进行钻进,钻头尺寸随钻井深度依次减小,每更换一次钻头尺寸及下入一层套管,称为一个开次。

进一步地,所述步骤2初始数据集D

D

进一步地,所述步骤3中相关系数为Pearson相关系数,所述Pearson相关系数是一项用来评估两个变量X、Y之间关系密切程度的统计指标,适用于两个连续变量之间线性关联情形的描述,其值不受变量单位与集中性的影响,Pearson相关系数通过如下公式计算:

其中,x

进一步地,所述步骤4中的CART算法是回归树算法的一种,具体原理说明如下:

步骤4-1,确定输入变量与输出变量。假设X={x

步骤4-2,数据集的划分。回归树利用二分策略划分数据,与分类树不同的是,回归树将输入变量值小于等于切分点值的数据划分为左子树,将输入变量值大于切分点值的数据划分为右子树。假设经过一次回归树划分后已将输入数据集分成两个左右单元R

步骤4-3,最优特征属性的选择。CART回归树采用平方误差和来选择每个节点划分的最优特征属性。平方误差和的计算公式如下:

对每个特征属性下的输入变量值,计算输入变量值二分后的两个子数据集所对应的输出变量值的平方误差和,选择平方误差和最小的特征属性作为最优特征属性T

步骤4-4,最优切分点的选择。在确定最优特征属性T

此时左子树和右子树的最优输出值

最优输出值

步骤4-5,按最优特征划分数据集。在确定最优特征属性T

步骤4-6,回归树的生成。遍历所有输入特征属性与输入变量,找到最优的切分特征属性j,构成一个最优值对(j,s),依次将输入空间划分为左右两个单元。接着,对每个子单元重复上述划分过程,直到满足停止条件为止,这样就生成了一棵回归树。

进一步地,所述步骤5中预测机械钻速,过程如下:设定回归树的最大划分深度为n,第一层通过计算不同特征属性的最小均方误差MSE,选出最小均方误差MSE最小的特征属性作为最优特征属性,得到最优切分点,数据集被一分为二,分成左子树和右子树;由第一层划分得来的两个节点作为第二层节点的父节点,以相同方法继续划分得到4个子节点,以此类推得到每一层的子节点;在第n层的所有子节点划分完成后停止,得到最终的叶节点,分析生成的二叉树的每个叶节点信息,叶节点的均值(value)即为机械钻速预测值。

与现有技术相比,本发明具有以下有益效果:本发明能够实现对钻井历史数据的快速分析,利用本发明的方法,实现对钻井参数的最优化设计,达到提高钻井效率、降低钻井成本的目标。

附图说明

图1为本发明一种基于CART算法的油气钻井机械钻速预测与优化方法流程图。

图2为CART回归树算法流程图。

图3为某油田区块某井三开的输入变量与机械钻速之间的相关系数计算结果。

图4为实施例的训练集分数和测试集分数随回归树划分深度的变化曲线。

图5为实施例的预测机械钻速与实际机械钻速对比散点图。

图6为实施例优化后机械钻速与实际机械钻速对比曲线图。

具体实施方式

下面根据附图和实例进一步说明本发明,以便于本技术领域的技术人员理解本发明。但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,均在保护之列。

实施例(以某油田区块某井三开为例)

一种基于CART回归树模型的油气钻井机械钻速预测与优化方法(流程见图1),依次包括以下步骤:

步骤1:收集数据。获取某油田区块内所有井的每米录井数据和测井数据,为每口井建立单独的文件夹和Excel表格,将不同来源的数据有秩序地整理到对应的每一口井的数据表格中,作为原始数据集。

步骤2:数据的预处理。在相关模型建立过程中,需严格控制参与分析的输入参数。数据预处理分开此进行,首先,根据井深、钻头类型、钻头尺寸、地层类型4个参数将原始钻井数据划分为不同的开次,根据钻头尺寸的大小按开次处理每口井的数据,为每口井每个开次的数据单独建立新的表格文件,方便后续调用。每个开次所对应的钻头尺寸分别为:三开(333.8mm)、四开(241.3mm)、五开(168.3mm)。其次,确定影响机械钻速的8个钻井参数(钻井工程参数包括:钻压、转速、扭矩、钻井液密度、排量、立管压力;原始地层参数包括:声波时差AC、自然伽马GR)作为输入特征属性T,8个特征属性所包含的全部钻井数据作为输入变量X,机械钻速作为输出变量Y,得到初始数据集D

步骤3:数据相关性分析。利用Pearson相关系数分析输入变量与机械钻速的相关性,计算输入变量与机械钻速之间的相关系数,并对相关系数进行排序,根据相关性系数高低确定CART算法模型训练输入变量,机械钻速为输出变量。通过Python编写代码并导入步骤2中的初始数据集D

通过对三开输入变量与机械钻速之间的相关性分析,可以得到输出的柱状图结果(见图3)。根据柱状图中不同输入变量与机械钻速之间的相关系数大小的绝对值进行排序,可以总结得到所有钻井参数与机械钻速之间的相关系数关联程度:

筛选出与机械钻速呈低度、中度、高度相关的参数项,对相关系数的绝对值大小进行排序,根据相关性系数高低确定某油田区块某井三开的CART算法模型训练输入特征属性,包括钻井液密度、扭矩、转速、排量、AC、钻压,进而得到训练数据集D

步骤4:模型建立与训练。利用CART算法建立输入变量与机械钻速之间的回归树模型,回归树的具体划分步骤见图2。随机划分步骤3中的训练数据集D

步骤5:预测机械钻速。利用CART树算法可以得到具有二叉树结构的回归树模型,分析生成的二叉树的每个叶节点信息可以获得机械钻速的预测值。通过回归树模型得到的机械钻速预测值与实际值的对比散点图见图5,具体分析如下:

第一层:通过计算导入数据集中不同特征属性之间的最小均方误差MSE,选出了钻井液密度这一特征属性和其值1.255作为切分点。然后数据集以钻井液密度值1.255作为切分点被一分为二,当钻井液密度小于等于该值时符合条件的数据被划分到左子树,其余数据则被划分到右子树;

第二层至第五层:由第一层划分得来的两个节点(第二层)作为第三层的节点的父节点,以相同的逻辑继续进行划分得到4个子节点,以此类推得到每一层的子节点。需要指出,当子节点的数据量太小或满足划分条件时则自动停止,此时的子节点则为根节点;

第六层:设定回归树的最大划分深度为5,在第五层的所有子节点划分完成后自动停止,得到最终的叶节点。其中MSE表示最小均方误差,samples表示该节点的数据量,value表示机械钻速的预测值。

步骤6:推荐钻井参数。利用CART树算法可以得到具有二叉树结构的回归树模型,分析生成的二叉树每一层的子节点信息,可以获得具体的输入变量及其取值范围,遍历由上至下每一层的节点特征空间划分结果,得到不同输入变量对机械钻速的影响强弱和钻井参数推荐值。

以回归树模型最左侧的一条分叉路线为例进行说明:最终有15组钻井深度的最佳机械钻速预测值为5.01m/h,影响这组井深区间的机械钻速因素由强到弱分别为钻井液密度、转速、扭矩,这些影响因素的取值分别为钻井液密度=1.255、转速=106.5、扭矩=9.95,此范围则作为钻井参数推荐值。同理可得其它支路线的钻井参数推荐值。

步骤7:机械钻速最优判断。将钻井参数推荐值代入CART算法回归树模型预测机械钻速,判断是否机械钻速最优,若是最优则推荐钻井参数,若非最优,则返回步骤3重新进行相关性分析。

利用本发明对某油田区块的钻井数据进行相关特征分析和建立回归树预测模型,可以发现在地层条件相似、井身结构相同、钻头类型与钻头尺寸相同的情况下,钻井开次不同即钻井深度不同时,影响机械钻速的因素的重要程度也各不相同。比较每个开次钻井工程参数相关系数大小,在大约3000~5000m段钻井深度影响机械钻速较大的因素是扭矩和钻井液密度,相关系数大于0.70,呈高度相关;大约5000~6000m段钻井深度影响机械钻速较大的因素是钻压和GR,呈中度相关;大约6000~7000m段钻井深度影响机械钻速较大的因素是扭矩和立管压力,呈中度相关。由步骤4可以得到训练集分数和测试集分数随回归树划分深度的变化曲线(见图4)和基于CART回归树的可视化结果图。根据训练集分数和测试集分数随回归树划分深度的变化曲线可以看出,回归树在最大划分深度为5时模型测试集分数最优,此时模型的决定系数R

以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号