首页> 中国专利> 基于多源随钻信息融合的岩体特征实时预测方法和系统

基于多源随钻信息融合的岩体特征实时预测方法和系统

摘要

本发明属于钻探技术领域,具体涉及一种基于多源随钻信息融合的岩体特征实时预测方法和系统。所述方法包括如下步骤:步骤1,实时采集钻探过程中的钻速、扭矩、振动Y和振动Z四种随钻信息;步骤2,将钻速、扭矩、振动Y和振动Z分别输入机器学习模型,得到四个单一信号源的分类预测结果;步骤3,基于条件概率与最小风险决策级融合理论,将步骤2得到的四个单一信号源的分类预测结果进行融合,得到最终的岩体特征预测结果。本发明还提供实现上述方法的系统。本发明通过选择四种合适的信号源,并通过基于决策级的多源数据融合实现了更加准确的岩体特征实时预测,在钻探领域中具有很好的应用前景。

著录项

  • 公开/公告号CN115680645A

    专利类型发明专利

  • 公开/公告日2023-02-03

    原文格式PDF

  • 申请/专利权人 成都理工大学;

    申请/专利号CN202211182857.0

  • 申请日2022-09-27

  • 分类号E21B49/00;E21B44/00;E21B45/00;G06N20/00;

  • 代理机构成都高远知识产权代理事务所(普通合伙);

  • 代理人李安霞;郑勇力

  • 地址 610000 四川省成都市二仙桥东三路1号

  • 入库时间 2023-06-19 18:34:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-02-03

    公开

    发明专利申请公布

说明书

技术领域

本发明属于钻探技术领域,具体涉及一种基于多源随钻信息融合的岩体特征实时预测方法和系统。

背景技术

随着人类对地下空间开发的需求,出现了许多新的工程技术难题,其中基于钻进过程的特征信号实时预测岩体力学特征就是一个亟待解决且极具挑战的问题。基于钻探手段实时获取所钻遇地层的岩体特征能够有效保证钻进效率和取芯质量,并且可以减少取芯数量,对于整个地质勘察技术的发展具有重大意义。一些学者针对这部分及其相关的内容开展了一系列研究。

部分学者从钻头切削机理的角度研究钻进参数与岩体特性的一些关系。基于轴向力和扭矩功的平衡理论以及钻井过程中的岩石切割能量守恒原理, Karasawa等人导出了岩石可钻性强度和钻机扭矩和轴向力的公式,描述了单轴抗压强度和钻孔参数之间的关系。宋等人引入切削岩石机理分析角板钻头切削刃上的应力,建立了钻头轴向载荷、扭矩和岩土力学参数的数学模型。王琦等人通过建立室内力学试验模型,对钻进参数与岩石的内聚力和内摩擦角之间建立关联力学模型,并通过室内试验数据进行验证。

随着人工智能技术的发展,部分学者在利用机器学习方法开展岩石与岩体的相关特性研究方面取得了一系列的研究成果。例如基于钻井速率、转速和扭矩反演岩石力学参数。岳中琦等人开发了钻井过程监控器(DPM)并将其部署在中国香港风化火山岩中,结果表明,冲击旋切钻机对相同均匀连续岩体的钻速是固定的。谭卓英等人通过野外钻井试验发现,有效轴压、钻具转速、钻进率等监测参数对边界处岩石强度变化反应良好。AhmedGowida等人通过采集钻进速率(ROP)、泥浆泵送速率(GPM)、立管压力(SPP)、每分钟转数(RPM)、扭矩(T)和钻压(WOB),基于人工神经网络(ANN)、自适应神经模糊推理系统(ANFIS)和支持向量机(SVM)等建立了钻进参数与岩石单轴抗压强度的关系。除了基于钻进参数预测完整岩石单轴抗压强度和岩性以外,一些学者也开始注意到利用钻进参数对岩体质量的预测,主要是利用 TBM掘进机工作过程中的实时信号基于机器学习方法反演岩体质量。但受限于地质钻探设备的小型化以及轻型化,在地质勘察领域几乎没有直接基于钻进参数的岩体质量反演研究。

综上所述,从钻头切削岩体的角度开展研究能够对钻进参数的相关机理和规律做出一定的解释,但研究很难完整准确地表达复杂地质对象的边界条件,与真实的地质背景存在很大的差异。而基于实测数据的机器学习方法反演,往往由于单一信号源的局限性或者是对多源信号的融合和挖掘有限,忽略了对多类传感信号源的深度挖掘,导致预测结果存在很大的偶然性和局限性。因此,本领域亟需一种融合多种信号源的机器学习方法,从而实现对岩体特征更加准确的预测。

发明内容

本发明属于钻探技术领域,具体涉及一种基于多源随钻信息融合的岩体特征实时预测方法和系统,目的在于根据多源随钻信息,更加准确地对岩体特征进行预测。

一种基于多源随钻信息融合的岩体特征实时预测方法,包括如下步骤:

步骤1,实时采集钻探过程中的钻速、扭矩、振动Y和振动Z四种随钻信息;

步骤2,将钻速、扭矩、振动Y和振动Z分别输入机器学习模型,得到四个单一信号源的分类预测结果;

步骤3,基于条件概率与最小风险决策级融合理论,将步骤2得到的四个单一信号源的分类预测结果进行融合,得到最终的岩体特征预测结果。

优选的,步骤2中,所述机器学习模型是基于KNN算法的模型。

优选的,用于训练步骤2中的机器学习模型的训练数据的样本量为250 个。

优选的,用于训练步骤2中的机器学习模型的训练数据采用如下方式进行扩充:从起始点每隔0.06m为间隔设置回次周期。

优选的,用于训练步骤2中的机器学习模型的训练数据中,采用smote 插值算法对不平衡样本进行处理。

优选的,所述分类预测结果或所述岩体特征预测结果是对岩体基本质量分级中的Ⅱ、Ⅲ、Ⅳ、Ⅴ类岩体进行分类。

优选的,步骤3中,所述基于条件概率与最小风险决策级融合理论采用如下三类风险矩阵中的一种:

或,

或,

本发明还提供一种用于实现上述基于多源随钻信息融合的岩体特征实时预测方法的系统,包括:

输入模块,用于输入钻速、扭矩、振动Y和振动Z四种随钻信息;

计算模块,用于根据所述随钻信息计算得到最终的岩体特征预测结果;

输出模块,用于输出最终的岩体特征预测结果。

本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现上述基于多源随钻信息融合的岩体特征实时预测方法。

本发明中,所述“钻速”反映钻进的难易程度,对于同一套钻进设备,实际施工过程中,在钻遇不同地层时,会有不同的钻进速度,钻进速度既可以反映地层岩性的变化,同时能够综合体现地下空间岩体的质量特征。所述“扭矩”是钻机为钻进设备回转钻进提供的回转力,回转力矩使得设备能够进行有效切入岩体,扭矩能够较好地体现地下空间岩体的软硬程度与破碎程度。“三轴振动加速度”与以上直接监测传感器相比,振动传感器反映的信息量更为丰富,但是信息的监测不够直接,振动信号是钻进设备与岩体激励过程的振动以及携带机械的附加振动叠加形成的,由于采用振动传感器的频率较高,极高的采样频率在保证丰富的信息监测的同时,也给随钻反演的算法带来了极大困难。其中,“振动Y”是钻进方向的振动加速度,“振动X”和“振动Z”根据“振动Y”的方向按照右手坐标系确定方向。

本发明基于钻速、扭矩、振动Y和振动Z四种随钻信息分别采用机器学习模型获得单一信号源的分类预测结果,对基于四类信号源所形成的预测结果矩阵基于条件概率最小风险理论,通过设置不同的风险等级从决策级融合对异类信号的分类结果实现融合,从而实现了对几类样本岩体质量等级的有效预测,有效提升最终整体的分类精度与少量样本类的分类精度。通过实验发现,经过决策级融合后几类岩体的识别准确率最高可达97%,较之基于单一信号源的反演结果有了明显的提高。

显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。

以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。

附图说明

图1为岩体质量分级方法;

图2为钻进回次重叠取样方法示意图;

图3为数据源相关性系数;

图4为smote插值前后样本数量的比值;

图5为k值对模型预测精度Pre的影响;

图6为基于各数据源特征的最优预测样本结果;

图7为样本数量的增加对预测精度的提高(以pre为例);

图8为同预测组合下的各类岩体的条件概率;

图9为基于条件概率的预测结果;

图10为风险系数矩阵;

图11为决策级融合后样本的预测结果;

图12为基于最小风险原理的预测结果;

图13为几类岩体在不同融合条件下的预测模型关键参数。

具体实施方式

需要特别说明的是,实施例中未具体说明的数据采集、传输、储存和处理等步骤的算法,以及未具体说明的硬件结构、电路连接等均可通过现有技术已公开的内容实现。

实施例1基于多源随钻信息融合的岩体特征实时预测方法和系统

本实施例的系统包括:

输入模块,用于输入钻速、扭矩、振动Y和振动Z四种随钻信息;

计算模块,用于根据所述随钻信息计算得到最终的岩体特征预测结果;

输出模块,用于输出最终的岩体特征预测结果。

采用上述系统,进行岩体特征实时预测的方法包括如下步骤:

步骤1,实时采集钻探过程中的钻速、扭矩、振动Y和振动Z四种随钻信息;

步骤2,将钻速、扭矩、振动Y和振动Z分别输入KNN模型,得到四个单一信号源的分类预测结果;

步骤3,基于条件概率与最小风险决策级融合理论,将步骤2得到的四个单一信号源的分类预测结果进行融合,得到最终的岩体特征预测结果。

其中,所述分类预测结果或所述岩体特征预测结果是对岩体基本质量分级中的Ⅱ、Ⅲ、Ⅳ、Ⅴ类岩体进行分类。

其中,条件概率与最小风险决策级融合理论属于现有技术,其具体的原理如下:

条件概率是指事件ω在另外一个事件X已经发生条件下的发生概率。表示为:P(ω|X)。对于岩体质量分级预测来说,P(ω|X)指的是在几类传感器分别预测的岩体质量等级的组合下最终决策为某一类岩体的概率。

而最小风险决策理论是统计模式识别中的一个基本方法,这种方法在对数据进行条件概率分析的基础上考虑了不同类别的错分可能带来的损失。该决策理论会考虑每一种特征组合关系对各决策类别的概率大小,不需要考虑融合信息的特征数量或从属关系,只需要每一种特征组合相互独立即可。对于不同工程的岩体错分的风险不完全相同,例如将岩体从Ⅲ类错分为Ⅴ类的风险较之将岩体从Ⅴ类错分为Ⅲ类,前者可能会导致后期工程的费用提高,而后者可能直接导致工程设计不够严谨从而导致工程质量降低,引起严重的工程事故,因此几类不同的分类本身具有不同的风险系数。根据实际工程的勘察和预测需要通过设置不同的风险系数能够选择最合适的期望预测结果,进而实现基于输入随钻信号源融合的岩体质量分级。本实施例采用的决策级融合就是在对每一类决策组合的分级概率计算的基础上考虑错分矩阵并计算最小风险,从而完成最终的决策。

R(α

上式,R(α

在本实施例中,根据对不同类型岩体的分类结果准确性的需求,所述基于条件概率与最小风险决策级融合理论采用如下三类风险矩阵中的一种:

或,

或,

下面通过具体的实验例对本发明的技术方案进行进一步的说明。以下实验例中,未具体说明的方法步骤可参照实施例1进行设置。

实验例1输入数据的选择

一、数据库的构建

本实验例采用的数据来自某工程,所跨越地层为T3xj,所跨越地层岩性主要包括粉砂岩、泥质粉砂岩、薄煤层,地质条件极为复杂。主要钻进设备为ROCK-600型全液压便携式钻机,采用绳索取芯模式取芯钻进,数据有效采集长度为80m,其中包括9.6m的覆盖层(不作为本实验例的主研数据),因此本实验例总共采集到70.4m的全过程随钻信号特征及全段岩体特征信息。

本实验例在钻机上布置了4种传感器,共监测到6类信号源,包括钻压、扭矩、钻速、振动-X、振动-Y、振动-Z。其中前三种是通过钻机的仪表盘信息记录并插值获得,振动信号是通过安装在钻机前端的三轴振动加速度直接测得。

钻压:钻头与岩体直接接触的位置作用的压强,可以直接反映作用在钻头上的作用力,与岩体的强度直接相关,同时受到给进总压力的影响。

钻速:反映钻进的难易程度,对于同一套钻进设备,实际施工过程中,在钻遇不同地层时,会有不同的钻进速度,钻进速度既可以反映地层岩性的变化,同时能够综合体现地下空间岩体的质量特征。

扭矩:钻机为钻进设备回转钻进提供的回转力,回转力矩使得设备能够进行有效切入岩体,扭矩能够较好地体现地下空间岩体的软硬程度与破碎程度。

三轴振动加速度:与以上直接监测传感器相比,振动传感器反映的信息量更为丰富,但是信息的监测不够直接,振动信号是钻进设备与岩体激励过程的振动以及携带机械的附加振动叠加形成的,由于采用振动传感器的频率较高,极高的采样频率在保证丰富的信息监测的同时,也给随钻反演的算法带来了极大困难。其中,“振动Y”是钻进方向的振动加速度,“振动X”和“振动Z”根据“振动Y”的方向按照右手坐标系确定方向。

二、机器学习样本库的构建

1、岩体标签的构建

对于收集到的现场70.4m钻进全过程,基于RMR质量的等级划分方法,根据现场原位试验和岩体编录,实现整个研究段的数据精细化描述和岩体质量分级,由于本次钻探过程未揭露地下水,故主要考虑单轴抗压强度、RQD、节理情况、节理间距几个要素的影响,图2为本次岩体编录的方法示意图。

从起始点每隔1.5m作为一个回次周期,单个回次周期可提取47个回次单元,同时按照0.06m为间隔(相邻回次重叠率为96%)设置新的回次周期,较之不考虑重叠率的单一回次周期,数据总量共扩充了26倍,该方法对钻孔信息进行了充分有效的挖掘。钻进回次重叠取样方法如图3所示。

2、监测信号的预处理

关于数据源特征提取,由于每一类信号的采样频率及信号特征存在很大的差异,故根据不同数据源的信号特征差异,分别提取不同的特征。扭矩反映的回转切削力的大小,本实验例中传感器搜集到的数值包括整个回次内每一处回转力的具体大小,故直接提取它的数值特征,对于单一研究回次,选取该回次内最大值、最小值、平均值、方差反映扭矩在该回次内的特征;钻速记录数据相对较少,主要是通过记录每个固定间隔距离内的时间从而间接计算,因此钻速的数据表征选取每一回次的钻进速度v以及速度的变化

基于各要素的均值与标签相关性检验结果,相关性检验结果如图4所示,钻压以及X方向的振动加速度与最终岩体质量具体打分值相关性较高较低,其余几类信号与标签值的相关性相对较高,且信号源之间的相关性较低,故最终选择钻速、扭矩、振动Y、振动Z作为输入信号源参与机器学习预测。

3、不平衡样本的处理方法

上述方法进行处理后的岩体类别,几类岩体具有较高的不平衡性,因此需要基于有效的数据插值方法对小样本数据进行合理化的插值,Smote算法(Synthetic MinorityOversampling Technique)的思想是合成新的少数样本,对于每一个少数类样本a,从其最近邻(按照欧式距离)挑选b,然后从a,b 中选取一个新点作为新的少数类样本。

基于smote插值算法,最终获得的样本在均衡性上有了很好的表现。插值前后具体的样本比值如图5所示。

三、单一信号源预测结果

对原始样本和经过数据增强后的样本分别按照8:2的比例随机分为训练集和测试集,原始样本共1222个,按照smote数据插值后获得的样本共2580 个,原始样本和数据增强后分别获得测试集样本240个及539个。对各类信号源,提取的特征基于KNN算法分别进行训练和预测,基于欧式距离度量最小距离,并分别测试k=3、4、5、6、7几类不同情况下的精度,根据实验结果显示,K值的选择对于不同的信号源预测结果有不同的适应性,经过数据增强后的样本在预测精度上有更好的表现。从图6中可以看出,k值的选择对于同一类信号的同一样本的数据结果具有显著的影响。Ⅱ类和Ⅴ类岩体的预测精度随k值的变化相对变化较大,Ⅲ类岩体和Ⅴ类岩体的预测精度相对较为稳定,经过扩充后达到类别平衡的数据所训练的模型受k的影响相对较小。

图7反映了基于各传感信号的预测最优结果,直观的表现了各类传感信号源在基于KNN算法的最优预测结果下每个验证样本的预测准确与否。如下表所示:

在所有单一的信号源中,几类信号源对于各类岩体的预测精度存在明显的互补和差异。从总的预测准确性来说。扭矩信号对于原始数据的预测精度为70.3%,经过样本扩充后的预测精度为71.1%。钻速信号对于原始数据的预测精度为78.9%,经过样本扩充后的预测精度为73.5%。振动-Y信号对于原始数据的预测精度为78.1%,经过样本扩充后的预测精度为78.4%。振动-Z信号对于原始数据的预测精度为65.6%,经过样本扩充后的预测精度为 71.2%。从总体而言,几类信号源的预测精度除振动-Z信号有明显的差距外,其他几类信号源差异较小。具体到几类岩体的具体分类情况来看,基于振动信号(Y、Z)的的反演模型对于Ⅱ类和Ⅴ类岩体有较高的分类准确性,以振动-Y信号为例,其扩充样本经过KNN算法分类后的预测Ⅱ类岩体结果PRC、 REC和F1值分别为0.85、0.69和0.76,对Ⅴ类岩体的预测结果PRC、REC 和F1值分别为0.89、0.74和0.81。相较于扭矩和钻速两类钻进参数在预测精度上有显著的提升。以扭矩信号的反演结果为例,基于扩充样本的扭矩信号经过KNN算法分类后的预测Ⅱ类岩体结果PRC、REC和F1值为0.67、0.56 和0.61,对Ⅴ类岩体的预测结果PRC、REC和F1值分别为0.66、0.7和0.68。但从对Ⅲ类和Ⅳ类岩体的评价结果来看,基于振动信号源的反演结果并没有表现出比其他两类信号源更优秀的特性,例如基于钻速信号源对Ⅳ类岩体的预测结果PRC、REC和F1值分别为0.75、0.793和0.771,而基于振动-Y信号源对Ⅳ类岩体的预测结果PRC、REC和F1值分别为0.63、0.75和0.69。

从训练结果总体来看,增加样本较之原始数据精度有一定的提高,但并不绝对,如图8所示,在训练样本量低于250个,增加训练样本数能够显著提高预测的精度,当训练样本量超过500后,部分类别的预测精度反而下降,例如Ⅳ类岩体的分类效果在数据扩充近一倍后,对于扭矩、钻速、振动-Y几类信息源PRC均呈现出了下降趋势,且对于Ⅱ类岩体和Ⅴ类岩体等原始小样本类别,分类精度依旧不理想,经过smote插值后生成的新样本虽然对于Ⅱ类岩体和Ⅴ类岩体的训练结果有较好的分类预测效果,但对于Ⅲ类和Ⅳ类岩体的预测效果有反向抑制。而几类传感信息本身对于数据样本的敏感程度也各有不同,例如扭矩信号对于样本量的增加预测精度会呈现一个先增后减的态势,而振动-Y信号对于在实验所涉及的样本量小,基本上依然保持着精度随样本量增加而增加的趋势。由此可见,单一信号源的预测很难同时兼顾到几类岩体的正确分类,而单纯通过样本数据增强的方法能够在一定程度上提高某几类小样本的分类准确性,但对于其精度的改善十分有限,甚至还会降低原始数据中多样本的分类准确性。

实验例2决策级融合结果

本实验例采用实验例1选择的输入数据,对决策级融合结果进行研究。

基于条件概率,按照每种组合下的最大条件概率作为最终决策类别,根据KNN分类器预测的分类结果显示,视四种传感器得到的最终结果构成了一个预测矩阵A,理论上预测矩阵A有4×4×4×4=256种不同的类型,最终结果显示本研究中预测数据共有127种预测组合,每种预测组合下对应的条件概率如图9所示。基于最大条件概率的几类岩体的决策级融合结果如图10所示。

分别设置对称风险矩阵以及非对称风险矩阵,对不同类别岩体错分的代价通过设置风险系数矩阵,从而选择在该判断矩阵下最小的风险作为该条件下的最终决策。本实验例将钻速、扭矩、振动—Y、振动—Z四种信号源分别独立采用KNN算法进行岩体质量分级预测,确定不同决策下的风险系数,本实验例中选择的风险系数矩阵包括三类,其中a类矩阵为对称风险矩阵(λ

从最终的预测结果来看,基于最小风险的融合方法相较于直接通过条件概率决定的融合方法而言,在几类岩体的预测正确性上都有了较为明显的提升。如图13所示,直观显示了在集中融合条件下的错误预测样本的分布, fusion1,fusion2,fusion3,fusion4分别代表直接基于条件概率的融合,第一类风险矩阵的融合,第二类风险矩阵的融合,第三类风险矩阵的融合。

相较于单一信号源的预测结果,决策级融合后的多分类预测结果有较好的提升。其中直接基于条件概率的决策级融合对Ⅱ、Ⅲ、Ⅳ、Ⅴ类岩体预测的精度分别可达0.8、0.88、0.96、0.9;基于不考虑相互错分影响大小的对称风险矩阵对于Ⅱ、Ⅲ、Ⅳ、Ⅴ类岩体预测的精度分别为0.9、0.85、0.98、 0.84;考虑到相互错分的代价大小的两类不同风险矩阵,对于Ⅱ、Ⅲ、Ⅳ、Ⅴ类岩体的预测精度分别为0.8、0.9、0.93、0.96和0.9、0.81、0.93、0.97,由此可以看出,根据不同的经验判断设置的不同风险矩阵对于几类不同的岩体的分类预测精度有较大的影响。考虑最小风险的融合的方法较单纯基于条件概率的融合方法模型在各方面指标上都有一定的提升,特别是在小样本和重要类别的样本问题上体现较为突出。根据不同的工程需要设置不同的风险判断矩阵使得该预测结果在保持一定的准确性的前提下,能够适应不同的工程需要。

通过上述实施例和实验例可以看到,本发明通过选择钻速、扭矩、振动加速度(Y轴、Z轴)四种合适的信号源,并通过基于决策级的多源数据融合实现了更加准确的岩体特征实时预测,在钻探领域中具有很好的应用前景。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号