首页> 中国专利> 一种油气长输管道光纤预警信号特征提取方法

一种油气长输管道光纤预警信号特征提取方法

摘要

本发明公开了一种油气长输管道光纤预警信号特征提取方法。该方法包括:从光纤传感器的振动信号中,以时间和空间为标准,按照入侵事件类别、事件发生时间和观测点依次读取数据,并保存为原始样本数据;使用数字滤波器对原始样本数据进行高通滤波,以去除信号中的干扰信号;基于光纤信号特性和光纤硬件设备特点初步提取信号多维特征;根据样本数据中的标注,使用独热编码对入侵事件类别进行编码;使用线性降维和非线性降维对样本数据进行降维分析,并通过聚类对样本数据进行清洗,得到清洗后的原始振动信号的特征,作为后续用于预警的信号特征。本发明可实现更为快速和高还原度的油气长输管道光纤预警信号特征提取和清洗。

著录项

  • 公开/公告号CN112836591A

    专利类型发明专利

  • 公开/公告日2021-05-25

    原文格式PDF

  • 申请/专利权人 清华大学深圳国际研究生院;

    申请/专利号CN202110049962.6

  • 发明设计人 杨毅远;张海峰;李轶;

    申请日2021-01-14

  • 分类号G06K9/00(20060101);G06K9/62(20060101);

  • 代理机构11430 北京市诚辉律师事务所;

  • 代理人耿慧敏

  • 地址 518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼

  • 入库时间 2023-06-19 11:05:16

说明书

技术领域

本发明涉及信号处理技术领域,更具体地,涉及一种油气长输管道光纤预警信号特征提取方法。

背景技术

许多产业的发展离不开石油天然气的供给。在油气能源问题日益受瞩目的今天,油气管道运输以其安全性高、占地面积小等优势,在经济发展中发挥着越来越大的作用,所以保证能源的安全运输已经成为经济发展的重要一环。但是一些人为破坏或不良施工行为都极有可能导致运输管道遭到破坏。这些事故不仅导致了环境污染和能源浪费,同时还可能造成重大的安全事故。对于油气长输管道第三方入侵事件监测技术,目前业界公认的先进方法是利用与油气长输管道同沟铺设通信光缆中的冗余光纤,采用相干瑞利散射技术构建分布式光纤预警系统。光纤传感器探测法有实时性能好,支持长距离铺设,使用成本低等优势。

光纤预警的工作原理可以描述为:采用与油气长输管道同沟敷设的通信光缆中的冗余光纤,采用光时域反射测量方法,获取背向散射光中携带的光纤受周围环境中振动所引起的调制特征信息,通过分析振动调制信息,反演出外部振动信号对应的入侵事件。相对于振动电缆探测法和电磁波探测法等信号感知方法,光纤传感器探测法由于使用光纤作为传播途径,所以对环境的适应性更强,不易受到外界杂质的干扰。相比于红外探测法,光纤传感器探测法由于抗干扰性更强,所以更适用于长距离铺设。相比于声波探测法,光纤传感器因为以光为传播介质,所以传播的速度更快,预警的实时性更好。目前在业内,基于光纤传感器进行管道运输安全预警已经得到了较为广泛的应用。

油气长输管道光纤预警关键技术主要是背向散射光调制信息识别技术,其中识别技术的好坏直接决定了光纤预警性能好坏。目前在监测信号识别方面已经有不少经验,不过由于光纤信号波动大、变化快以及不稳定等特点,一直没有一个在识别精度与识别速度间达到平衡的基于光纤传感器信号的特征提取算法,从而制约了光纤预警技术在油气长输管道安全领域的大规模应用。

近几年,基于光纤传感器的油气长输管道光纤安全预警方向已经有了不少特征提取和清洗方法,但基本上局限在处理某一种或相同特征属性的某一类入侵事件。经分析,现有管道运输安全光纤预警技术在测量模型的构建、实际应用场景以及技术可行性上存在以下缺点:

1)基于人工智能技术作为核心的方法,对于多种类型事件提取的特征的区分效果较差,仅仅可以较为准确的区分某一种或相同特征属性的某一类入侵事件,这与真实现场要求是不符的。并且,现有方法很难实现“实时”的预警,对于威胁管道运输安全的事件难以做出第一时间的报警处理。

2)基于人工智能算法作为核心方法的泛化性能有待进一步考虑,算法构建模型所需的数据大多是在理想的、无环境噪声的实验室等环境下获得,虽然部分方法在构建模型时加入了噪音,但是无法模拟真实状况下的环境噪音。此外,现有算法没有再对环境的实际情况进行分析,例如由于硬件的使用消耗导致信号发生变化等,这样导致算法在实验室等“理想”环境下的识别效果突出,而在实际应用中的效果不理想。

3)基于人工智能算法作为核心的方法,大部分不是端到端的算法,且部分使用概率作为核心的方法可理解性较差,需要的算力较大,这导致在实际应用时不易实现,或者需要在专业人士帮助下才可以顺利使用。

4)对于背景噪声的适应性不好,由于真实现场环境的复杂性以及各种背景噪声的情况,导致现有方法的适应性不强。

5)没有在特征提取工作中增加数据清洗的工作,由于光纤非常灵敏,所以会导致非入侵事件的信号会与入侵事件的信号不易轻易区分,从而导致后续识别方法的识别结果变差。

总之,对于管道安全预警系统的信号识别领域来说,目前还没有很全面的特征提取方法。由于光信号的不稳定性以及振源信号的波动性,如何准确地获取稳定的入侵信号并进行合理化的特征提取,已经成为了管道安全预警系统的核心问题。

发明内容

本发明的目的是克服上述现有技术的缺陷,提供一种油气长输管道光纤预警信号特征提取方法。

根据本发明的第一方面,提供一种油气长输管道光纤预警信号特征提取方法。该方法包括以下步骤:

从光纤传感器的振动信号中,以时间和空间为标准,按照入侵事件类别、事件发生时间和观测点依次读取数据,并保存为原始样本数据;

使用数字滤波器对原始样本数据进行高通滤波,以去除信号中的干扰信号;

基于光纤信号特性和光纤硬件设备特点初步提取信号多维特征;

根据样本数据中的标注,使用独热编码对入侵事件类别进行编码;

使用线性降维和非线性降维对样本数据进行降维分析,并通过聚类对样本数据进行清洗,得到清洗后的原始振动信号的特征,作为后续用于预警的信号特征。

根据本发明的第二方面,提供一种油气长输管道光纤预警方法。该方法包括:

根据本发明提供的油气长输管道光纤预警信号特征提取方法提取光纤振动信号的特征,以构建样本数据集,所述样本数据集表征光纤振动信号特征和入侵事件类别之间的对应关系;

利用所述样本数据集训练分类预警模型,用于对与光纤同沟铺设的油气长输管道的实时预警。

与现有技术相比,本发明的优点在于,结合光纤信号本身特点,对振动信息进行特征提取,从光纤测量数据的清洗、去噪、特征提取、样本构建等方面提出更为先进的光纤信号特征提取方法,实现了更好的不同行为的特征提取效果。本发明可在超短时间周期内完成对影响油气长输管道安全的机械挖掘、定向钻、车辆推土、重型车辆、人工锄地、压路机、高压水枪以及打桩等多类行为的原始信号的完整特征提取工作以及清洗工作,实现更为快速和高还原度的油气长输管道光纤预警信号特征提取和清洗。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1是根据本发明一个实施例的油气长输管道光纤预警信号特征提取方法的流程图。

图2是根据本发明一个实施例的油气长输管道光纤预警信号特征提取方法的过程示意。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

本发明提出一种油气长输管道光纤预警信号特征提取方法,在获得相干瑞利散射的光纤原始信号的基础上,首先进行信号的预处理,然后采用新型的特征提取方法对于原始信号数据进行特征提取以及清洗。简言之,本发明融合了信号本身的特征信息以及信号在光纤内部传输时的特点,可以对多种类别的第三方危险入侵事件的振动信号进行智能特征的提取和清洗,从而实现提高复杂环境下的信号降噪、危险入侵事件特征提取以及管道现场可实时进行使用等目标。

具体地,结合图1和图2所示,所提供的油气长输管道光纤预警信号特征提取方法包括以下步骤。

步骤S110,从原始光纤传感器的振动信号中,以时间和空间为标准,按照事件类别、事件发生时间和观测点依次读取数据,并保存为原始样本数据。

例如,利用相干瑞利散射获取原始信号,在空间维度和时间维度上同时获取光纤中的相干瑞利散射信号data=(L,T),其中L=n*20m(或通用表示为L=n*d,d是相邻观测点之间的距离)为光纤长度,n为空间分辨率(20米)下的监测点数量,L(i)为第i个监测点,T为在时间维度上的数据数量(数据长度)T=H*t,H为采集频率,t为采集时间。

在实际应用中,通过合理设置观测点的距离和采样频率等,能够平衡后续光纤预警的实时性和准确性。

步骤S120,使用数字滤波器对原始样本数据进行高通滤波。

例如,读出原始样本数据,通过使用数字滤波器对原始信号进行高通滤波,使得信号的频谱变得平坦,并初步去除信号中的背景噪音等干扰信号。

步骤S130,基于光纤信号本身特性和光纤硬件设备特点初步提取信号多维特征,以进一步去除信号中的噪声干扰。

在此步骤中,对每个监测点数据在指定的时间尺度上进行特征参数处理(例如10秒),得到特征序列Feature(i),其中i是第i个时间尺度对应的单个特征,从而将特征序列定义为初步提取的多维信号特征。该步骤的具体实施例将在后文进行说明。

步骤S140,根据样本数据中的标注,使用one-hot编码对入侵事件类型进行编码。

根据样本中的标注,将所有入侵事件分为背景噪音、机械挖掘、定向钻、车辆推土、重型车辆、人工锄地、压路机、高压水枪以及打桩等9类自然信号和入侵事件,并对原始信号类别进行重新编码。

例如,使用one-hot编码方式对于标签进行编码。one-hot又称为独热码,即有多少个待分的类就有多少比特的值,而且所有比特中,永远只有一个值为1,其余的值均是0。例如4个状态的one-hot编码应设置为0001、0010、0100、1000,以此类推。

在一个实施例中,入侵事件包括机械挖掘、定向钻、车辆推土、重型车辆、人工锄地、压路机、高压水枪以及打桩等8类入侵事件,再加上背景噪声,所以设置9位的one-hot编码。通过对常见的入侵事件和背景噪声进行编码,能够有效区分不同的入侵事件,并区分入侵事件和背景噪声。

步骤S150,结合线性降维和非线性降维对样本数据进行分析,并通过聚类对样本数据进行清洗,得到清洗后的原始信号特征。

在此步骤中,对数据聚类降维与数据清洗,将步骤S130中提取的多维信号特征首先进行降维,并通过可视化的方法判断降低到多少维的特征,再通过聚类的方法清洗初步提取的特征。

步骤S150整体上包括数据降维、数据聚类与数据清洗两个过程,即对于初步提取的无标签的特征样本,先降维,然后聚类再删除进行数据的清洗。

对于数据降维的过程,结合线性降维和非线性降维,例如分别使用主成分分析PCA(线性降维方法)和t-SNE(非线性降维方法)进行数据降维与可视化,过程如下:

首先,将经过初步提取后的特征样本作为输入,分别送入到PCA和t-SNE算法中;

然后,通过观察降维效果来选择降维后的输出维度。例如可以使用降维后的可视化操作对降维效果直接进行观察,所以可以选择将初始特征提取样本降维到二维或三维,进行可视化并进一步压缩后续样本聚类操作的计算时间。

最后,将每个特征降维后的数据,在二维或三维的坐标系中可视化,并进一步分析不同类别样本间的重叠程度与区分程度,并根据t-SNE算法和PCA算法的结果,判断特征数据是属于线性可分样本还是非线性可分样本。例如,在PCA算法中,如果不同类样本的覆盖面积较大,即使用PCA算法无法正确区分不同类别样本,则使用t-SNE算法;反之,对于t-SNE算法的结果,如果不同类样本的区分程度不佳,即使用t-SNE算法无法正确区分不同类别样本,则使用PCA算法进行降维。

对于数据聚类与数据清洗的过程,例如采用K-Means聚类算法,即使用上面介绍的降维后的每一类非噪声数据和纯噪声数据合并输入K-Means算法中,将标记为非噪声数据但聚类到纯噪声数据中的样本分离出来,同时将标记为纯噪声的数据但聚类到非噪声数据中的样本分离出来,从而得到纯非噪声特征数据以及真正的纯噪声数据特征样本。至此,得到了最终的管道光纤信号特征。

以下具体介绍步骤S130的实施例。

简言之,步骤S130的初步特征提取过程包括:信号预加重、分帧、加窗、快速傅立叶变换(FFT)、初始化类Mel刻度滤波器组、从幅值谱中删去噪音谱、将滤波器组应用于纯幅值谱的对数能量和离散余弦变换(DCT)等。具体包括以下步骤:

步骤S131,信号预加重和高通滤波。

例如,信号预加重的实现函数形式如下:

s′

H(z)=1-μz

式中k和μ均为参数(常数)。通常k的取值在O.9-1.0之间,μ的取值在0.9-1.0之间,s

对预加重的信号,可使用三阶的高通滤波器进行滤波。其中,关键参数归一化截止频率W

式中f

步骤S132,对信号进行分帧处理。

将Q个连续数据在初始采样点组合为一帧,在相邻的两帧之间设置大小是Q值的一半左右重复区域,以保证帧与帧之间的连续性,Q是设定的大于等于2的整数,可根据需要的设定。

步骤S133,加窗处理。

将分帧后的帧内数据分别与窗函数相乘,以增加每一帧内部左部分数据和右部分数据的相关性。

步骤S134,快速傅里叶变换(FFT)。

对于每一帧信号使用快速傅里叶变换将时域信号转化到频域内,从而可在频域中选择幅度谱和功率谱作为待提取的特征。

步骤S135,初始化类Mel刻度滤波器组。

采用类似于Mel标度频率与正常频率f之间的换算关系为:

将频域从普通频域转换为类Mel频域后,建立一组在类Mel频率标准下的三角带通滤波器组。

例如,对于每一帧信号定义了N个小的类Mel频率下的三角带通滤波器组,假设每一个小三角带通滤波器的中心频率为f(m),其中m=1,2,3,…,N。

步骤S136,从幅值谱中删去噪音谱。

例如,从分帧后的第三帧信号开始进行噪声估算,而对于前两帧信号默认其最终的幅值能量为零。

步骤S137,将滤波器组应用于纯幅值谱的对数能量。

具体地,计算每一帧信号的对数能量:

式中x(m)为信号的幅值谱,这个对数能量就可以作为一帧信号的其中一个特征参数。考虑到光线信号波动大、频率高的特点,为了使结果变得平滑,在一个实施例中将每m个小滤波器的对数能量作为一个特征。

步骤S138,离散余弦变换(DCT)。

完整的对数能量还需要经过离散余弦变换(DCT)其公式为:

公式中的s(m)即为步骤S137中计算得到的对数能量,式中M表示三角带通滤波器组的个数,L为类Mel频域的系数阶数,例如,取值范围是10-15。

利用步骤S130完成光纤振动信号的初步特征提取工作,其中考虑了管道光纤以及信号本身的特性以及环境等影响因素,通过分帧、加窗等,特别是每m个小滤波器的对数能量作为一个特征,扩大了算法的容错范围,进一步提升了算法的泛化性和稳定性。

综上,本发明提出的方法,实现了从数据采集、数据预处理、信号初步特征提取和信号清洗的一个完整闭环,是一个完全的端到端算法,从而充分满足了非专业人员的实际需要,并且算法在真正现场实施时所需的算力较小,极大的减轻了算法和硬件部署的压力。本发明提出的方法,结合实际现场应用考虑,较大地提升了算法对于环境背景噪声的适应性,使得算法在真实使用场景中的泛化性能得到进一步的提升。

需进一步说明的是,利用上述过程提取振动信号特征,可用于油气长输管道的光纤预警。例如,预警过程包括:

提取光纤振动信号的特征,构建样本数据集,该样本数据集用于表征光纤振动信号特征(如功率谱、幅度谱、每m个小滤波器的对数能量等)和事件类别(如人工锄地、压路机、背景噪声等)之间的对应关系;

利用样本数据集训练分类预警模型,用于对与该光纤同沟铺设的油气长输管道的实时预警,其中分类预警模型,可采用多种类型的神经网络模型;

对实时采集的光纤振动信号提取特征,输入到经训练的分类预警模型,即可识别入侵事件类型。

综上所述,本发明充分利用真实环境下采集的管道光纤的原始信号作为构建模型的样本数据,使用线性、非线性的聚类方法对于原始数据进行清洗,再对振动信号进行特征提取,得到一个端到端的管道运输光纤预警的特征提取算法;基于实际的现场工作状况设计算法,在实时性能好的前提下,构建一种可以提取多种常见入侵事件以及背景噪声的特征的智能算法。并根据具体的管道构造和光纤传播的特点进行算法设计,借助数据清洗的方法进一步提高特征提取的效果以及泛化性能。总之,本发明在算法设计中,考虑模型的可用性以及实时性能,提出使用一套端到端的算法,以充分满足非专业人员的实际需要;在模型构建中,由于实际预警的需要且出于安全性考虑,本发明可在超短时间内完成完整的特征提取工作。经验证,本发明在保证特征可用性的前提下,极大优化了特征提取算法的实时性,在真实使用场景中,此识别周期完全可以满足实际需求。

需要说明的是,在不违背本发明精神和范围的前提下,本领域技术人员可对上述实施例进行改变或变型,例如,采用其他的编码方法、线性降维算法、非线性降维算法或聚类算法等。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++、Python等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号