首页> 中国专利> 利用卷积神经网络的高铁地震事件提取方法、介质及设备

利用卷积神经网络的高铁地震事件提取方法、介质及设备

摘要

本发明公开了一种利用卷积神经网络的高铁地震事件提取方法、介质及设备,按照各个检波器的统计参数对其相应原始地震记录归一化处理;根据高铁地震事件的时序长度参数设置单个样本时序长度;根据单个样本时序长度对完整地震记录分段截取,构造训练样本集和测试样本集;根据单样本自身特征构建1DCNN网络并设置相应超参数;对训练数据集的所有样本设置是否属于高铁地震事件的标签;设定网络训练参数,将训练样本集和标签送入1DCNN网络进行分类训练;将已训练网络应用于实际测试数据集的分类判别;根据实际测试数据集的预测标签和样本序号确定高铁地震事件时序范围,并完成高铁地震事件提取。

著录项

  • 公开/公告号CN113095364A

    专利类型发明专利

  • 公开/公告日2021-07-09

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN202110269510.9

  • 发明设计人 王晓凯;李春;陈文超;师振盛;

    申请日2021-03-12

  • 分类号G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构61200 西安通大专利代理有限责任公司;

  • 代理人高博

  • 地址 710049 陕西省西安市咸宁西路28号

  • 入库时间 2023-06-19 11:45:49

说明书

技术领域

本发明属于勘探地球物理技术领域,具体涉及一种利用卷积神经网络的高铁地震事件提取方法、介质及设备。

背景技术

针对列车运行状态和地质环境的监测研究已有较长的历史。2004年,李丽等初步提出列车振动作为震源探测地下结构的可行性。2015年,李智敏等利用动车振动监测信号的频率特征来诊断列车运行状态,从而能够区分列车的工况类型、提供列车运行状态的数据基础。2017年,徐善辉等在对京津城际铁路进行大量地震记录,其表明振动信号波形可作为轨道及高架结构异常状态的预警。2019年,刘磊等构建了以高铁地震记录对应时频谱图像作为输入的卷积神经网络模型,通过人为标记正负事件样本来训练分类器,最后将其应用于筛选大量的真实高铁地震事件记录。未来将高铁地震应用于地质环境方面的研究仍具有很大的潜力,而准确快速地获得真实的高铁地震事件记录,是后期进行地震信号分析处理的首要前提。目前已有的提取高铁地震事件记录的方法主要包含:

现有技术1:通过手动截取来获得高铁地震事件:直接对观测数据可视化来判定高铁信号,然后手动截取获得相应高铁地震事件,但无法自动提取高铁地震事件。此外,当地震记录数据量很大时,此方法需要花费过多的时间与精力,无法快速获得大量的高铁地震事件。

现有技术2:以时频谱图像为输入的卷积神经网络模型:首先人为标记高铁地震记录的正负事件样本,构建以样本的时频谱图像为输入的卷积神经网络模型,利用此模型来筛选出真实的高铁地震事件。上述方法需要得到地震记录的时频谱图像,因此在地震记录数据量过大时,其需要花费更多时间来提取大量的高铁地震事件。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种利用卷积神经网络的高铁地震事件提取方法、介质及设备,使用高铁线路隔离区外多个检波器采集到的地震数据,利用训练1D卷积神经网络模型的方法来提取大量高铁地震事件,从而为后续地质信息分析提供数据。

本发明采用以下技术方案:

利用卷积神经网络的高铁地震事件提取方法,包括以下步骤:

S1、按照各个检波器的统计参数对相应原始地震记录进行归一化处理,得到归一化的完整地震记录;

S2、根据高铁地震事件的时序长度参数设置单个样本时序长度;

S3、以步骤S2确定的单个样本时序长度对步骤S1归一化处理的完整地震记录进行分段截取,构造训练样本集和测试样本集;

S4、对步骤S3训练样本集的所有样本设置标签,得到训练样本集的标签向量;

S5、根据单样本的自身特征构建1DCNN网络并设置相应的超参数;

S6、设定训练参数,将步骤S3的训练样本集和标签向量送入步骤S5构建的1DCNN网络进行分类训练;

S7、将步骤S6已训练的网络应用于测试样本集的高铁地震事件分类判别,获得预测标签;

S8、根据步骤S7获得的预测标签和样本序号确定高铁地震事件时序范围,完成高铁地震事件提取。

具体的,步骤S1中,假设检波器阵列的阵元数为N,第i个检波器的地震记录为x

其中,i表示检波器序号,取值为i=1,2,…,N。

具体的,步骤S3中,完整地震记录为X=[x

具体的,步骤S4中,根据完整地震记录波形判断所有样本是否包含高铁地震事件,若包含则属于高铁地震事件,设置标签为1;否则不属于高铁地震事件,设置标签为0,得到训练数据集的标签向量r。

具体的,步骤S5中,构建以2个卷积层+Relu层、2个池化层、1个全连接层和Softmax层为结构的1DCNN网络;全连接层的输出为y

具体的,步骤S6中,根据训练样本的数量选取批处理大小、网络学习率,经Softmax回归处理后,计算预测输出与理想输出间的误差,假设p表示正确概率输出,q表示预测概率输出,则得到网络训练的交叉熵损失H(p,q)。

具体的,步骤S7中,模型训练完成后,将构建好的实际测试样本集送入网络进行高铁地震事件检测,得到对应的预测标签向量s:

s=[s

其中,s

具体的,步骤S8中,在获得实际测试样本集的预测标签后,依据预测标签连续为1的样本两侧出现为0的样本序号,判定此范围内标签为1的若干个样本为一次完整的高铁地震事件,根据时序范围从原始地震记录中提取出所有的高铁地震事件。

本发明的另一个技术方案是,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行所述的方法中的任一方法。

本发明的另一个技术方案是,一种计算设备,包括:

一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行所述的方法中的任一方法的指令。

与现有技术相比,本发明至少具有以下有益效果:

本发明为利用1D卷积神经网络(1DCNN)模型进行高铁地震事件提取的一种方法,其利用多个在隔离区外的地震检波器数据即可实现高铁列车所激发震动事件的提取。本发明首先对多检波器完整地震记录进行归一化,获得保留原本相对幅值差异的完整地震记录,然后根据高铁地震事件时序长度的统计数值选取单个样本的时序长度,对多个检波器的完整地震记录分段截取为一系列样本,并为其部分样本设置是否为高铁地震事件的标签,进而构建1DCNN网络并设定超参数来实现特征提取,最终经过Softmax回归完成事件分类,从而可依据实际测试数据的预测标签和样本位置来提取出高铁地震事件。相比较于已有高铁地震事件的提取方法,本发明获得仅依赖于少量地震记录样本训练的分类器即可实现大量高铁地震事件的自动提取。

进一步的,根据高铁地震事件时序长度参数设置单个样本时序长度,有利于避免因样本时序长度过大过小造成后续的高铁地震事件分类错误。

进一步的,在对多通道完整地震记录数据分段化处理时,相邻样本间设置50%的重叠长度,有利于根据相邻样本的分类标签和样本序号识别高铁地震事件,同时有利于得到更为准确的高铁地震事件位置的估计。

进一步的,根据地震检波器E、N、Z三个方向的地震信号统计特性,选取方差最大方向的地震记录来构建样本数据集,有利于减少参与网络训练的数据量,同时有利于去除相关冗余的特征。

进一步的,对分段截取的部分样本设置是否属于高铁地震事件的标签,为后续网络模型的训练提供样本分类的基础。

进一步的,在步骤S5中根据样本自身特征来构建1DCNN网络并设置超参数,以提供一个实现样本数据到分类标签的映射模型,有利于后续完成高铁地震事件的识别。

进一步的,以步骤S3分段截取的实际测试样本为基础,对其进行高铁地震事件分类检测,确定出属于高铁地震事件的样本,有利于后续完成高铁地震事件的提取。

进一步的,根据S7步骤中的预测标签和样本位置来确定高铁地震事件位置,从而据此提取所有检测到的高铁地震事件。

综上所述,本发明可以有效、准确地实现利用多个地震检波器数据的高铁列车地震事件提取,所采用的方法为卷积神经网络深度学习模型,具有高准确率和自动快速等特点,同时为提取高铁地震事件提供了一个摆脱人工手动截取的便捷方法。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明流程图;

图2为单个高铁地震事件的单个检波器三分量时域波形图;

图3为1DCNN高铁地震事件提取模型结构图;

图4为某次训练过程中的损失函数变化曲线图;

图5为30个高铁地震事件检测结果图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。

本发明提供了一种利用卷积神经网络的高铁地震事件提取方法,用多个在隔离区外的地震检波器数据即可实现高铁列车震动事件的提取。本发明首先对多检波器完整地震记录进行归一化,获得保留原本相对幅值差异的完整地震记录,然后根据高铁地震事件时序长度的统计数值选取单个样本的时序长度,对多个检波器的完整地震记录分段截取为一系列样本,并为其部分样本设置是否为高铁地震事件的标签,进而构建1DCNN网络并设定超参数来实现特征提取,最终经过Softmax回归完成事件分类,从而可依据实际测试数据的预测标签和样本位置来提取出高铁地震事件。

请参阅图1,本发明一种利用卷积神经网络的高铁地震事件提取方法,包括以下步骤:

S1、按照各个检波器的统计参数对其相应原始地震记录归一化处理;

假设检波器阵列的阵元数为N,第i个检波器的地震记录为x

其中,i表示检波器序号,取值为i=1,2,…,N。

S2、根据高铁地震事件的时序长度参数设置单个样本时序长度;

假设高铁地震事件时序长度的统计值为L,则在构造地震记录训练和待测试样本数据集时设置单个样本时序长度l=0.6L。

S3、根据单样本时序长度对完整地震记录分段截取,构造训练样本集和测试样本集;

假设完整地震记录为X=[x

然后将所有样本按一定比例划分为训练样本集R和测试样本集S,假设分段截取后总共包含K个样本,则得到训练样本集R和测试样本集S:

R=[T

S=[T

S4、对训练样本集R的所有样本设置是否属于高铁地震事件的标签;

根据完整地震记录波形判断所有样本是否包含高铁地震事件,若包含则属于高铁地震事件,为其设置标签为“1”;否则不属于高铁地震事件,为其设置标签为“0”,得到训练数据集的标签向量r:

r=[r

其中,r

S5、根据单样本的自身特征构建1DCNN网络并设置网络超参数;

针对样本自身时序数据的特点,构建以2个卷积层+Relu层、2个池化层、1个全连接层和Softmax输出层为结构的1DCNN网络。

假设全连接层的输出为y

根据地震记录检波器阵元数、样本时序长度和时域波形特征等参数,为1DCNN网络各层设置相应的超参数。

S6、设定网络训练参数,将训练数据集和标签送入1DCNN网络进行分类训练;

根据训练样本的数量选取批处理大小、网络学习率等训练参数,经Softmax回归处理后,计算预测输出与理想输出间的误差,p表示正确概率输出,q表示预测概率输出,则得到网络训练的交叉熵损失H(p,q):

S7、将已训练网络应用于实际测试数据集的高铁地震事件分类判别;

模型训练完成后,将构建好的实际测试样本集送入网络进行高铁地震事件分类判别,得到其对应的预测标签向量s:

s=[s

其中,s

S8、根据测试数据集的预测标签和样本序号确定高铁地震事件时序范围,并完成高铁地震事件提取。

在获得实际测试样本的预测标签后,依据预测标签连续为“1”的样本其两侧出现为“0”的样本序号,判定此范围内标签为“1”的若干个样本为一次完整的高铁地震事件,因此可根据其时序范围从原始地震记录中提取出所有的高铁地震事件。

本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于利用卷积神经网络的高铁地震事件提取方法的操作,包括:

依据各个检波器的统计参数对相应的原始地震记录进行归一化处理;根据高铁地震事件的时序长度参数设置单个样本时序长度;根据单个样本时序长度对归一化的完整地震记录分段截取,构造训练样本集和测试样本集;对训练样本集的所有样本设置是否属于高铁地震事件的标签;根据单样本自身特征构建1DCNN网络并设置相应超参数;设定网络训练参数,将训练样本集和标签送入1DCNN网络进行分类训练;将已训练的模型应用于实际测试样本集的分类判别;根据实际测试样本集的预测标签和样本序号确定高铁地震事件时序范围,完成高铁地震事件提取。

本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。

可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关利用卷积神经网络的高铁地震事件提取方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:

依据各个检波器的统计参数对相应的原始地震记录进行归一化处理;根据高铁地震事件的时序长度参数设置单个样本时序长度;根据单个样本时序长度对归一化的完整地震记录分段截取,构造训练样本集和测试样本集;对训练样本集的所有样本设置是否属于高铁地震事件的标签;根据单样本自身特征构建1DCNN网络并设置相应超参数;设定网络训练参数,将训练样本集和标签送入1DCNN网络进行分类训练;将已训练的模型应用于实际测试样本集的分类判别;根据实际测试样本集的预测标签和样本序号确定高铁地震事件时序范围,完成高铁地震事件提取。

以高铁经过时距高铁线路15m的27个沿铁轨方向等间隔排列的低频检波器所接收到的信号为例。

表1为本实施例构造的高铁地震记录样本数据集

表2为本实施例中1DCNN网络的超参数设置

请参阅表1,表1为本实施例中构造的高铁地震记录样本数据集,单个样本为包含27个检波器且时序长度为1000的地震记录,因此其维度为27×1000。训练样本集包含116个高铁地震事件样本和3934个非高铁地震事件样本;测试样本集包含128个高铁地震事件样本和3921个非高铁地震事件样本。相应地,高铁地震事件样本分类标签为“1”,而非高铁地震事件样本分类标签为“0”,数据集的具体划分详见表1。请参阅表2,表2为本实施例中1DCNN网络的超参数设置,输入样本为27个检波器且时序长度为1000的地震记录,其网络结构为卷积层+Relu层、池化层、卷积层+Relu层、池化层、全连接层和Softmax输出层,网络主要的输入通道、输出通道和超参数设置(卷积核/池化核、步长等)详见表2。

请参阅图2,图2为某趟列车经过时单个高铁地震事件的单个检波器三分量时域波形;采样间隔为4ms,共有2008个采样点。请参阅图3和图4,图3为1DCNN高铁地震事件提取模型结构图,图4为某次训练过程中的损失函数变化曲线图。从图4可以看出该1DCNN网络经过20轮迭代已经收敛,因此其完成模型训练所需时间很短。对30趟列车经过时27个检波器所接收到的数据利用本专利方法进行检测分析,得到的30个高铁地震事件检测结果如图5所示,其与实际地震记录已知的高铁地震事件数量和位置相吻合,可据此将相应位置的高铁地震事件依次提取出来。

综上所述,本发明一种利用卷积神经网络的高铁地震事件提取方法、介质及设备,结合了高铁地震事件自身的时域波形特征,首先对原始的一维地震记录进行归一化处理,并将其分段截取为一系列单个样本,进而构造高铁地震事件数据集、设置训练数据集的标签,通过训练1DCNN网络实现特征提取,最终经过Softmax回归完成样本分类,从而可依据样本的分类标签和时序范围来提取出高铁地震事件。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号