首页> 中国专利> 基于改进集成经验模态分解与XGBoost模型的光纤周界信号特征识别方法

基于改进集成经验模态分解与XGBoost模型的光纤周界信号特征识别方法

摘要

本发明公开了一种基于改进集成经验模态分解与XGBoost模型的光纤周界入侵振动信号特征分类识别方法。解决现有光纤周界系统中入侵信号特征提取复杂、分类识别耗时以及样本特征数量少导致识别准确率低的问题。本发明对获取到的典型入侵事件进行时间维度截取,得到单个空间点的一维时间序列,构建典型入侵信号样本集;提出一种基于改进的集成式经验模态分解的光纤振动信号特征提取方法,获得入侵事件信号的本征模态分量,将其作为特征训练集;构建XGBoost模型,利用入侵信号特征训练集对模型的权重参数进行迭代更新,获得最佳分类模型。最后,在XGBoost模型中输入样本测试集,得到入侵事件分类结果。

著录项

  • 公开/公告号CN112989906A

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利号CN202011397826.8

  • 申请日2020-12-04

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N20/00(20190101);

  • 代理机构33101 杭州九洲专利事务所有限公司;

  • 代理人陈继亮

  • 地址 311499 浙江省杭州市西湖区留下街道屏峰715号

  • 入库时间 2023-06-19 11:29:13

说明书

技术领域

本发明属于信号处理及工程应用领域,主要涉及光纤周界安防系统中关于入侵信号的分 类识别方法,具体是一种基于改进集成经验模态分解与XGBoost模型的光纤周界信号特征识 别方法。

背景技术

基于迈克逊干涉的光纤传感入侵检测技术,是实现环境安防监测的一项关键技术手段, 能够感应并监测光纤分布环境中的入侵振动信号。与传统电子安全检测相比具有高灵敏度、 抗电磁干扰强、全距离无源、耐腐蚀、结构简单等优点,广泛应用于军事机要安防、通信安 全、能源管道传输、桥梁隧道监测等领域。但是在大范围复杂监测环境以及光缆不同布设方 式下,现有的光纤传感周界系统无法准确捕捉不同空间点感测的入侵干扰事件,系统自适应、 泛化能力有待提高。此外,现有光纤周界系统的识别分类模型无法有效提取小样本入侵事件 特征参数向量,振动信号识别耗时、准确率低,出现较高的虚报、误报、漏报,无法满足实 际行业应用要求。

发明内容

本发明的目的在于:解决现有光纤传感周界系统无法完成复杂监测环境、多样光缆布设、 小样本入侵事件情况下入侵信号特征提取复杂耗时、识别准确率低的问题,而提供一种基于 改进集成经验模态分解与XGBoost(Extreme Gradient Boosting)模型的光纤周界信号特征识 别方法,适用于铁路轨道、能源管道、桥梁隧道、光电线缆等安全监测领域。该方法能够抑 制非线性非平稳信号中的噪声分量,提取有效的最优特征向量,解决传统经验模态分解方法 自适应性差的问题;采用XGBoost模型分类算法,弥补传统分类算法在多维特征空间的缺点, 具有更高的事件识别精度、更快的分类速度、更好的样本泛化能力。

本发明的目的是通过如下技术方案来完成的。

一种基于改进集成经验模态分解及XGBoost模型的光纤周界信号特征识别方法,该方法 如下步骤:

步骤1、采集光纤沿线布设环境中各空间距离点的事件信号,对其进行时间分割,构建 入侵事件信号样本集;

步骤2、利用改进的集成经验模态分解方法提取样本集中入侵事件信号的特征向量,构 成特征矩阵训练样本;

步骤3、构建预训练XGBoost分类模型,输入入侵信号特征训练样本对模型的权重参数 进行迭代更新,生成最佳分类模型。

步骤4、在XGBoost模型中输入样本测试集进行分类,得到事件分类结果。

进一步,所述步骤1的具体步骤如下:

步骤11、基于迈克尔逊干涉技术的光纤传感器获取各个距离点的时间序列信号矩阵;

步骤12、将时间序列信号矩阵进行时间维度的入侵事件切分操作,得到包含入侵振动信 号训练样本的入侵振动样本集。

进一步,所述步骤2的具体步骤为:

步骤21、对入侵振动样本集中的训练样本进行经验模态分解,获得本征模态分量(Intrinsic Mode Functions,IMF)的能量熵;

步骤22、计算相邻模态分量之间的互信息熵,求得信号分量中高频与低频的转折临界点, 根据该临界点,重构原始信号获得高频信息,并计算高频信息的幅值标准差;

步骤23、计算原始信号与其高频信息的幅值标准差比值,根据该比值,确定添加的白噪 声幅值系数以及对应的总体平均次数;

步骤24、对样本训练集进行改进的集成经验模态分解,完成信号样本特征向量矩阵。

进一步,所述步骤3的具体步骤为:

步骤31、定义XGBoost模型目标函数,衡量模型与训练数据的关联程度。目标函数一般 由损失函数E和正则化函数Φ组成:

Γ=E(θ)+Φ(θ) (1)

其中,选择均方根误差作为误差函数计算公式,L是分类树总数,f是特征向量F中的单 个特征,y

步骤32、将损失函数进行二阶泰勒公式展开,此时目标函数为:

其中,Φ(f)是自定义模型复杂度函数。g

步骤33、利用贪婪算法,遍历所有的特征,对分类树进行分割计算增益,即每次对叶子 节点进行分割获得目标函数的最大增益值。同时为了限制分类树生长过深,设置增益阈值, 只有当增益大于该阈值才进行分裂。保存得到当前最大目标函数值时的模型权重参数。

进一步,所述步骤4的具体步骤为:

步骤41、将各空间距离点实时获取得到的时间序列信号,依照样本集切割规则进行长度 划分,得到入侵振动信号测试集;

步骤42、将样本测试集进行改进集成经验模态分解,获得最优特征向量矩阵;

步骤43、将特征向量矩阵输入XGBoost模型最优分类器,获得入侵事件识别结果。

本发明的有益效果为:

一、针对入侵振动信号这类非线性非平稳时间信号,本发明与其他利用时频域等经典信 号处理方法相比,采用了基于互信息熵的集成经验模态分解方法,摆脱了傅里叶变换在非平 稳信号上的缺陷,依据信号序列时间尺度的局部特性进行自适应分解,适用于复杂多变的监 测环境。

二、在无法获取海量事件样本情况下,本发明采用机器学习中的XGBoost分类算法,解 决了CNN、RNN等深度神经网络需要海量事件样本进行训练学习的问题,有效挖掘小样本入侵 事件信号特征,准确提取其信号特征参数矩阵,训练、识别时间大大缩减,识别准确度高。

附图说明

图1为本发明的技术方案流程示意图及具体框图;

图2为光纤传感器结构示意图;

图3为包含入侵事件信号的时间累积时空响应信号图;

图4为改进集成经验模态分解流程示意图;

图5为XGBoost模型原理图。

具体实施方式

下面将结合附图和实施例对本发明做详细的介绍:

实施例一

基于改进集成经验模态分解与XGBoost模型的光纤周界入侵振动信号特征分类识别方 法,整个处理流程如图1所示,主要分为四个部分:

第一部分:样本采集。利用基于迈克尔逊干涉技术的光纤传感器获取实际监测环境下的 多种入侵事件信号,对该传感信号进行距离切分,获得各距离点包含入侵振动信号的时间序 列信号样本集;

第二部分:特征提取。对入侵振动样本集信号首先进行传统经验模态分解,获得本征模 态分量的能量熵;再计算相邻模态分量之间的互信息熵,重构原始信号获得高频信息,计算 原始信号与其高频信息的幅值标准差比值,确定添加的白噪声幅值系数以及对应的总体平均 次数;最后,根据已确定的参数,对样本训练集进行改进的集成经验模态分解,获得样本集 的特征向量矩阵。

第三部分:模型构建。首先对特征向量矩阵添加事件标签,形成样本训练集;定义XGBoost 模型目标函数,利用贪婪算法遍历训练集中每一个特征向量,计算生成的分类树增益;调整 模型参数,保存使得目标函数最大时的最优权重超参数及对应的最佳分类模型。

第四部分:分类识别。光纤传感器实时采集的入侵事件时间序列通过改进的集成经验模 态分解得到特征向量,输入最佳分类模型,输出分类结果。

实施例二

实施例一中的光纤传感器,其结构及工作原理如图2所示,其中包括光源激光器Laser、 3db耦合器C3、声光调制器AOM、光纤L(振动传感臂L1、参考臂L2)、法拉第旋转镜FRM、 光电探测器PD、数据采集卡DAQ以及信息处理模块PC。本系统的传感原理为:激光器发出的 光经过声光调制器调制成脉冲光,脉冲光经过3dB耦合器后被分成光强、功率相等的上下两 束分别入射到振动传感臂与参考臂中,两束脉冲光经过两臂末端的法拉第旋转镜FRM反射之 后按原路回传至3dB耦合器并发生干涉,最后干涉光的光强被光电探测器接收。当有外界振 动作用于振动传感臂时,干涉光的相位发生变化,故而光电探测器接收到的光强也发生改变, 实现对外界振动信号的调制过程。由双光束干涉理论可知,光电探测器PD接收到的干涉信号 光强表示为:

其中:I

实施例三

实施例二中的光纤传感器探测到光纤沿线的扰动和入侵,可以获得扰动信号随时间变化 的动态数据。将各距离点的时间信号矩阵按事件切割成长度为N的扰动信号样本集。N的选 取根据系统的脉冲重复频率和扰动的特征确定。针对每一个发生的入侵事件信号,添加一个 对应的标签,因此可以获得完整的入侵事件样本集。

在本实施例中,环境噪声划分为正常事件,标签为1;异常事件包括敲击光缆、脚踩光 缆、摇晃光缆,敲击光缆标签为2,脚踩光缆标签为3,摇晃光缆标签为4。

实施例四

基于改进的集成经验模态分解方法对实施例三中的入侵事件样本集进行特征提取,具体 方法如下:

(1)首先,对样本集中的扰动信号进行分解得到本征模态分量,将其平均分成L段,并 对每一段的能量作归一化处理:

式中,i=1,2,3...l,k=1,2,3...L。

(2)由互信息理论可知,相邻本征模态分量的互信息熵为:

S

计算相邻分量的互信息熵,得到高频成分与低频成分的临界点,据此重构信号的高频成分。

(3)计算原始信号与其高频成分的幅值标准差比值,根据该比值,确定添加的白噪声幅 值系数以及对应的总体平均次数。

白噪声幅值系数取值准则:

其中,ξ=σ

平均次数N与幅值系数φ的关系为:

其中,e为本征模态分解的相对误差值,一般取0.01。

(4)根据已确定的白噪声幅值系数φ及平均次数N,对每个样本训练集事件信号进行改 进的集成经验模态分解。处理流程图如图4所示,具体步骤如下:

1)在扰动信号中I(t)中加入高斯白噪声,重复加入N次:

I

式中,I

2)根据经验模态分解原理,将该混合信号分解为本征模态分 量,得到

其中,imf

3)对上述所得到的余项和本征模态进行总体平均,得到最终 振动信号的分解分量:

4)归一化各分量的能量特征,取前6个集中的能量分布,记 为

Ω=[E

将各分量的能量分布作为特征向量矩阵,添加原信号的样本标签,组成样本特征集。

实施例五

将样本特征集分为训练集和测试集。构建分类模型结构,利用样本特征训练集调整模型 超参数,获得最佳分类模型,最后输入样本测试集验证模型有效性。XGBoost分类模型以分 类树为基础,加权表决进行分类,原理如图5所示。具体实施方式如下:

(1)构建XGBoost分类模型结构:

1)定义模型的目标函数Γ,用于衡量模型与训练数据的关联程度。目标函数一般由损失 函数E和正则化函数Φ组成:

Γ=E(θ)+Φ(θ) (17)

其中,选择均方根误差作为误差函数计算公式,L是分类树总数,f是特征向量矩阵F中 的单个特征,y

2)模型迭代训练时,每次迭代生成一棵分类树用于拟合上一次迭代结果与真实值之间的 残差,针对残差值进行参数调整。若第t次估计值为

3)第t次的预测值是第t-1次估计值加上第t次的估计值。把计算结果代入损失函数E 中,将损失函数进行二阶泰勒公式展开,此时目标函数为:

其中,Φ(f)是自定义模型复杂度函数,W是分类树叶子节点,a

4)利用贪婪算法,遍历所有的特征,对分类树进行分割计算增益,即每次对叶子节点进 行分割获得目标函数的最大增益值。增益表达式为:

5)其中,第一项为叶子节点生成左叶子节点的增益值,第二项为生成右叶子节点的增益 值,第三项为原增益。为了限制分类树生长过深,设置增益阈值,只有当增益大于该阈值才 进行分裂。

6)利用XGBoost结构对样本训练集中的每一个特征向量进行迭代,保存使目标函数值最 大时的最佳参数权重。最后输入样本测试集验证模型有效性。

实施例六

利用最佳分类模型实现在线实时入侵识别。具体实施方式为:

(1)获取光纤传感器的实时采集入侵事件信号;

(2)依据样本信号集切分长度得到待识别信号,利用改进集成经验模态分解获得特征向 量;

(3)将特征向量输入XGBoost分类模型,在线识别并输出事件分类结果。

表1为各类入侵事件分类效果对比。对于四类事件的分类正确率达到97%及以上,证明 了基于本发明提取的信号特征再通过XGBoost分类模型进行识别的有效性。

其中,背景环境特征样本共有900组,敲击光缆特征样本共有600组,脚踩光缆特征样 本共有600组,摇晃光缆特征样本共有600组。整体来讲,基于本发明提出的改进集成经验 稳态分解算法提取的信号特征,能有效区别于背景环境与敲击光缆、脚踩光缆、摇晃光缆入 侵事件。

表1入侵事件分类识别结果

可以理解的是,对本领域技术人员来说,对本发明的技术方案及发明构思加以等同替换 或改变都应属于本发明所附的权利要求的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号