首页> 中国专利> 一种基于改进贝叶斯的轨道交通故障识别方法及系统

一种基于改进贝叶斯的轨道交通故障识别方法及系统

摘要

本发明公开了一种基于改进贝叶斯的轨道交通故障识别方法及系统。本方法为:1)根据交通设备的电路结构确定每一交通设备的各种故障模式及对应的监测量,并针对每一故障模式及对应的监测量建立一故障模型;2)根据故障模型识别出监测数据之间的父子关系,得到标准故障样本数据;3)利用标准故障样本数据,采用贝叶斯算法进行训练,得到故障识别模型;每一故障模式的故障识别模型中父节点的权重要大于子节点的权重;4)实时监测和采集交通设备的各种所述监测量,并记录其时序;5)利用故障识别模型对数据进行识别,确定出对应的故障。本发明提高了故障识别的准确率,缩短故障修复时间,设备可故障自诊断,从运维和设备两方面保障行车安全。

著录项

  • 公开/公告号CN103699698A

    专利类型发明专利

  • 公开/公告日2014-04-02

    原文格式PDF

  • 申请/专利权人 北京泰乐德信息技术有限公司;

    申请/专利号CN201410019524.5

  • 发明设计人 鲍侠;

    申请日2014-01-16

  • 分类号G06F17/30(20060101);

  • 代理机构北京君尚知识产权代理事务所(普通合伙);

  • 代理人余长江

  • 地址 100036 北京市海淀区阜成路73号37号楼18层1902号

  • 入库时间 2024-02-19 22:49:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-03-29

    授权

    授权

  • 2014-04-30

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20140116

    实质审查的生效

  • 2014-04-02

    公开

    公开

说明书

技术领域

本发明提供一种基于改进贝叶斯的轨道交通故障识别方法及系统改进,涉及铁路信号数 据、铁路通信数据、铁路知识数据、系统报警数据、机器学习、贝叶斯等技术领域,用以解 决轨道交通监测数据的数据分析所面临的问题。

背景技术

目前,轨道交通(国有铁路、企业铁路和城市轨道交通)领域、监测维护产品主要有三类: CSM(信号集中监测系统)、各设备维护机、通信网管系统。为了提高我国铁路信号系统设备 的现代化维修水平,从90年代开始,先后自主研制了TJWX-I型和TJWX-2000型等不断升 级中的信号集中监测CSM系统。目前大部分车站都采用了信号集中监测系统,实现了对车站 信号设备状态的实时监测,并通过监测与记录信号设备的主要运行状态,为电务部门掌握设 备的当前状态和进行事故分析提供了基本依据,发挥了重要作用。并且,对城市轨道交通信 号设备,集中监测CSM系统也被广泛部署在城轨集中站/车辆段等处,供城轨运维使用。此 外,伴随我国高速铁路的建设发展,高铁特有的RBC系统、TSRS系统、ATP系统,也面 临着纳入信号集中监测系统的需求,也面临着提高其监测能力、运维能力,以及设备自诊断 能力的需求。

面对很多复杂设备故障和行车事故原因的分析诊断方面,既有CSM系统尚无能为力,目 前仍需依靠人工经验分析判断,很多情况下在已经出现重大问题时才能发现故障,不仅导致 了人工诊断铁路信号系统故障时工作量大、故障监测与诊断效率低下等技术问题,也增加了 行车的危险。因此,提高各种监测资源的利用率,保障行车安全、提高运力,是轨道交通 领域的迫切需求。

发明内容

为了解决现有技术中人工诊断铁路信号系统故障时工作量大、效率低下、风险性高等技 术问题,本发明提供了一种基于改进贝叶斯的轨道交通故障分类识别方法及系统。系统包括 数据归集组件、数据存储组件、数据预处理组件、特征选择组件、数据向量化组件、模型训 练组件和实时数据分析组件。

本发明采用的技术方案如下:

一种基于改进贝叶斯的轨道交通故障识别方法,其步骤包括:

1)通过分析轨道交通设备的电路结构确定该设备的各种故障模式和各种监测量;针对不 同设备的故障分析,是基于历史数据的,如在某一个电压的监测值高于或者低于一定阈值的 情况下,去判断与之关联的监测值,通过这种判断来推断出故障的类别,以及与故障相关的 各种监测量;

2)通过CSM系统的数据归集组件监测和采集轨道交通设备的各种监测量,得到标准故 障样本数据,用于训练识别模型,并通过数据存储组件将这部分数据传输到数据分析服务器 中;

3)数据分析服务器对获取的各种历史监测数据进行离散化、特征选择、格式转换等步骤, 转换为贝叶斯分类器可以进行训练的空间向量模型(VSM)数据;与常见的分类数据不同, 监测数据的故障模型多为触发类的故障模型,即当一个主设备出现异常时,那么系统就会出 现异常,但是异常的种类还需要通过后续的监测设备进行识别,也就是进入一个故障识别的 分支。每个故障分支也有类似的特点,整个故障模型表现为一个树形结构。在进行数据分析 的时候,需要识别出故障分析树,然后确定各个监测信号之间的父子关系,父节点的权重要 大于子节点的权重;监测信号数据的另外一个特点是具有时序性,在进行数据采集的时候, 父节点的监测信号出现异常时,才需要去判断分析子节点的监测数据,并且子节点的监测数 据的采集时间在父节点出现异常之后才有分析价值;

4)根据故障类型和监测数据的特点,采用改进贝叶斯算法构造故障识别模型,得到在保 证正确率情况下,具有最好的泛化能力的参数,从而得到故障识别模型;根据上述的监测故 障模型分析可知,监测数据具有父子关系、且数据之间具有时序性;贝叶斯的独立性假设会 在这里不成立,会降低监测数据分析的准确率;本系统对贝叶斯算法进行改进,加入监测数 据的时序特征及父子关系,以提高故障识别的效率及正确率;

5)通过CSM系统的数据归集组件实时监测和采集轨道交通监测设备的各种与故障相关 的监测量,并对实时监测数据进行与训练数据相同的处理过程,产生对应VSM数据;

6)使用步骤4)中产生的故障识别模型对步骤5)得到的实时监测数据进行识别分析,从 而得到系统中是否存在故障以及故障的类别;

进一步的,所述采用改进贝叶斯算法进行训练,得到故障识别模型的方法为:

1)轨道交通数据包括很多的电压值、电流值等连续数据,这种数据不适用于分类器的处 理,需要将数据进行离散化。这些数据在不同的情况下会取不同的值,但是在不同的状况下 的取值基本是稳定的,取值是固定在几个中心值上,具体的监测值可能在这几个中心值附近 波动。因此本系统采用无监督K-means方法对步骤3)中的所述空间向量模型数据中的各种 连续的数据进行离散处理,形成离散的特征数据以便于进行数据,具体包括以下步骤:

a)在离散的数据中随机的选取K个点,作为数据的初始点;

b)以这K个点为中心点,计算这K个区间的中心点;

c)迭代执行上述两个步骤,直到K个中心点都不再发生变化为止,这样就完成了数据 的离散化,由连续的监测数据转换为离散的数据;

2)轨道交通监测数据具有特征多、数量大的特点,在针对具体的故障时很多特征都是无 效特征,除了增加计算量外还会带来各种噪声。因此需要对特征进行选择,包括无效特征删 除及冗余特征的删减。本系统利用信息增益的方法对所述离散的特征数据进行特征选择,选 出与最终的故障分类结果密切相关的特征进行计算和处理,以减少数据量及加快计算速度, 具体包括以下步骤:

a)首先,分析故障以及故障的类别,然后计算每个特征与故障类别之间的信息增益值;

b)选择信息增加大于一定阈值的特征,得到与故障直接相关的特征集B;

c)针对候选集B进一步筛选,针对B中的项目集中的个特征值计算特征值之间的相关 性,如果两个特征值之间的相关性大于一定的阈值,那么这两个特征相对于该故障就属于冗 余特征,删除一个特征;通过上述步骤就可以删除与故障不相关以及冗余的特征;

3)根据步骤2)所选择的特征转换为贝叶斯分类器进行训练的空间向量模型数据,然后 利用贝叶斯算法对该空间向量模型数据进行训练,得到所述故障识别模型。

进一步地,所述数据归集组件包括历史监测数据归集和实时数据归集,用于对车站、电 务段的集中监测系统(CSM)中存储的历史监测数据进行采集,并将这部分数据备份到数据 分析服务器的数据存储组件。

进一步地,所述数据存储组件,将格式化的监测数据存储到Excel或者文本中,这样更 有助于数据的处理,并对数据预处理组件提供数据支撑。

进一步地,所述数据分析服务器的数据预处理组件,对得到的历史监测数据进行预处理, 检查并处理数据中的异常点、检查数据的完整性、对不同车站、电务段的监测信号进行融合、 对监测数据进行离散化、归一化等操作,统一数据的格式和取值范围。

进一步地,所述数据分析服务器的特征选择组件对得到的监测数据进行特征选择,根据 问题的理解和数据的特点,利用经验或特征选择算法选择出与问题相关的数据。将这些数据 从原始数据中抽取出来,并将这些传送给模型训练组件。分析故障监测数据的父子关系,然 后对父子关系进行标注以得到不同的权重。

进一步地,所述数据分析服务器的数据向量化组件,通过对输入数据格式的分析,编程 实现数据格式的转换,将输入的数据转换为向量模式,适用于改进贝叶斯分类器处理的空间 向量模型格式。

进一步地,步骤4)所述采用改进贝叶斯算法构造故障识别模型的具体实施过程为,根 据出现故障的各类监测数据,计算出在出现某一类故障时,与其相关的监测数据的取值情况, 然后计算出先验概率P(监测值|故障类型),然后利用贝叶斯公式计算出后验概率P(故障类型| 监测值),这样就可以计算出给定监测值下,出现某一类故障的概率。为了提高故障识别的准 确率,需要对故障进行详细分析,分析其故障的类别以及与其相关的监测数据。

进一步地,步骤4)中为了使用监测数据的时序性和父子关系的特点,对改进贝叶斯算 法进行改进:首先,需要对数据进行分析,识别出监测数据中的父子关系,并给父节点以更 高的权重;其次,结合识别出来的父子关系和监测数据中的时序信息进行故障分析。只有当 父类的监测数据出现异常的时候,才对子节点的监测数据进行分析。

进一步地,步骤1)到步骤6)所述的一种基于改进贝叶斯的交通监测数据故障识别方法 适用于轨道交通监测数据运维级和设备级的故障分类识别。设备级监测数据分析是数据分析 算法针对某一个指定的设备进行监测数据采集、处理、模型生成和故障分析;运维级监测数 据分析是针对整个运行系统的某一类故障进行监测数据的采集、处理、模型生成和故障分析。

进一步地,轨道监测数据的数据量很大,可以采用云平台对监测数据进行分布式存储和 并行计算,以提高该方法的计算速度和大数据处理能力。

与现有技术相比,该发明的优点是:

本发明加快了故障识别的速度,采用改进的改进贝叶斯算法针对轨道交通监测数据的父 子性和时序性特点进行故障识别,可以加快故障识别的速度,通过对实时监测数据进行分析, 可以快速的发现故障,并识别出故障的类型。

本发明通过使用模型识别故障,节省了大量的人力成本,不再需要人工的去观察监测信 息然后进行故障识别和分析;能够提高轨道交通监测数据故障识别的准确率,缩短故障修复 时间,大大提高轨道交通的故障处理效率,提高运维能力。

本发明通过云平台对监测数据进行分布式存储和并行计算,可以解决不断增加的轨道交 通监测数据的存储和处理问题。从而可以比较从容的应复杂的设备故障和行车事故原因。

在本发明的基础上,加入算法的学习能力,则可以不断的提高故障识别的能力,通过不 断的累积学习可以发现人工还没有总结出现的新故障,已经故障产生的新原因。

此外,本发明也可应用于设备级(信号设备)的信号数据分析和故障诊断,提高信号设备 对故障的自诊断能力,及时预警、提高设备自身的安全性能,从而实现从运维和设备两方面, 保障行车安全,提高运行能力。本发明对轨道交通监测故障数据类别识别准确率高,且具有 实时性,模型参数能够自动调整。

附图说明

图1是本发明的轨道交通监测故障数据类别识别分析的流程图。

图2是本发明的组件连接示意图。

图3是本发明实例运维级轨道故障分析的规则图。

图4是本发明的设备级轨道故障分析实例的流程图。

具体实施方式

下面通过具体实施例和附图,对本发明做详细的说明。

本实施例的一种基于改进的改进贝叶斯的轨道交通监测数据的故障分类识别方法及系统 由以下部分组成:与集中监测系统连接的数据归集组件、位于数据分析服务器的数据存储模 块、数据离散化模块、特征选择模块、数据向量化的模块、模型训练模块和实时数据分析模 块。用于解决现有技术中人工诊断铁路信号系统故障时工作量大、效率低下、风险性高等技 术问题。故障识别模型主要由三个步骤:一个是数据准备阶段,将原始的监测数据进行离散 化、特征选择和格式转换,获取贝叶斯分类器可以处理的训练集;二是根据给定的训练集找 到合适的改进贝叶斯分类器核函数及参数,通常称为模型训练阶段;三是使用第一步训练完 成的函数模型分析实时监测数据,以得到系统是否出现故障以及故障产生的原因。

1、位于各车间、电务段、铁路局、铁道部的数据归集组件

包括位于各车间、电务段、铁路局、铁道部的数据归集系统;数据归集系统与对应位置 的集中监测系统(CSM)相连接,获取其中的数据。其中获取的监测数据分为历史监测数据 和实时监测数据;历史监测数据在模型训练阶段使用,用于对模型进行训练以得到分类模型; 训练得到的模型用于对实时监测数据进行分类,以得到系统当前的运行状态,如是否有故障 以及故障的原因等。

数据归集组件与数据分析服务器连接,数据归集组件将获取到的监测数据传输给数据分 析服务器上的数据存储组件。

2、数据存储组件

数据存储组件位于数据分析服务器中,支持格式化、半格式化和非格式化的数据存储。 历史监测数据由于数据量较大,为了便于并行处理,一般采用文件的方式进行存储。进一步 的可以采用分布式文件系统进行历史监测数据的存储,并且采用并行计算架构对监测数据进 行计算,以提高数据存储的能力和数据计算的能力。数据存储组件对外提供数据访问的接口。 数据归集组件利用其与数据分析服务器的连接,调研数据存储组件的数据存储接口,将历史 监测数据和实时监测数据存储在数据分析服务器中。在进行监测数据存储时,对监测数据增 加时序信息。

3、数据预处理组件

数据预处理组件位于数据分析服务器中,通过与数据存储组件之间的连接,调用数据访 问的接口,对得到的监测数据进行预处理。首先检查数据的正确性和完整性,然后进行相应 的处理,如数据条删除等。进一步地,对监测数据进行离散化,形成格式正确,样本空间完 整的监测数据集。

4、特征选择组件和数据向量化组件

特征选择组件和数据向量化组件将预处理之后的数据进行特征选择、数据向量化等工作, 将数据转化为使用贝叶斯分类器支持的CSM格式的数据。

在进行特征选择的时候需要分析出故障监测数据的父子关系,这些父子关系可以通过故 障识别规则中得出,也可以通过不断的学习中得出。

5、模型训练组件

获取VSM格式的监测数据,然后使用不同的参数对该数据进行十倍交叉验证。以得到 分类和泛华能力最好的模型以及参数。通过与实时分析组件的连接,将训练好的模型传输给 分析组件。

6、实时数据分析组件

实时监测数据也需要经历与历史监测数据类似的流程,最后将VSM格式的实时监测数 据作为输入,输入到实时数据分析组件,通过计算就可以得到当前的系统是否存在特定的故 障,以及该故障产生的原因,如图2所示。

本发明利用改进贝叶斯分类器进行轨道交通监测数据的分析可以针对运维级和设备级两 种级别的故障进行分析。运维级的故障分析是以故障为单位进行分析的,目的是对整个系统 的某种故障进行分析识别,对故障进行分析时需要首先获取与故障相关的所有监测数据,然 后针对这些监测数据进行数据分析和故障诊断。设备级的故障分析是以设备为单位进行分析 的,目的是识别出某一个设备的所有故障,在模型训练和故障分析时只需要获取该设备的所 有监测数据。下面通过实例分别说明运维级和设备级故障分析,对本发明的运行过程做详细 说明。

运维级故障识别实例轨道电路故障是轨道交通的常见故障,故障分为两个大类:室内故 障和室外故障。现有系统中当轨道电路出现故障是,需要相关人员调出相关的监测数据,然 后综合各种监测数据的值进行判断分析,以得到故障的类型。这种分析方法对工作人员的技 术能力和经验有相当高的要求,并且当故障出现时,需要手动的找到相关的监测数据进行分 析。这样必然会需要一定的时间来进行操作和分析判断。

通过上述分析可知,现有系统虽然实现了对轨道交通运行数据的监测和统计,但是监测 数据的分析主要还是通过人工来进行,造成了人力资源和时间资源的浪费,对于轨道交通来 说,当系统出现故障时,必须要及时的对故障进行抢修和排除。

图3是一个25Hz相敏轨道电路区分室内室外故障的流程图。图3所示的轨道电路故障 原因分析是一个分类问题,非常适合使用改进贝叶斯分类器进行分析判断,下面结合数据使 用改进贝叶斯分类器对故障类型进行自动的判断分析。

图3是根据人工经验规则进行构造的故障模型,整个故障模型的祖父节点是分线盒测试 受端电压,25Hz相敏轨道电路区是否产生故障是依据分线盒测试受端电压进行判断的。当分 线盒测试受端电压出现异常(电压为0V、低于日常测试值、高于日常测试值三种情况),那 么这个故障必然会发生。然后再根据下一层的监测信号进行进一步的分析判断,以判断故障 产生的原因。叶子节点都是具体的故障原因,非叶子节点都是监测点,父节点的权重大于子 节点的权重。

在进行故障判断时,相关的监测数据包括:分线盒受端电压、甩开电缆端子室外侧电压、 送端电压,测数据的类型均为模拟量。

通过数据预处理和特征选择之后,完成的特征提取结果为:

为了简化说明,上表中三个测试点的正常电压值均设置为25v。故障的类型分为三类:

(1)无故障;

(2)故障在室内;

(3)故障在室外;

(4)室内短路;

(5)室内开路;

将上述数据进行向量化,以便于改进贝叶斯分类器进行计算:

实例数据位:

01:25.02:25.03:25.0

01:25.02:25.03:25.0

01:25.02:25.03:25.0

41:30.02:25.03:25.0

41:30.02:35.03:20.0

11:0.02:0.03:0.0

21:0.02:25.03:25.0

31:0.02:50.03:25.0

31:15.02:50.03:25.0

11:0.02:0.03:0.0

11:0.02:0.03:0.0

最前面的一列数字代表故障的类型:

·0表示没有故障

·1表示故障在室内

·2表示故障在室外

·3表示室内短路

·4表示室内开路

设备级故障诊断实施例

设备级故障诊断将本方案的数据分析方法可以部署在专用的数据分析服务器上也可以与 设备采集组件一样部署在设备监测工作站中。当数据部署在数据分析服务器时,与运维级的 设备检测数据的处理流程类似。当部署在本地的监测工作站时,数据的采集、存储和分析均 可以在工作站内完成。数据分析组件对设备历史监测数据进行数据分析,将得到的故障诊断 模型存储于本地的知识库中。对于设备实时监测数据,通过调用知识库中故障诊断模型完成 对设备的故障诊断,并根据故障诊断的结果对知识库中故障诊断模型进行评估和修改。

图4是电源屏设备的故障分类识别意图。该图所示的设备故障识别机原因分析也是一个 分类问题,适合使用改进贝叶斯进行故障分析。下面结合数据使用贝叶斯分类器对电源屏进 行故障分析诊断。通过图4可知,在进行故障判断时,相关的监测数据包括:分线盒受端电 压、甩开电缆端子室外侧电压、送端电压,测数据的类型为布尔量。

具体的处理流程与运维级的类似,包括数据采集、预处理、特征选择、模型训练和实时 监测数据分析。区别在于设备级的故障分析可以在本地的监测设备中执行也可以在数据分析 服务器中执行。

由于数据量较大这里只是列出实例数据,将这些数据作为改进贝叶斯分类器的输入进行 训练,可以得到预测模型。然后通过输入不同的测试数据可以得到轨道电路故障分析的结果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号