首页> 中国专利> 一种基于关联规则有向无环图的农机故障识别方法

一种基于关联规则有向无环图的农机故障识别方法

摘要

本发明提出了一种基于关联规则有向无环图的农机故障识别方法,能够提高农机故障数据的分类准确率,具有快速匹配,能够自增长的特点。首先从历史故障维修数据中提取故障环境信息、故障类型信息以及故障处理信息,每一故障数据用一条事务来表示,得到故障维修数据集对应的事务集,针对每一条事务建立其对应的一条或多条关联规则,得到该条事务的关联规则集;然后再利用有向无环图结构,将所述关联规则集组合成为由故障环境信息、故障类型信息和故障处理信息的一种有向无环图;最后在有新的故障信息进入系统后,采用有向无环图的搜索方式,通过输入故障环境信息,最终得到能够知道维修的故障处理信息。

著录项

  • 公开/公告号CN105117771A

    专利类型发明专利

  • 公开/公告日2015-12-02

    原文格式PDF

  • 申请/专利权人 北京理工大学;

    申请/专利号CN201510449582.6

  • 申请日2015-07-28

  • 分类号G06N5/04;

  • 代理机构北京理工大学专利中心;

  • 代理人高燕燕

  • 地址 100081 北京市海淀区中关村南大街5号

  • 入库时间 2023-12-18 12:40:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-20

    授权

    授权

  • 2015-12-30

    实质审查的生效 IPC(主分类):G06N5/04 申请日:20150728

    实质审查的生效

  • 2015-12-02

    公开

    公开

说明书

技术领域

本发明涉及一种农机故障识别方法,尤其是针对利用历史故障数据和实时 工况数据进行数据挖掘的农机装备故障识别方法。

背景技术

随着现代化农业的不断发展,用于农业生产的农机数量在不断增加,而且 农机作业区域也越来越广。对于农机来说,其作业具有跨地区,远距离,野外 作业等特点。在农机使用过程中发生农机故障时,通常是人工联系维修服务中 心,由服务中心安排服务网点派出维修技术人员到农机故障现场进行技术服务。 由于技术人员通常无法事先得知农机故障的准确原因,技术人员到达农机故障 现场进行技术服务时往往并不能一次性带齐检测故障或维修所使用的工具或者 配件,这样导致技术人员在故障现场准确得知农机故障的原因后,可能需要重 新折回维修服务网点,甚至需要多个回合才能解决故障,使得工作量大,效率 低下。特别是,在人工联系的维修服务网点与农机故障现场距离较远时,效率 低下的特征就表现得尤为明显;并且还可能会因为农机故障不能及时排除,使 得小故障造成大损失,耗时耗钱且影响农业生产活动(如抢收抢种)。

在过往的维修历史中,会保存有大量的维修历史记录,在该历史记录中会 有与故障相关的很多信息。这些故障相关信息的背后蕴含着大量可以用来进行 故障匹配以及故障处理相关的指导意见。关联分析用于发现隐藏在大型数据集 中具有利用价值的联系,所发现的模式通常用关联规则的形式表示。关联规则 是形如X->Y的蕴含表达式,其中X和Y是不相交的项集。关联规则挖掘的经典 应用是购物篮分析,目的是发现客户在商品选购之间的联系,在这个领域关联 分析有很好的效果。农机发生故障的影响因素有很多,同时这些影响因素对故 障造成的影响很难一目了然地找到,因此就需要使用关联分析用于找出这些影 响故障发生的因素。

目前在实际应用中,由于大量数据挖掘得出的关联规则相对复杂,并且这 些规则之间的关系在规则结构上难以直接体现,所以在基于关联规则进行故障 匹配就会非常繁琐,当数据量很大的情况下,粗暴地逐条匹配的时间复杂度会 非常高,这导致规则的应用效率低下。

出于以上的目的,就需要构建一种关联规则的应用模型,使得规则可以高 效得使用。通过构建故障关联规则库模型,为后续的规则匹配进行基础准备, 规则匹配的功能是通过对规则库模型的搜索来完成的。在本技术中,故障关联 规则库模型是由故障环境信息、故障类型信息以及故障处理信息等信息构成的 一种图状结构,系统通过对该图状结构的搜索,来找到相应故障环境信息所对 应的故障处理方法,从而完成从故障现象到故障处理的推理过程。

发明内容

为了快速匹配农机故障的类型以及得出相应的解决方案,提高农机运维的 效率,本发明提出了一种基于关联规则有向无环图的农机故障识别方法,能够 提高农机故障数据的分类准确率,具有快速匹配,能够自增长的特点。

为了实现上述目的,本发明提出的一种基于关联规则有向无环图的农机故障识 别方法,首先从历史故障维修数据中提取故障环境信息、故障类型信息以及故 障处理信息,每一故障数据用一条事务来表示,得到故障维修数据集对应的事 务集,针对每一条事务建立其对应的一条或多条关联规则,得到该条事务的关 联规则集;然后再利用有向无环图结构,将所述关联规则集组合成为由故障环 境信息、故障类型信息和故障处理信息的一种有向无环图;最后在有新的故障 信息进入系统后,采用有向无环图的搜索方式,通过输入故障环境信息,最终 得到能够知道维修的故障处理信息。

本发明的有益效果:可以实现利用历史数据和实时状态数据进行规则挖掘, 得到能够有益于指导维修的关联规则,并且有新的故障需求后,通过搜索已经 构建好的关联规则有向无环图,最终得到该故障对应的故障处理方法。整个过 程能够减少运维过程中大量的资源浪费,得到有针对性的维修策略。

附图说明

图1为本发明基于关联规则有向无环图的农机故障识别方法流程图;

图2为本发明中对每一个结点进行存储的形式示意图;

图3为本发明中作为单链表的邻接点来存储的示意图;

图4为本发明中故障规则有向无环图构建流程图;

图5为本发明中故障规则有向无环图匹配流程图。

具体实施方式

步骤1:关联规则挖掘过程

本发明中,主要采用关联规则挖掘的方法,利用目前已知的历史维修数据, 来寻找故障情况与机械工作环境、工作状态、时间、地域等特征之间的关系。 得到这些关联规则之后,希望建立一种规则应用模式,有效地通过输入机械的 各种信息来对农机进行故障诊断并给出农机维修方式、维修时机等决策支持。 总体过程如图1所示。

1)数据准备。在本发明中,知识的初始来源是农机索赔单的记录,而在这 些记录中,存在大量不同种类的字段,这些字段存在大量的噪声以及不完整等 情况,我们需要在规则发现之前对数据进行预处理,提高数据质量,使之符合 算法的规范和要求。另外,我们需要对原始数据进行初步的操作,将其中表达 同一内容的字段分类、整合,并将其中的长段中文信息,利用中文分词进行处 理,并且生成自定义词典以达到更好的分词效果。

2)挖掘实施。本研究中,对目前主流的Apriori算法进行,利用这种关联 规则挖掘算法对已经处理好的原始数据进行数据挖掘。挖掘实施涉及两个过程: 频繁项集生成以及强关联规则生成。在这两个过程中,前者是影响整个算法执 行效率最大的过程。

通过构建故障规则库,为后续的规则匹配进行基础准备,规则匹配的功能 是通过对规则库的搜索来完成的。在该研究中,故障规则库是由故障环境信息、 故障类型信息以及故障处理信息等构成的图状结构,系统通过对该图状结构的 搜索,来找到相应故障环境信息对应的故障处理方法,从而完成从故障现象到 故障处理的推理过程。

步骤2:故障规则有向无环图基本结构

其中,故障环境信息包括但不限于以下类型:产品基本信息(车型,车辆 购买时间,地理位置等)、用户基本信息(联系人,电话,地址等)、故障现场 描述等信息。故障类型信息包括但不限于以下类型:故障零部件、故障现象名 称等信息。故障处理信息包括但不限于以下类型:处理意见或措施等信息。

在该规则库构建过程中所采用的关联规则主要分为两种:1、形式为{故障 环境信息}→{故障类型信息};2、形式为{故障类型信息}→{故障处理信息}。 故障环境信息:a1,a2,a3,故障类型信息:b1,b2,故障处理信息:c1,c2, c3。我们通过关联规则挖掘得到的规则有:{1、a1,a2,a4b1,2、a2b2, 3、a3b3,4、b1c1,5、b2c3,6、b3c2}

步骤3:故障规则有向无环图存储结构

关于该故障规则图的存储结构采用邻接表的形式,对每一个结点进行存储。 其存储形式如图2所示。

其中,左侧部分为一个一维数组,该数组存储所有图中顶点,其中的c类 结点也就是故障处理信息结点是整个故障匹配的所要得出的结果,所以c类结 点不存在后续结点,所以在该一维数组中就不存放该类结点。右侧部分每个顶 点与其所有的邻接点构成一个线性表,由于邻接点个数不定,所以使用单链表 来进行存储,同时存储结构体现了该图的有向性。

对于每一个顶点来说,它是由data域和firstedge域组成,data域是数据 域,用于存储顶点的信息,firstedge域是指针域,用于指向单链表的第一个结 点,也就是其第一个邻接点。单链表结点由data域,sup域,conf域和next 域组成。data域是数据域,存储该邻接点的信息,sup域是支持度域,存储{顶 点→邻接点}规则的支持度,conf域为置信度域,存储{顶点→邻接点}规则的置 信度,next则存储指向单链表中指向下一个邻接点的指针。

在该存储结构中,存在两种可用的存储结构:1、邻接表,2、逆邻接表。 之前描述的是邻接表的存储形式。逆邻接表的存储与邻接表的存储方式正好相 反,它是把结点的初始点(initialnode)作为单链表的邻接点来存储,其存 储形式如图3所示;

逆邻接表与邻接表的区别是,逆邻接表的每个单链表存储了每个结点的入 度以及其初始点(initialnode)集合,例如,在上面的例子中,我们可以发 现b1的初始点集合为{a1,a2,a4}。而邻接表的每一个单链表存储了该结点的出 度以及其终端点(terminalnode)集合,例如,在上面的例子中,a1的终端点 集合为{b1},a2的终端点集合为{b1,b2}。

关于两种存储结构的比较,主要是在有向无环图匹配中体现出差异,这部 分内容,我们将在故障规则有向无环图匹配部分着重分析。

步骤4:故障规则有向无环图构建

输入:关联规则

输出:故障规则库

流程逻辑:

流程描述:

1、开始:接收添加规则A→B的任务。

2、在故障规则有向无环图中的顶点集中查找data域等于A的结点。如果不 存在data域等于A的结点,那么在顶点集中添加该结点,并将其firstedge域 指向B构成的邻接点,该邻接点的data域为B,sup域和conf域为规则A→B 的支持度和置信度,next域设为null。

3、如果存在data域等于A的顶点,那么遍历其后继的单链表,在其中寻找 data域等于B的邻接点。如果该邻接点不存在,则将该单链表的最后一个邻接 点的next域由null改为指向一个邻接点,该邻接点的data域为B,sup域和 conf域为规则A→B的支持度和置信度,next域设为null。

4、如果存在data域等于B的邻接点,那么将该邻接点的sup域和conf域 更新为规则A→B的支持度和置信度,整个流程结束。

步骤5:故障规则有向无环图匹配

在规则库的应用中,需要根据故障需求信息对故障现象进行提取,并判断 故障现象是否为知识库中标准的故障现象,如果是,则进行故障现象输入,否 则现将故障现象标准化,即将现象描述转换成规则库中识别的故障现象,再进 行故障现象输入。

输入故障现象,在链表中进行“故障现象→故障原因”检索,将搜索到的 故障现象与故障原因进行遍历,判断是否存在不同的故障现象导出的同样的故 障原因,若存在,则在链表中进行“故障原因→故障处理”检索,最后输出“故 障现象→故障原因→故障处理”的结果,否则根据概率公式计算不同故障现象 导出相同故障原因的概率。

输入:故障现象

输出:匹配规则(故障现象→故障原因→故障处理)

逻辑流程:按照故障维修任务单标准化故障现象a1a2……an,进行故障 现象输入。在故障规则有向无环图中的顶点集中查找data域等于an的结点, 并保存每个an和其后继点bn和其sup域的置信度。比较每个an是否有相同的 后继点。如果有相同后继点,则在故障规则有向无环图中的顶点集中查找data 域等于bn的结点,并保存其后继点cn;如果没有相同后继点,则计算bn同时 出现在每个an后继点的概率,并根据计算出的概率进行排列,选取概率较大的 前三个bn在故障规则有向无环图中的顶点集中遍历查找data域为每个bn的结 点,并保存其后继点cn。输出最后的搜索结果:“an→bn→cn”。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号