首页> 中国专利> 一种飞行数据知识获取系统及其获取方法

一种飞行数据知识获取系统及其获取方法

摘要

本发明提出一种飞行数据知识获取系统及其获取方法。其中,飞行数据知识获取系统主要包括飞行数据获取模块、飞行数据库模块、模式选择模块、数据准备模块、数据显示模块、任务执行模块、规则输出模块、规则处理模块、知识获取模块和知识库模块,将飞行数据输入并进行处理,通过规则获取工作,提取有用数据形成规则,并作为知识提供给用户。飞行数据知识获取方法,主要通过将输入的飞行数据进行处理,采用Apriori算法或者Mulit-Rule方法进行关联规则挖掘,将提取的规则作为知识提供给用户。本发明采用消除冗余规则和合并规则,降低知识库的维护难度,利用关联规则方法实现知识自动获取过程,适用于对多维和单维数据的处理,减少了人工输入和对专家经验的依赖。

著录项

  • 公开/公告号CN101887531A

    专利类型发明专利

  • 公开/公告日2010-11-17

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN201010208642.2

  • 发明设计人 路辉;毛可飞;陈付亮;

    申请日2010-06-13

  • 分类号G06N5/00;

  • 代理机构北京永创新实专利事务所;

  • 代理人周长琪

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-12-18 01:05:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-08-03

    未缴年费专利权终止 IPC(主分类):G06N5/00 授权公告日:20121219 终止日期:20150613 申请日:20100613

    专利权的终止

  • 2012-12-19

    授权

    授权

  • 2011-03-23

    实质审查的生效 IPC(主分类):G06N5/00 申请日:20100613

    实质审查的生效

  • 2010-11-17

    公开

    公开

说明书

技术领域

本发明属于飞参数据处理领域,具体涉及一种飞行数据知识获取系统及其获取方法。

背景技术

飞行数据是飞机从起飞到降落过程中由飞行数据记录设备所记录下来的一系列与飞机性能和状态相关的飞行参数,对飞行动作识别、设备性能趋势分析和飞行事故鉴定具有重要的作用。

目前利用飞行数据进行故障诊断和趋势预测,实现飞机的视情维修是一个重要的研究方向,这两个功能的实现是以强大的知识库为基础的,知识库是构建飞行数据专家系统的重要基础。因此,知识库中知识的获取问题成为飞行数据专家系统的瓶颈问题。

按知识获取的自动化程度,可以将知识获取分为半自动知识获取和自动知识获取两种方式。

在半自动的知识获取方式中,知识获取分两步进行:知识工程师首先从相应知识源获取知识,然后通过知识编辑软件将知识输入到知识库中。这种方式主要是人工输入,同时非常依赖于专家经验,因此如果能找到一种方法实现知识的自动获取,将在很大程度上提高专家系统的智能性,更能发挥出专家系统的专家优势。

自动知识获取是一种理想的知识获取方式,指系统自身具有获取知识的能力,不仅可以直接从知识源“学习”相关的基础知识,而且还能从系统自身的运行实践中总结、归纳出新知识,不断完善自身知识库。尽管目前尚不能实现知识的完全自动获取,但长期以来,知识获取研究工作集中于提高知识获取过程的自动化程度,减轻知识工程师的负担,已经取得了长足进展。

目前关于自动知识获取的方法主要有基于神经网络、免疫算法、遗传算法和粗糙集方法。神经网络具备大规模并行分布处理能力、非线性处理能力、高度的鲁棒性和学习联想能力,但主要面临的问题是确定网络的结构、降低网络学习的复杂性和提高网络的泛化能力。免疫算法是模拟生物规律的算法,它试图寻求最优解,因此算法的运行时间较长、效率不高,并且对于大量的连续属性的模糊信息系统在使用过程中效果不会很好。遗传算法在求解过程中必须选取适当的交叉概率和变异概率,否则会造成算法不稳定或收敛问题;粗糙集理论作为一种分析和处理不精确、不一致、不完整信息和知识的数学工具,它能从大量的数据中推导出具有指导意义的诊断规则,分析发现有用的规律信息。

经研究发现,数据挖掘中的关联规则方法具有强大的知识获取能力,它能挖掘出数据之间的不易发现的联系,把这种联系表示成规则,形成知识,最后把大量的知识形成知识库,为专家系统进行故障诊断和趋势预测提供强大的知识依据。关联规则通过对给定数据集中各项之间的频繁项(经常发生的事件)进行分析,找到有意义的知识,这种方法可以对各种类型的数据进行处理,并且可以处理单维和多维空间的大量数据,适合对飞行数据进行处理。目前国内外已经初步开展利用关联规则进行飞参数据的知识获取方法研究,但都是针对单维数据进行的处理,而且没有形成相应的系统。

发明内容

本发明的目的是提出一种飞行数据知识获取系统及其方法,该系统可以根据飞行数据的特点,同时不依赖于专家经验,不需考虑数据类型的不一致性的特点,可以对数值型数据、区间型数据、字符型数据进行处理,分析飞行数据中隐含的有用信息,形成知识,为开展故障诊断和趋势预测提供知识库。本发明适合解决单维和多维飞行数据的知识获取问题,同时也可以应用于其它类型的知识获取平台,另外根据关联规则方法的特点,该系统可以对大数据量的飞行数据集提供快速的处理能力。

本发明一种飞行数据知识获取系统,由用户参与,主要包括飞行数据获取模块、飞行数据库模块、模式选择模块、数据准备模块、数据显示模块、任务执行模块、规则输出模块、规则处理模块、知识获取模块和知识库模块。

飞行数据获取模块获取飞行数据,将获取的飞行数据发送给飞行数据库模块;飞行数据库模块将得到的飞行数据存储到数据库表中;数据准备模块对飞行数据库模块中数据库表中记录的飞行数据进行数据处理,使处理后的数据能够用于关联规则挖掘,并将处理后的数据作为数据源提供给数据显示模块和任务执行模块;数据准备模块针对单维飞行数据采用字符标记处理,针对多维飞行数据,根据飞行数据的数值区间进行数据分层,采用字符标号对每一层的数据区间进行标识,在进行数据分层前对飞行数据的数值异常点按前后均值方法进行处理;数据显示模块将接收的飞行数据显示给用户;

用户通过模式选择模块选择知识获取模式:选择进行单维飞行数据的知识获取或者选择进行多维飞行数据的知识获取,模式选择模块将选择好的知识获取模式通知给任务执行模块;

任务执行模块根据知识获取模式,对数据准备模块处理后的飞行数据开展规则获取工作,获取隐含在飞行数据中的有用信息,并形成规则,提供给规则输出模块;

规则输出模块将获取的规则显示给用户,并将获取的规则提供给规则处理模块;规则处理模块对规则输出模块提供的规则进行处理,主要包括对冗余规则的处理和进行规则的合并,并将该规则作为知识提供给知识获取模块;

知识获取模块将接收的知识,显示给用户,同时将知识提供给知识库模块;知识库模块将知识获取模块提供的知识按照存储到数据库中。

所述任务执行模块采用Apriori算法处理单维飞行数据,采用Mulit-Rule方法处理多维飞行数据,其中,Multi-Rule方法是本发明基于Apriori算法提出的一种进行多维关联规则挖掘的方法。

本发明的基于飞行数据知识获取系统的一种飞行数据知识获取方法,包括以下步骤:

步骤一、获取飞行数据:飞行数据获取模块通过飞行参数记录仪的数据读取软件获取飞行数据,或者通过飞行数据文件获取飞行数据,飞行数据获取模块将获取的飞行数据存储到飞行数据库模块中;

步骤二、选择知识获取模式:用户根据实际的需求,通过模式选择模块来选择需要进行知识获取模式,选择进行单维飞行数据的知识获取或者选择进行多维飞行数据的知识获取,模式选择模块将选择的知识获取模式传递给任务执行模块;

步骤三、数据准备:数据准备模块对飞行数据库模块中的数据进行处理,主要包括消除噪声、类型转换和数据分层工作,使飞行数据库模块中的数据成为关联规则挖掘能用的数据,数据准备模块将处理后的数据传递给任务执行模块;

步骤四、关联规则挖掘:任务执行模块根据步骤二用户选择的知识获取模式,对步骤三处理后的数据,通过关联规则挖掘获取隐含在飞行数据中的有用信息,并将这些信息形成规则;

步骤五、规则输出:规则输出模块将步骤四形成的规则提供给规则处理模块,同时将规则通过人机界面显示给用户;

步骤六、规则处理:规则处理模块对规则输出模块提供的规则进行处理,处理后的规则作为知识提供给知识获取模块;

步骤七、知识获取:知识获取模块接收步骤六的知识,将该知识存储到知识库模块,并显示给用户。

本发明的优点与积极效果在于:

(1)不但适用于单维飞行数据的知识获取,在多维数据知识获取方面同样具有优势;

(2)进行知识获取时,可以同时处理多种类型(如数值型、区间型)的数据,无须考虑数据类型不一致的问题;

(3)利用关联规则方法进行知识的获取工作,该方法对大数据量的飞行数据集提供快速的处理能力;

(4)可以对得到的规则进行处理,消除冗余规则并对相互包含的规则进行合并,使知识库的维护难度降低;

(5)利用关联规则方法研制的知识获取系统,可以实现知识自动获取的过程,减少人工输入和对专家经验的依赖。

附图说明

图1是本发明基于关联规则方法的飞行数据知识获取系统结构图;

图2是本发明基于关联规则方法的飞行数据知识获取基本流程图;

图3是本发明处理单维飞行数据知识获取方法的流程图;

图4是本发明处理多维飞行数据知识获取方法的流程图;

图5是本发明规则处理模块处理过程的流程图。

图中:      1.飞行数据获取模块    2.飞行数据库模块    3.模式选择模块4.数据准备模块  5.数据显示模块        6.任务执行模块      7.规则输出模块8.规则处理模块  9.知识获取模块        10.知识库模块       11.用户

具体实施方式

下面将结合附图和实施例对本发明作进一步的详细说明。

本发明一种基于关联规则的飞行数据知识获取系统的结构如图1所示,主要包括飞行数据获取模块1、飞行数据库模块2、模式选择模块3、数据准备模块4、数据显示模块5、任务执行模块6、规则输出模块7、规则处理模块8、知识获取模块9和知识库模块10。

其中,飞行数据获取模块1获取飞行数据传递给飞行数据库模块2保存在数据库表中,数据准备模块4将飞行数据库模块2中保存的飞行数据进行处理以使该飞行数据能够用于关联规则挖掘,数据准备模块4将处理好的数据传送给数据显示模块5和任务执行模块6。数据显示模块5将数据显示给用户11。用户11通过模式选择模块3选择知识获取的模式,模式选择模块3将选择的知识获取模式通知任务执行模块6。任务执行模块6根据知识获取模式对经过数据准备模块4处理后的飞行数据进行关联规则挖掘,将有用的信息形成规则输出给规则输出模块7。规则输出模块7将接收的规则传送给规则处理模块8和用户11。用户11可以对规则输出模块7输出的规则进行查看。规则处理模块8对规则输出模块7提供的规则进行冗余规则处理和合并规则处理,并将该规则作为知识提供给知识获取模块9。知识获取模块9将接收的知识,显示给用户11,同时将知识提供给知识库模块10。知识库模块10将得到的知识按照设计好的数据库格式存储到相应的数据库中。

飞行数据获取模块1是本发明的知识获取系统与目前各种飞行参数记录仪数据转换的接口。飞行数据获取模块1读取飞行数据,飞行数据通过飞行参数记录仪的数据读取软件获取,或者直接通过飞行数据文件获取,并将读取的飞行数据发送给飞行数据库模块2。

飞行数据库模块2将从飞行数据获取模块1得到的飞行数据存储到相应的数据库表中,该数据库表存储飞行数据的基本信息以及飞行数据的具体数值信息,飞行数据的基本信息包括飞行数据所属系统的名称、飞行数据的标号、飞行数据的名称和飞行数据的类型,飞行数据的具体数值信息包括如:飞行数据的记录时间和相应的数据值。所有的飞行数据都可以采用统一的数据库表结构。

用户11通过模式选择模块3选择相应的知识获取模式,用户11可以选择进行单维飞行数据的知识获取,也可以选择进行多维飞行数据的知识获取。模式选择模块3将选择的知识获取模式提供给任务执行模块6。

数据准备模块4对飞行数据库模块2中数据库表中记录的数据进行数据处理,使处理后的数据成为关联规则挖掘可用的数据,将处理后的数据作为数据源提供给数据显示模块5和任务执行模块6。飞行数据库模块2中记录的原始飞行数据并不是完整的数据,一般都包含噪声、异常值或不一致的数据,因此数据准备模块4需要根据原始飞行数据的特点对飞行数据库模块2中记录的原始飞行数据进行相应的处理,如消除噪声、剔除异常值、进行类型转换工作。具体处理方式为:对单维飞行数据主要是根据飞行数据的数据类型特性进行字符标记;对多维飞行数据,将飞行数据的数值异常点按前后均值方法进行处理,再根据飞行数据的数值区间进行数据分层,采用相应的字符标号对每一层的数据区间进行标识。所述的前后均值方法就是取异常值所对应点的前一个点和后一个点,然后将这两个点对应的数值求和并取平均值。

数据显示模块5接收数据准备模块4处理好的飞行数据,并将其显示给用户11,便于用户11对数据进行观察分析。

任务执行模块6根据模式选择模块3选择的知识获取模式,并利用数据准备模块4提供的处理后的飞行数据开展规则获取工作,获取隐含在飞行数据中的有用信息,并形成规则,提供给规则输出模块7。在单维飞行数据的知识获取模式下,任务执行模块6采用Apriori算法进行关联规则挖掘;在多维飞行数据的知识获取模式下,任务执行模块6采用Mulit-Rule方法进行关联规则挖掘。所述Apriori算法是一种逐层搜索的迭代方法,Apriori算法中K项集用于搜索(K+1)项集。首先找出频繁1项集的集合,该集合记作L1,L1用于找频繁2项集的集合L2,L2用于找频繁3项集的集合L3,如此递推,直到不能找到K项集,从而完成规则的挖掘工作。其中,K为大于0的整数。

所述的Mulit-Rule方法是本发明基于Apriori算法提出的一种进行多维关联规则挖掘的方法,也是一种逐层搜索的迭代方法。Mulit-Rule方法中K项集用于搜索(K+1)项集。首先找出频繁1项集的集合,该集合记作L1,L1用于找频繁2项集的集合L2,L2用于找频繁3项集的集合L3,如此递推,直到不能找到K项集,从而完成规则的挖掘工作。

规则输出模块7将从任务执行模块6获取的规则显示给用户11,便于用户11对得到的规则进行察看,同时将获取的规则提供给规则处理模块8。

规则处理模块8对规则输出模块7提供的规则进行处理,主要包括对冗余规则的处理和进行规则的合并工作。经过规则处理模块8处理后的规则是最简的,同时是独立的一种描述方式。根据每一条规则的前提与结论所涉及的飞行数据的具体信息,将每条规则与相应的飞行参数所属系统相关联,并进行规则的语义描述,将相应的规则作为一种知识进行描述,即提供符合实际的知识表达方式,并将该知识提供给知识获取模块9,该知识就是通过关联规则处理后自动获取的,在相应的专家系统应用过程中,可以作为一种专家经验指导故障诊断和趋势预测工作。

知识获取模块9接收规则处理模块8提供的知识,将该知识显示给用户11,用户11可以对知识进行查看。同时知识获取模块9将知识提供给知识库模块10。

知识库模块10将知识获取模块9提供的知识存储到相应的数据库中,对提供的知识可以采用统一的数据结构进行描述。该数据结构包括知识的标号、知识的前提、知识的结论以及知识的可信度信息。这些知识为利用飞行数据进行故障诊断和趋势预测的专家系统提供了专家经验。

本发明基于上述知识获取系统的一种基于关联规则的飞行数据知识获取方法,如图2所示,由下述步骤来完成:

步骤一:获取飞行数据;

飞行数据获取是进行知识获取的前提,这部分工作由飞行数据获取模块1完成。所述飞行数据包括飞行数据的基本信息,如:飞行数据所属系统的名称、飞行数据的标号、名称和类型,和飞行数据的具体数值信息,如:飞行数据的记录时间和相应的数据值。飞行数据获取模块1可以通过飞行参数记录仪的数据读取软件获取飞行数据,也可以直接通过相应格式的飞行数据文件获取飞行数据。飞行数据获取模块1获取这些飞行数据后将其存储到飞行数据库模块2中。

步骤二:选择知识获取模式;

用户根据实际的需求,通过模式选择模块3来选择需要进行获取的模式。用户11可以选择进行单维飞行数据的知识获取,也可以选择进行多维飞行数据的知识获取。

步骤三:数据准备;

数据准备主要是对步骤一中存储到飞行数据库模块2中的数据进行处理,这部分工作由数据准备模块4完成的。数据准备主要包括消除噪声、类型转换和数据分层工作。经数据准备模块4处理,使飞行数据库模块2中的数据成为关联规则挖掘可用的数据。根据步骤二中确定的知识获取模式的不同,数据准备的具体过程也有所不同。

当选择单维飞行数据的知识获取时,其数据准备主要是根据飞行数据的数据类型特性进行字符标记,将飞行数据转换为计算机便于处理的形式化符号,如用I1代表低压转子转速、I2代表高压转子转速、I3代表剩余油量、I4代表气压高度。

当选择多维飞行数据的知识获取时,其数据准备过程首先对飞行数据的数值异常点按前后均值方法进行处理,然后在此基础上根据飞行数据的数值区间进行数据分层,最后采用相应的字符标号对每一层的数据区间进行标识,便于进行后期处理。如对气压高度来说,其数值区间为(1-30000),通过数据分层后,用A1代表(0-500)、A2代表(500-5000)、A3代表(5000-10000)A4代表(10000-30000)。所述前后均值方法,为取异常值所对应点的前一个点和后一个点,然后将这两个点对应的数值求和并取平均值。

数据准备过程是进行关联规则挖掘的前提,其为关联规则挖掘提供了便于计算机处理和识别的数据基础。

步骤四:关联规则挖掘;

关联规则挖掘是进行知识获取的核心环节。这部分工作主要由任务执行模块6完成。任务执行模块6根据用户11选择的知识获取模式,通过关联规则挖掘获取隐含在飞行数据中的有用信息。

当选择单维飞行数据的知识获取时,则利用Apriori算法进行关联规则挖掘。所述Apriori算法是一种逐层搜索的迭代方法,K项集用于搜索(K+1)项集。首先找出频繁1项集的集合,该集合记作L1,L1用于找频繁2项集的集合L2,L2用于找频繁3项集的集合L3,如此递推,直到不能找到K项集,从而完成规则的挖掘工作。其中,K为大于0的整数。

在步骤二中选择单维飞行数据的知识获取时,关联规则挖掘具体通过下述步骤来实现,如图3所示:

步骤a、参数设置;

参数设置主要是对规则的最小支持度和最小置信度进行设置,是进行关联规则挖掘工作时的一个前提步骤。规则的支持度和置信度是规则兴趣度的两种度量,它们分别反映所发现的规则的有用性和确定性。如果规则同时满足条件:大于最小支持度阈值和大于最小置信度阈值,则此规则是有意义的。如果没有设定最小支持度和最小置信度,那么所有通过关联规则挖掘得到的规则都将作为有意义的规则进行存储,但实际上并不是所有得到的规则都是有意义的,这样一方面造成规则库的庞大,另一方面也会降低专家系统的工作效率。

规则的最小支持度和最小置信度由用户11根据经验进行设定,对于不同的专家系统来说规则最小支持度和最小置信度的阈值并没有统一的规定,在本发明中将最小支持度及最小置信度的阈值作为开放式接口,由用户设定,同时本发明所述系统提供了相应的默认值,最小支持度阈值一般设置为[0.2-0.5]闭区间范围内的任意值,最小置信度阈值一般设置为[0.5-0.9]闭区间范围内的任意值。

参数设置为进行规则获取提供决策条件,是开展下述步骤的前提。

步骤b、生成候选1项集;

候选1项集是Apriori算法的第一次迭代过程。基本过程是由本文涉及的飞行数据知识获取系统扫描飞行数据库模块2中所有的项,对每项出现的次数进行计数。所述的项是经过数据准备过程处理后的飞行数据,即利用形式化符号描述的便于计算机处理的飞行数据。根据参数设置的最小支持度,得到所有项计数大于最小支持度的项,形成候选1项集。候选1项集中的每一个元素的项计数都大于最小支持度。

步骤c、生成频繁项集;

频繁项集是指通过迭代找出最经常发生的各个参数之间的关联性,也就是项与项之间的关联性。频繁2项集描述两项同时发生的集合,频繁3项集描述三项同时发生的集合,依次类推。频繁项集生成是逐步迭代的过程,通过对飞行数据库模块2中各项关联性的逐次搜索,完成最终的迭代过程,形成频繁项集,频繁项集的项计数大于用户设置的最小置信度阈值。

步骤d、规则输出;

通过步骤a中参数设置的最小置信度阈值,在步骤c产生频繁项集的基础上,输出关联规则,此时所有的关联规则的置信度均大于最小置信度阈值。

步骤c产生的频繁项集就代表了最终通过关联规则挖掘得到的规则。

步骤e、规则还原与保存;

由于在数据准备过程中将数据转换为字符标识形式,因此输出的规则是字符标识形式,需要对其进行还原,即把标识还原成其所表示的对象。同时将还原后的规则进行保存,便于后期进行处理。如在数据准备过程中用I1代表低压转子转速,则在此过程中将I1替换为低压转子转速。

当选择多维飞行数据的知识获取时,则利用Mulit-Rule方法进行关联规则挖掘,Multi-Rule方法是本发明基于Apriori算法提出的一种进行多维关联规则挖掘的方法,因此也是一种逐层搜索的迭代方法。K项集用于搜索(K+1)项集。首先找出频繁1项集的集合,该集合记作L1,L1用于找频繁2项集的集合L2,L2用于找频繁3项集的集合L3,如此递推,直到不能找到K项集,从而完成规则的挖掘工作,因此Multi_Rule算法的很多定义都和Apriori算法同样或者类似,如最小支持度,最小置信度,但其在数据准备方面需要进行数据分层。其中,K为大于0的整数。

在步骤二中选择多维飞行数据的知识获取时,利用Mulit-Rule方法进行关联规则挖掘具体通过下述步骤来实现,如图4所示:

步骤A、数据表生成;

将步骤三中经数据分层的飞行数据信息,即每种飞行数据的分层信息和标号重新存入到数据库中,并形成数据表,为后期处理提供依据。所述形成的数据表的内容主要包括飞行数据所属系统的名称、飞行数据的标号、飞行数据的名称和类型、分层的标识符号以及对应的区间范围。

步骤B、参数设置;

参数设置主要是对规则的最小支持度和最小置信度进行设置。参数设置是进行关联规则挖掘工作时的一个前提步骤。规则的支持度和置信度是规则兴趣度的两种度量。它们分别反映所发现的规则的有用性和确定性。如果关联规则同时满足最小支持度阈值和最小置信度阈值,则此规则是有意义的。

最小支持度阈值和最小置信度阈值的设置同对单维飞行数据进行关联规则挖掘的步骤a中所述。本发明所述系统提供了相应的默认值,最小支持度阈值一般设置为[0.2-0.5]闭区间范围内的任意值,最小置信度阈值一般设置为[0.5-0.9]闭区间范围内的任意值。

参数设置为进行规则获取提供决策条件,是开展下述步骤的前提。

步骤C、生成候选1谓词集;

谓词是多维飞行数据库中的每个属性,如一个飞行数据库中包括气压高度、无线电高度、低压转子转速属性,则每一个属性即代表一个谓词。也可以把不同的谓词称作维,这样的话单维就仅仅涉及到一个谓词,即只有一个属性。而多维就涉及到多个谓词,即多维属性。

候选1谓词集是Multi-Rule算法的第一次迭代过程。基本过程是扫描飞行数据库模块2中所有的维,在本过程中维便是经步骤三处理后的利用形式化符号描述的便于计算机处理的飞行数据,对每维出现的次数进行计数。根据参数设置的最小支持度,得到所有满足计数大于最小支持度的集合,形成候选1谓词集。候选1谓词集中的每维计数都大于最小支持度。

步骤D、生成候选K谓词集;

生成候选K谓词集是逐步迭代的过程,通过对数据库中各谓词关联性的逐次搜索,完成最终的迭代过程,形成候选K谓词集,K代表多维谓词的最大值。候选K谓词集的维计数都大于用户设置的最小置信度阈值。

步骤E、规则输出;

通过步骤B设置的最小置信度阈值,在步骤D产生候选K谓词集的基础上,输出关联规则。对步骤C中得到的满足最小支持度要求的集合,步骤D在此基础上进行进一步限定,得到满足最小置信度要求的集合,进而得到最终的规则集合。步骤D中形成的候选K谓词集就代表了最终通过关联规则挖掘得到的规则。

步骤F、规则还原与保存;

由于在数据准备过程中将飞行数据的数值区间进行数据分层,并采用相应的字符标号对每一层的数据区间进行标识,因此输出的规则是字符标识形式,需要对其进行还原。本步骤把字符标识还原成其所表示的数据对象,同时将还原后的规则进行保存,便于后期进行处理。如在数据准备过程中利用A1代表气压高度在0-500之间,那么在此过程中将A替换为0-500。

步骤五:规则输出;

规则输出由规则输出模块7完成,规则输出模块7将关联规则挖掘的规则通过人机界面显示给用户11,便于用户进行分析和判断。

步骤六:规则处理;

规则处理主要是对冗余规则进行处理,同时对一些相互包含的规则进行合并。这部分工作主要由规则处理模块8完成。规则处理模块8对规则输出模块7提供的规则进行处理后,将处理后的规则作为知识提供给知识获取模块9。

规则处理模块8对规则输出模块7提供的规则进行具体处理的过程由下述步骤来完成,如图5所示:

步骤6.1:导入规则;

规则处理模块8接收步骤五输出的单维飞行数据知识获取或多维飞行数据知识获取得到的规则。

步骤6.2冗余规则处理;

冗余规则会降低系统的效率,造成知识库不必要的增大,同时使知识库的维护难度加大。本发明飞行数据知识获取方法进行的冗余规则处理包括以下几种:

I:等价的冗余规则;

等价的冗余规则是指一条规则的条件与结论和另一条规则的条件与结论完全等价。如:

R1:if A and B then C;

R2:if B and A then C;

上述描述中,R1、R2分别代表一条规则,A、B代表规则的前提,C代表规则的结论。规则R1指由前提A和B得到结论C,规则R2指由前提B和A也得到结论C。

如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除其中的任意一条规则。

II:“与”条件包含的冗余规则;

“与”条件包含的冗余规则是指一条规则“与”条件的约束包含另一条规则“与”条件的约束,但它们的结论是相同的。如:

R1:if A and B then C;

R2:if A      then C;

上述描述中,R1、R2分别代表一条规则,A、B代表规则的前提,C代表规则的结论。规则R1指由前提A和B得到结论C,规则R2指由前提A得到结论C。

如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除规则R1。

III:“或”条件包含的冗余规则;

“或”条件包含的冗余规则是指一条规则“或”条件的约束包含另一条规则“或”条件的约束,但它们的结论是相同的。如:

R1:if A OR B then C;

R2:if A     then C;

上述描述中,R1、R2分别代表一条规则,A、B代表规则的前提,C代表规则的结论。规则R1指由前提A或者B得到结论C,规则R2指由前提A得到结论C。

如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除规则R2。

IV:“与”结果包含的冗余规则;

“与”结果包含的冗余规则是这两个规则的条件是相同的,但是其中一条规则的结果“与”条件个数多于另一规则的结果“与”条件个数。如:

R1:if A then B and C and D;

R2:if A then B and C;

上述描述中,R1、R2分别代表一条规则,A代表规则的前提,B、C、D代表规则的结论。规则R1指由前提A得到结论B和C和D,规则R2指由前提A得到结论B和C。

如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除规则R2。

V:“或”结果包含的冗余规则。

“或”结果包含的冗余规则是两个规则的条件数是相等的,但是其中一条规则的结果“或”条件多于另一条规则的结果“或”条件个数。如:

R1:if A then B or C or D;

R2:if A then B or C;

上述描述中,R1、R2分别代表一条规则,A代表规则的前提,B、C和D代表规则的结论。规则R1指由前提A得到结论B或C或D,规则R2指由前提A得到结论B或C。

如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除R2。

步骤6.3:规则合并;

规则合并主要是对相互包含的规则进行处理。具体来说若存在两条规则,它们条件相同、结论包含或者条件包含、结论相同,则可把这两条规则进行合并。规则合并分为如下情况的规则:

i:条件相同,结论不同的情况;

R1:A and B=>C

R2:A and B=>D

上述描述中,R1、R2分别代表一条规则,A、B代表规则的前提,C和D代表规则的结论。规则R1指由前提A和B可得到结论C,规则R2指由前提A和B可得到结论D。

那么如果通过导入规则获取的两条规则满足这种情况,那么规则合并会将规则R1和R2删除,并形成一条新的规则:

R3:A and B=>C or D;

上述描述中,R3代表一条规则,A、B代表规则的前提,C和D代表规则的结论。规R3指由前提A和B可得到结论C或者D。

ii:条件不同,结论相同的情况;

R1:A=>B and C

R2:D=>B and C

上述描述中,R1、R2分别代表一条规则,A、D代表规则的前提,B和C代表规则的结论。规则R1指由前提A可得到结论B和C,规则R2指由前提D可得到结论B和C。

那么如果通过导入规则获取的两条规则满足这种情况,那么规则合并会将规则R1和R2删除,并形成一条新的规则:

R3:A or D=>B and C

上述描述中,R3代表一条规则,A、D代表规则的前提,B和C代表规则的结论。规则R1指由前提A或者D可得到结论B和C。

步骤6.4:规则保存;

将经过上述步骤6.1~步骤6.3处理后形成的规则存储到知识库模块10中。

步骤七:知识获取;

知识获取是系统的最后一个环节,主要由知识获取模块9完成。知识获取得到的是处理后的最简的、同时能体现数据特征的规则,并将这些规则作为知识存储到知识库模块10中,便于后期的研究和使用。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号