法律状态公告日
法律状态信息
法律状态
2017-10-24
授权
授权
2015-03-25
实质审查的生效 IPC(主分类):G06F9/44 申请日:20141129
实质审查的生效
2015-02-18
公开
公开
技术领域
计算机软件领域,具体涉及大型飞机综合化模块化航空电子系统处理 平台中的多级故障管理方法。
背景技术
航电系统至今已经历了独立式、联合式、综合化和高度综合化的发展 历程。从各分系统相互独立到采用集中控制、分布处理的层次型结构,以 及第三代的综合化航电,将系统按功能分成4个区:传感器区、数字信号 处理区、任务处理区和飞机管理区,直至第四代的高度综合化、模块化。 可见,航电系统结构越来越复杂,综合化程度越来越高,也显现出故障密 集、多类等特点。这种高度模块化、综合化要求对航空综合化平台提出高 安全、高可靠要求,因此,对发生的错误进行分级定义、分类设置恢复策 略等,可使飞机综合处理平台及时进行错误诊断、分级派遣和分级恢复, 从而有效阻止系统故障蔓延,实现对系统状态的监控、接管。
发明内容
为了解决背景技术中的问题,本发明提出了可实现故障自动收集、过 滤、分级派发,以及按照运行不同阶段针对故障级别配置故障处理策略及 恢复动作的大型飞机综合处理平台中的多级故障管理方法。
本发明的具体技术方案:
一种大型飞机综合处理平台中的多级故障管理方法,其特征在于,包 括以下步骤:
1)统计系统可能发生的所有故障,按照故障信息编码规则进行编码, 建立故障分类表;
所述故障分类表定义的信息包括故障名称、故障编码、故障描述、故 障级别、故障可能发生的原因、故障处置建议;
2)根据故障分类表中定义的信息将所有故障在核心OS层配置健康监 控表,在分区OS层定义信号处理程序;
所述健康监控表包括系统健康监控表、模块健康监控表以及分区健康 监控表;
所述系统健康监控表由故障代码、系统状态级别和派遣级别组成;系 统根据故障代码和故障发生时的系统状态查系统健康监控表,获得故障的 派遣级别,据此级别派遣到不同的健康监控任务;
所述模块健康监控表是对派遣到模块级的故障进行故障分析后进行故 障恢复的依据;
所述分区健康监控表主要是针对派遣到分区级的故障进行故障的分析 后进行故障恢复的依据,每个分区有一个独立的分区健康监控表;
所述信号处理程序的功能是针对派遣到进程级的故障进行故障分析后 进入处理程序进行故障恢复,每个分区有一个独立的信号处理程序;
3)系统软件、应用软件运行过程的故障处理;
3.1)应用程序或者系统程序调用操作系统服务将错误事件注入核心OS 层中;
3.2)查看系统健康监控表对错误事件进行派遣;
若系统健康监控表认定错误事件为进程级错误,则将错误事件通过信 号机制发送给分区OS层的信号处理程序;
若系统健康监控表认定错误事件为模块级故障,则将错误事件发送给 模块健康监控任务;
若系统健康监控表认定错误事件为分区级故障,则将错误事件发送给 分区健康监控任务;
3.3)针对不同级别的故障进行分析、恢复;
当分区OS层的信号处理程序接收到进程级故障时,根据故障分类表中 的故障处置建议进入用户错误程序对故障进行分析、恢复;
当模块健康监控任务接收到模块级故障时,查找模块健康监控表,根 据错误处理程序对该模块级故障进行恢复;
当分区健康监控任务接收到分区级故障时,查找分区健康监控表,根 据错误处理程序对该分区级故障进行恢复。
上述方法执行步骤3)时,收集到的模块级无法恢复的故障时,则核心 OS层将故障上报至系统级中央维护软件处理。
本发明的优点在于:
1、本发明采用对飞行故障进行进程级、分区级和模块级多级处理的方 式解决了平板方式下故障不分级别、不可自动恢复问题。
2、本发明提供系统自动实时的检测和排除故障、恢复系统正常运行的 能力,能够根据资源状态,提供系统重构依据。
附图说明
图1故障编码定义图;
图2分区OS健康监控结构示意图;
图3模块内部三级故障处理过程示意图。
具体实施方式
下面结合大型飞机综合处理平台的结构对本发明的方法进行描述:
大型飞机综合处理平台由左右两台综合处理机IPC组成。每台综合处 理机IPC由1个集成机架、7个LRM模块组成。IPC内部模块之间、外部设 备之间的互连通信,采用统一的AFDX通信网络(双余度结构),其基本配 置及系统结构:
a.1个集成机架(含AFDX互连底板),可提供9个LRM模块插槽,其中
2个为功能扩展插槽;
b.2块CPM(通用处理模块),其CPU采用PPC G4处理器;
c.1块MMM(大容量存储模块),其存储器容量不低于100GB;
d.2块ASM(交换机模块),每块ASM模块可提供独立的24个AFDX端 口;每个端口可提供双余度数据传输结构和变压器耦合方式,其数据传输 速率为100mbps;
2块PSM(电源模块),每个PSM可接收2路28V直流电源输入,提供 独立的10路电源输出。
本发明的技术方案具体实施步骤是:
步骤1)统计发生的所有故障,按照故障信息编码规则进行编码,建立 故障分类表;故障分类表定义的信息包括故障名称、故障编码、故障描述、 故障级别、故障可能发生的原因、故障处置建议;
具体的说,大型飞机复杂综合处理平台IPC系统中,各LRM均具设计 自检测功能,通过自检测手段实施平台硬件资源功能测试,将故障隔离定 位到模块,并可将检测到的模块内部故障报告给系统管理器(系统管理器 驻留在MMM模块)。如图1所示,每个故障包括如下信息:
a.故障标识号(ID码,系统统一编码),32位字长,包括平台号(IPC1、 IPC2)、LRM模块号(如1、2或A、B等),以及故障码(如01、12、23等), 其编码说明详见表1,其中故障码16位每位表示LRM模块的一个工作单元 状态(0-表示无故障,1-表示故障);
b.故障描述,以最短字数表达本次故障;
c.故障发生时间。
由于大型飞机大型飞机综合处理平台复杂,安全级别要求高,因此,系 统配置有2台同构型工作单元--综合处理平台IPC,故障分类表相应包括两 部分,一部分为工作单元代码表格式详见表1。另一部分为工作单元故障信 息清单详见表2。
表1 工作单元代码表
表2 工作单元故障分类表
设备检测结果分布存储,记录在本地非易失存储器(NVRAM)中,确保 其掉电不丢失,并由应用程序读取及处理。
设备在检测到故障发生或故障消失时,按照综合航空电子系统的故障编 码定义,自动向中央维护系统报告。
步骤2)根据故障分类表中定义的信息将所有故障在核心OS层配置健 康监控表,在分区OS层定义信号处理程序;
其中,健康监控表包括系统健康监控表、模块健康监控表以及分区健 康监控表;
具体的说,系统健康监控表由故障代码、系统状态级别和派遣级别组 成;系统根据故障代码和故障发生时的系统状态查系统健康监控表,获得 故障的派遣级别,据此级别派遣到不同的健康监控任务;
具体的说,模块健康监控表是对派遣到模块级的故障进行故障的分析 后进行故障恢复的依据;
具体的说,分区健康监控表主要是针对派遣到分区级的故障进行故障 分析后进行故障恢复的依据,每个分区有一个独立的分区健康监控表;
具体的说,信号处理程序的功能是针对派遣到进程级的故障进行故障 分析后进入处理程序进行故障恢复,每个分区有一个独立的信号处理程序; 图2给出了分区操作系统中健康监控体系结构示意。图3给出了模块内部 以表驱动方式实现系统故障收集、过滤、派发过程示意,结合附图2和附 图3对系统软件、应用软件运行过程的故障处理进行描述:
步骤3)系统软件、应用软件运行过程的故障处理;
3.1)应用程序或者系统程序调用操作系统服务,将发生的错误事件注 入核心OS中;
3.2)操作系统通过查找系统健康监控表对错误事件进行派遣;
若系统健康监控表认定错误事件为进程级错误,则通过操作系统信号 机制将错误事件发送给分区OS层的信号处理程序;
若系统健康监控表认定错误事件为模块级故障,则将错误事件发送给 模块健康监控任务;
若系统健康监控表认定错误事件为分区级故障,则将错误事件发送给 分区健康监控任务;
3.3)针对不同级别的故障进行分析、恢复;
当分区OS的信号处理程序接收到信号时,根据用户事先挂接的错误处 理程序对进程级故障进行分析、恢复;
当模块健康监控任务接收到模块级故障时,查找模块健康监控表,根 据配置的错误处理程序对该模块级故障进行恢复;
当分区健康监控任务接收到分区级故障时,查找分区健康监控表,根 据配置的错误处理程序对该分区级故障进行恢复。
此处需要说明的是:模块健康监控任务运行在核心操作系统中,并且 作为核心操作系统中仅有的一个最高优先级的任务运行,可以抢占任何分 区及系统任务的时间。
分区健康监控任务作为分区操作系统中一个独立的任务运行,它的优 先级高于所属分区其它所有任务优先级,但只能占用本分区时间。
进程健康监控处理进程作为分区操作系统中一个特殊的进程运行,它 的优先级高于分区内其它进程。
针对模块级无法处理的故障,上报至系统级中央维护软件处理。即:
在大型飞机复杂综合处理平台中各模块或综合处理机工作单元状态发 生改变时,实时记录故障发生或消失的时间,按照综合航空电子系统的故 障编码定义(由系统统一分配),自动向中央维护系统报告,为系统重构决 策提供辅助信息,提高系统故障监控及处理能力。
系统管理器驻留在MMM模块,系统包括2个独立的大容量存储器模块 (MMM),分布于2个不同的综合处理平台中,承担中央系统管理器功能。2 个MMM模块以热备份方式工作,其中一个故障时,另一个接替。备份切换 管理由飞行员完成。因此,综合处理平台提供系统级故障告警信息:
a.MMM1故障(综合处理平台1中的MMM故障);
b.MMM2故障(综合处理平台2中的MMM故障)。
机译: 一种宽带综合业务数字电信网络中业务流量的管理方法及实现该方法的网络
机译: 一种宽带综合业务数字电信网络中业务流量的管理方法及实现该方法的网络
机译: 一种宽带综合业务数字电信网络中业务流量的管理方法及实现该方法的网络