首页> 中国专利> 一种多核处理器应用系统及提高其可靠性的方法

一种多核处理器应用系统及提高其可靠性的方法

摘要

本发明属于机载计算机自主可控研制领域,针对机载系统计算机的自主可控、高安全、高可靠性研制要求,以及目前双核处理器在航空领域的探索使用过程中可能存在的系统可靠性风险问题,提出了一种利用双核处理器的双核特性构建多余度容错机载计算机系统地方法,能够进行有效的数据交换、余度管理,从应用设计角度规避双核处理器的应用系统的可靠性风险,构建高度自主可控、高安全、高可靠性的机载计算机,产生巨大的社会和经济效益。

著录项

  • 公开/公告号CN113312094A

    专利类型发明专利

  • 公开/公告日2021-08-27

    原文格式PDF

  • 申请/专利号CN202110241126.8

  • 发明设计人 吴蓬勃;梁争争;杨敬宝;许少尉;

    申请日2021-03-04

  • 分类号G06F9/4401(20180101);G06F11/22(20060101);G06F11/30(20060101);

  • 代理机构11008 中国航空专利中心;

  • 代理人秦媛媛

  • 地址 710000 陕西省西安市锦业二路15号

  • 入库时间 2023-06-19 12:22:51

说明书

技术领域

本发明属于机载计算机自主可控研制领域,尤其涉及一种多核处理器应用系统及提高其可靠性的方法,通过应用措施改进,提高多核处理器的应用系统可靠性,降低应用风险的应用设计方法。

背景技术

随着机载系统对于计算机的自主可控、高性能、高安全、高可靠性研制要求的不断提高与自主可控处理器研制需要长期的技术摸索与积累矛盾的逐渐凸显,特别是处理器核的研制作为重中之重,更是难中之难!

目前,机载领域多核处理器处于探索试用期,可能会存在可靠性、安全性风险问题;急需要通过各种手段进行综合处理相关问题,提升应用过程中系统的可靠性、安全性。

发明内容

本发明提出了一种多核处理器应用系统及提高其可靠性的方法,利用多核处理器的多核特性构建多余度容错机载计算机系统的方法,能够进行有效的数据交换、余度管理,从应用设计角度规避多核(含双核)处理器的应用系统可靠性风险,构建高度自主可控、高安全、高可靠性的机载计算机,产生巨大的社会和经济效益。

本发明的技术方案:

技术方案一:

一种多核处理器应用系统,所述系统包含:多个处理器,每个处理器为多核处理器;将多个处理器中的任意一个核作为余度管理处理核;

其他核中的每个核的输入端连接信号输入模块,输出端连接信号输出模块,形成一个对应的余度通道;其他核为除余度管理处理核之外的多个处理器中的所有核;

每个余度通道的输入数据端、输出数据端以及核运行状态输出端分别与余度管理处理核的信号采集端连接。

本发明技术方案一的特点和进一步的改进为:

(1)信号输入模块、信号输出模块和每个核之间通过底板总线进行连接。

(2)各个余度通道之间通过中断方式进行数据同步,各个余度通道之间通过CCDL交叉通信进行数据交换和数据共享。

技术方案二:

一种提高多核处理器应用系统可靠性的方法,所述方法应用于技术方案一所述的应用系统,所述方法包括:

S1,余度管理处理核分别采集每个余度通道的输入数据、输出数据以及核运行状态;

S2,根据每个余度通道的输入数据、输出数据以及核运行状态进行余度管理。

本发明技术方案的特点和进一步的改进为:

(1)S2进行余度管理,具体为:

余度管理处理核获取每个余度通道的输入数据,对每个余度通道的输入数据进行对比判别,如果每个余度通道的输入数据一致,则所有余度通道的输入通道正常;

如果某个余度通道的输入数据与其他余度通道的输入数据在连续N个周期都不一致,则余度管理处理核判定该余度通道出现输出故障,并切断该余度通道的所有数据交互;

如果某个余度通道的输入数据与其他余度通道的输入数据在小于连续N个周期不一致,则余度管理处理核判定该余度通道出现输入故障,并将其他余度通道的输入数据共享给该故障余度通道的核。

(2)S2进行余度管理,具体为:

余度管理处理核获取每个余度通道的输出数据,对每个余度通道的输出数据进行对比判别,如果每个余度通道的输出数据一致,则所有余度通道的输出通道正常;

如果某个余度通道的输出数据与其他余度通道的输出数据在连续N个周期都不一致,则余度管理处理核判定该余度通道出现输出故障,并切断该余度通道的所有数据交互;

如果某个余度通道的输出数据与其他余度通道的输出数据在小于连续N个周期不一致,则余度管理处理核判定该余度通道出现输出故障,并将其他余度通道的输出数据共享给该故障余度通道的核。

(3)S2进行余度管理,具体为:

余度管理处理核获取每个余度通道的核运行状态,对每个余度通道的核运行状态进行对比判别,如果每个余度通道的核运行状态一致,则所有余度通道的核运行状态正常;

如果某个余度通道的核运行状态与其他余度通道的核运行状态不一致,则余度管理处理核判定该余度通道出现运行状态故障,并切断该余度通道的所有数据交互。

(4)所述方法还包括:

每个余度通道的核进行同步自检和C C D L故障自检;

当同步自检出同步故障时,设置故障字,保留该余度通道的正常数据交互;

当C C D L故障自检出C C D L故障时,切断该余度通道。

本发明简单易用、效果显著,通过利用双核处理器的双核特性构建多余度容错机载计算机系统的方法,能够进行有效的数据交换、余度管理,从应用设计角度规避双核处理器的应用系统可靠性风险,构建高度自主可控、高安全、高可靠性的机载计算机,产生巨大的社会和经济效益。

附图说明

图1为本发明实施例提供的一种多核处理器应用系统的结构示意图。

具体实施方式

现有处理器应用系统为承担重要的处理功能,对系统处理的正确性、可靠性要求极高的单片多核处理系统;本发明实施例提供的处理器应用系统为由信号输入单元、多核处理单元、信号输出单元三部分构成的单通道或多通道处理系统,且系统具有自检功能,能够通过BIT(上电BIT、周期BIT)等自检方式实现通道的自检。

实施例一:

本发明实施例提供一种多核处理器应用系统及提高其可靠性的方法,该方法可以采用两片或多片多核处理器以提高多核处理器应用系统的可靠性,下面以两片两核处理器为例描述进行技术方案。

采用两片处理器中的三个核构建三个相似余度系统,第四核用于进行余度管理;选用一片处理器中的两个核和另一片处理器中的一个核共三个处理核并通过总线扩展连接信号输入、输出电路模块构建完整的三个相似余度系统;

选用构建三余度的处理器核以外的相同的第四个处理器核,作为专门的余度管理处理核;各通道工作特性一致,但由于器件的差异性,各通道在工作时并不能保证完全工作在同一时刻,会出现工作点上的微小时间差,导致各通道工作状态的差异,从而使系统状态混乱。因此,通过通道间核之间发中断采用握手-应答的同步机制,使各通道严格按照规定的时序点工作,使各通道的数据具有一致性。

运行BIT软件进行自检,设置数据的输入、输出、以及处理器核运行状态为故障监测点进行故障监测,通过运行相应的软件进行余度表决管理;整体结构如图1所示。

具体的,对由信号输入单元、多核处理单元、信号输出单元三部分构成的单通道或多通道处理系统进行多余度系统重建,通过一片或多片多核处理器的处理核及其外围信号输入单元、信号输出单元进行处理通道数量扩展,构成多片多核多余度处理系统,从而提高原多核处理器应用系统的可靠性。

实施例二:

本发明实施例还提供一种提高多核处理器应用系统可靠性的系统构架方法,具体为:

首先:采用多片多核处理器以构建多个相似余度通道;

第二:选用一片多核处理处理器中的某一个核作为余度管理核,其余的核作为余度通道处理核;

第三:通过系统总线链接扩展多片多核处理器的输入、输出单元,以形成对应的相似余度通道;

第四:通道间通过核间、芯片间的中断进行余度宽延时同步;

第五:各余度通道进行同步自检和CCDL故障自检,核间通过CCDL交叉通道进行信息交换共享;

第六:设置余度通道信号的输入、输出、以及处理器核的运行状态作为通道故障监测点;

第七:负责余度管理的处理器核运行相应的余度表决算法进行余度表决和余度通道控制。

进一步的,采用多核构建相似多余度容错系统以提高应用系统的可靠性。

进一步的,针对双核或多核处理器,是指采用多片完全相同的多核处理器。

第二步中,其余的核是指余度管理核所在处理器内的除余度管理核以外的处理核以及其余处理器内部的处理核。

第三步中,通过系统总线链接扩展多片多核处理器的输入、输出单元中的系统总线可以采用网络总线、PCI或PCIE总线作为系统总线,各余度通道的核进行同步自检和CCDL故障自检。

第四步中,所述通道之间通过各通道间的串行总线进行CCDL信号数据交换,CCDL数据交换含各通道采样输入的信号数据,上一周期设计出的输出数据,通道及系统故障诊断数据。

第五步中,所述各余度通道的核进行同步自检和CCDL故障自检,当自检出同步故障时,只设置故障字,保留该余度通道的正常数据交互。

第五步中,所述通道之间通过共享进行信号数据交换,通过CCDL交叉通信方式进行数据交换共享,当检测出CCDL故障时,切断该余度通道。

第六步中,设置三个故障监测点,是指设置数据的输入、输出、以及处理器核运行状态为故障监测点,由余度管理核分别控制对每个余度通道的信号输入、输出信号以及核运行状态进行余度通道管理。

第七步中,所述余度表决算法是指采用以下策略进行余度表决:

a)采用少数服从多数的方法进行余度表决,用表决后的数据作为各通道的共用计算数据,当连续出现5个周期的采样故障时,置该通道故障;

b)通道故障判断采用设置阈值超出阈值为故障通道;

c)采用去掉最大、最小值,其他值求平均值作为数据正误判据;如权利要求3所述的一种提高多核处理器应用系统可靠性的方法,其特征在于所述第七条所述余度表决算法和余度通道控制中的余度通道控制是指:屏蔽错误通道、降低余度维度和修整错误通道三种:

d)屏蔽错误通道:即将错误的余度通道结果数据作废;

e)降低余度维度:是指通过屏蔽错误通道后,由剩余的通道构建成新的余度维度;

f)修整错误通道:即对每一个余度通道中的输入数据、处理状态、输出数据进行故障判断,若某一环节连续5个周期判断有问题,可以采用其他通道相应的数据进行覆盖以进行通道修复;

g)故障探测采用BIT自检进行输入通道、处理核、CCDL等检查,故障判断采用5个周期内延迟的判定!

实施例三:

采用多核处理器如FT1500A、FT2000HK处理器进行实施;信号输入、输出模块和处理器模块之间通过底板总线(PCI、千兆以太等)进行连接,便于进行CCDL(通道交叉)数据交换;

设置数据的输入、输出、以及处理器核运行状态(同步)为故障监测点进行故障监测,通过运行相应的软件进行余度表决管理,保证产品某一通道在故障时的正常工作。余度管理包括输入电路故障管理、同步故障管理、C C D L故障管理、通道故障管理等策略,管理策略需根据产品的故障模式进行分析。

可采用软件表决方式,对3个通道的每一个信号进行2/3表决,配合运行B I T软件(自检程序),屏蔽故障信号,用表决后的数据作为各通道的共用计算数据。当某个通道连续出现5个周期的采样故障时,置该通道故障。

通过输入表决即可判定该通道的输入电路是否故障。当该通道的输入路故障数量>5个时,认为该通道输入组件故障,设定该通道输人故障字,系统切掉该通道,变为两余度。如果输人通路故障数量少于5个,则只设定输入故障字,系统不切掉该通道,继续保持为三余度状态。

同步管理策略要对各种同步故障模式进行处理。单个通道信号故障只设置故障字,不对故障通道进行切换;而通道同步故障则要切掉该故障通道,系统降级。

C C D L故障模式包括通道的单个C C D L故障、通道C C D L故障等模式,只要发生C C D L故障,即切掉该故障通道,使系统降级,以保证数据的正确性,当系统变为单余度时,不切掉该通道,使系统保持基本功能。

当发生一个通道故障时,通过监控电路可以切掉该通道,系统变为两余度,这时两个通道间继续进行同步和C C D L数据交换,但软件不进行数据表决,而是直接使用本通道的输入采样数据,输出表决电路直接使用当前高优先级的通道进行输出。当发生两个通道故障时,这两个通道被切掉,系统直接使用剩下的通道执行任务。

本发明简单易用、效果显著,通过利用双核处理器的双核特性构建多余度容错机载计算机系统的方法,能够进行有效的数据交换、余度管理,从应用设计角度规避双核处理器的应用系统可靠性风险,构建高度自主可控、高安全、高可靠性的机载计算机,产生巨大的社会和经济效益。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号