首页> 外文OA文献 >Fault management techniques for systems with SRAM-based FPGAs
【2h】

Fault management techniques for systems with SRAM-based FPGAs

机译:带有基于SRAM的FPGA的系统的故障管理技术

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

Las Field-Programmable Gate Arrays (FPGAs) SRAM se construyen sobre una memoria de configuración de tecnología RAM Estática (SRAM). Presentan múltiples características que las hacen muy interesantes para diseñar sistemas empotrados complejos. En primer lugar presentan un coste no-recurrente de ingeniería (NRE) bajo, ya que los elementos lógicos y de enrutado están pre-implementados (el diseño de usuario define su conexionado). También, a diferencia de otras tecnologías de FPGA, pueden ser reconfiguradas (incluso en campo) un número ilimitado de veces. Es más, las FPGAs SRAM de Xilinx soportan Reconfiguración Parcial Dinámica (DPR), la cual permite reconfigurar la FPGA sin interrumpir la aplicación. Finalmente, presentan una alta densidad de lógica, una alta capacidad de procesamiento y un rico juego de macro-bloques. Sin embargo, un inconveniente de esta tecnología es su susceptibilidad a la radiación ionizante, la cual aumenta con el grado de integración (geometrías más pequeñas, menores tensiones y mayores frecuencias). Esta es una precupación de primer nivel para aplicaciones en entornos altamente radiativos y con requisitos de alta confiabilidad. Este fenómeno conlleva una degradación a largo plazo y también puede inducir fallos instantáneos, los cuales pueden ser reversibles o producir daños irreversibles. En las FPGAs SRAM, los fallos inducidos por radiación pueden aparecer en en dos capas de arquitectura diferentes, que están físicamente superpuestas en el dado de silicio. La Capa de Aplicación (o A-Layer) contiene el hardware definido por el usuario, y la Capa de Configuración contiene la memoria de configuración y la circuitería de soporte. Los fallos en cualquiera de estas capas pueden hacer fracasar el sistema, lo cual puede ser ás o menos tolerable dependiendo de los requisitos de confiabilidad del sistema. En el caso general, estos fallos deben gestionados de alguna manera. Esta tesis trata sobre la gestión de fallos en FPGAs SRAM a nivel de sistema, en el contexto de sistemas empotrados autónomos y confiables operando en un entorno radiativo. La tesis se centra principalmente en aplicaciones espaciales, pero los mismos principios pueden aplicarse a aplicaciones terrenas. Las principales diferencias entre ambas son el nivel de radiación y la posibilidad de mantenimiento. Las diferentes técnicas para la gestión de fallos en A-Layer y C-Layer son clasificados, y sus implicaciones en la confiabilidad del sistema son analizados. Se proponen varias arquitecturas tanto para Gestores de Fallos de una capa como de doble-capa. Para estos últimos se propone una arquitectura novedosa, flexible y versátil. Gestiona las dos capas concurrentemente de manera coordinada, y permite equilibrar el nivel de redundancia y la confiabilidad. Con el objeto de validar técnicas de gestión de fallos dinámicas, se desarrollan dos diferentes soluciones. La primera es un entorno de simulación para Gestores de Fallos de C-Layer, basado en SystemC como lenguaje de modelado y como simulador basado en eventos. Este entorno y su metodología asociada permite explorar el espacio de diseño del Gestor de Fallos, desacoplando su diseño del desarrollo de la FPGA objetivo. El entorno incluye modelos tanto para la C-Layer de la FPGA como para el Gestor de Fallos, los cuales pueden interactuar a diferentes niveles de abstracción (a nivel de configuration frames y a nivel físico JTAG o SelectMAP). El entorno es configurable, escalable y versátil, e incluye capacidades de inyección de fallos. Los resultados de simulación para algunos escenarios son presentados y comentados. La segunda es una plataforma de validación para Gestores de Fallos de FPGAs Xilinx Virtex. La plataforma hardware aloja tres Módulos de FPGA Xilinx Virtex-4 FX12 y dos Módulos de Unidad de Microcontrolador (MCUs) de 32-bits de propósito general. Los Módulos MCU permiten prototipar Gestores de Fallos de C-Layer y A-Layer basados en software. Cada Módulo FPGA implementa un enlace de A-Layer Ethernet (a través de un switch Ethernet) con uno de los Módulos MCU, y un enlace de C-Layer JTAG con el otro. Además, ambos Módulos MCU intercambian comandos y datos a través de un enlace interno tipo UART. Al igual que para el entorno de simulación, se incluyen capacidades de inyección de fallos. Los resultados de pruebas para algunos escenarios son también presentados y comentados. En resumen, esta tesis cubre el proceso completo desde la descripción de los fallos FPGAs SRAM inducidos por radiación, pasando por la identificación y clasificación de técnicas de gestión de fallos, y por la propuesta de arquitecturas de Gestores de Fallos, para finalmente validarlas por simulación y pruebas. El trabajo futuro está relacionado sobre todo con la implementación de Gestores de Fallos de Sistema endurecidos para radiación. ABSTRACT SRAM-based Field-Programmable Gate Arrays (FPGAs) are built on Static RAM (SRAM) technology configuration memory. They present a number of features that make them very convenient for building complex embedded systems. First of all, they benefit from low Non-Recurrent Engineering (NRE) costs, as the logic and routing elements are pre-implemented (user design defines their connection). Also, as opposed to other FPGA technologies, they can be reconfigured (even in the field) an unlimited number of times. Moreover, Xilinx SRAM-based FPGAs feature Dynamic Partial Reconfiguration (DPR), which allows to partially reconfigure the FPGA without disrupting de application. Finally, they feature a high logic density, high processing capability and a rich set of hard macros. However, one limitation of this technology is its susceptibility to ionizing radiation, which increases with technology scaling (smaller geometries, lower voltages and higher frequencies). This is a first order concern for applications in harsh radiation environments and requiring high dependability. Ionizing radiation leads to long term degradation as well as instantaneous faults, which can in turn be reversible or produce irreversible damage. In SRAM-based FPGAs, radiation-induced faults can appear at two architectural layers, which are physically overlaid on the silicon die. The Application Layer (or A-Layer) contains the user-defined hardware, and the Configuration Layer (or C-Layer) contains the (volatile) configuration memory and its support circuitry. Faults at either layers can imply a system failure, which may be more ore less tolerated depending on the dependability requirements. In the general case, such faults must be managed in some way. This thesis is about managing SRAM-based FPGA faults at system level, in the context of autonomous and dependable embedded systems operating in a radiative environment. The focus is mainly on space applications, but the same principles can be applied to ground applications. The main differences between them are the radiation level and the possibility for maintenance. The different techniques for A-Layer and C-Layer fault management are classified and their implications in system dependability are assessed. Several architectures are proposed, both for single-layer and dual-layer Fault Managers. For the latter, a novel, flexible and versatile architecture is proposed. It manages both layers concurrently in a coordinated way, and allows balancing redundancy level and dependability. For the purpose of validating dynamic fault management techniques, two different solutions are developed. The first one is a simulation framework for C-Layer Fault Managers, based on SystemC as modeling language and event-driven simulator. This framework and its associated methodology allows exploring the Fault Manager design space, decoupling its design from the target FPGA development. The framework includes models for both the FPGA C-Layer and for the Fault Manager, which can interact at different abstraction levels (at configuration frame level and at JTAG or SelectMAP physical level). The framework is configurable, scalable and versatile, and includes fault injection capabilities. Simulation results for some scenarios are presented and discussed. The second one is a validation platform for Xilinx Virtex FPGA Fault Managers. The platform hosts three Xilinx Virtex-4 FX12 FPGA Modules and two general-purpose 32-bit Microcontroller Unit (MCU) Modules. The MCU Modules allow prototyping software-based CLayer and A-Layer Fault Managers. Each FPGA Module implements one A-Layer Ethernet link (through an Ethernet switch) with one of the MCU Modules, and one C-Layer JTAG link with the other. In addition, both MCU Modules exchange commands and data over an internal UART link. Similarly to the simulation framework, fault injection capabilities are implemented. Test results for some scenarios are also presented and discussed. In summary, this thesis covers the whole process from describing the problem of radiationinduced faults in SRAM-based FPGAs, then identifying and classifying fault management techniques, then proposing Fault Manager architectures and finally validating them by simulation and test. The proposed future work is mainly related to the implementation of radiation-hardened System Fault Managers.
机译:现场可编程门阵列(FPGA)SRAM建立在静态RAM技术(SRAM)配置存储器上。它们具有多种特性,这使它们对于设计复杂的嵌入式系统非常有趣。首先,由于逻辑和路由元素是预先实现的(用户设计定义了它们的连接),因此它们具有较低的非经常性工程成本(NRE)。而且,与其他FPGA技术不同,它们可以无限次重新配置(甚至在现场)。此外,Xilinx SRAM FPGA支持动态部分重配置(DPR),使您可以在不中断应用程序的情况下重新配置FPGA。最后,它们具有高逻辑密度,高处理能力和丰富的宏块播放功能。但是,该技术的一个缺点是其对电离辐射的敏感性,随集成度的提高而增加(更小的几何形状,更低的电压和更高的频率)。对于高辐射环境和高可靠性要求的应用,这是首要关注的问题。这种现象会导致长期性能下降,并且还可能导致瞬时故障,这种故障可能是可逆的,也可能会造成不可逆的损害。在SRAM FPGA中,辐射引起的故障可能出现在两个不同的体系结构层中,它们物理上叠加在硅芯片上。应用层(或A层)包含用户定义的硬件,而配置层包含配置存储器和支持电路。这些层中任何一层的故障都可能导致系统故障,这可能会或多或少地取决于系统的可靠性要求。在一般情况下,必须以某种方式管理这些故障。本文在辐射环境中运行可靠且自治的嵌入式系统的情况下,在系统级别处理SRAM FPGA中的故障管理。本文主要关注空间应用,但是相同的原理也可以应用于地球应用。两者之间的主要区别在于辐射水平和维护可能性。分类了A层和C层中不同的故障管理技术,并分析了它们对系统可靠性的影响。为单层和双层故障管理器提出了各种体系结构。对于后者,提出了一种新颖,灵活和通用的架构。它以协调的方式同时管理两层,并平衡了冗余级别和可靠性。为了验证动态故障管理技术,开发了两种不同的解决方案。第一个是基于SystemC作为建模语言和基于事件的仿真器的C层故障管理器的仿真环境。这种环境及其关联的方法允许探索Fault Manager的设计空间,将其设计与目标FPGA的开发脱钩。该环境包括适用于FPGA C层和Fault Manager的模型,它们可以在不同的抽象级别(在配置框架级别以及在物理级别JTAG或SelectMAP)进行交互。该环境是可配置的,可伸缩的和通用的,并且包括故障注入功能。给出并讨论了某些方案的仿真结果。第二个是Xilinx Virtex FPGA Fault Manager的验证平台。该硬件平台包含三个Xilinx Virtex-4 FX12 FPGA模块和两个通用32位微控制器单元模块(MCU)。 MCU模块允许对基于C层和基于A层软件的故障管理器进行原型设计。每个FPGA模块与一个MCU模块实现A层以太网链接(通过以太网交换机),而与另一个MCU模块实现C层JTAG链接。此外,两个MCU模块都通过内部UART链路交换命令和数据。对于仿真环境,包括故障注入功能。还介绍并讨论了某些方案的测试结果。总而言之,本论文涵盖了整个过程,从辐射诱导的SRAM FPGA的描述,故障管理技术的识别和分类以及故障管理器体系结构的建议。,适用于simulacióny pruebas的期末审定。在西班牙的法人商店和法拉利德的法人商店。基于SRAM的抽象现场可编程门阵列(FPGA)建立在静态RAM(SRAM)技术配置存储器上。它们具有许多功能,使它们非常适合构建复杂的嵌入式系统。首先,由于逻辑和路由元素是预先实现的(用户设计定义了它们的连接),因此它们可以从非经常性工程(NRE)的低成本中受益。而且,与其他FPGA技术相反,它们可以无限次重新配置(甚至在现场)。此外,基于Xilinx SRAM的FPGA具有动态部分重配置(DPR)功能,可以在不中断应用程序的情况下对FPGA进行部分重配置。最后,它们具有高逻辑密度,高处理能力和丰富的硬宏集。但是,该技术的局限性之一是其对电离辐射的敏感性,随技术规模的扩大而增加(更小的几何形状,更低的电压和更高的频率)。对于恶劣的辐射环境中的应用并要求高度的可靠性,这是头等大事。电离辐射会导致长期退化以及瞬时故障,这些故障又可以是可逆的或产生不可逆的损坏。在基于SRAM的FPGA中,辐射引起的故障可能会出现在两个体系结构层上,它们物理上覆盖在硅芯片上。应用层(或A层)包含用户定义的硬件,而配置层(或C层)包含(易失性)配置存储器及其支持电路。任一层的故障都可能暗示系统故障,根据可靠性要求,容错程度可能更高。在一般情况下,必须以某种方式管理此类故障。本文涉及在辐射环境中运行的自治且可靠的嵌入式系统的背景下,在系统级管理基于SRAM的FPGA故障。重点主要放在太空应用上,但是相同的原理也可以应用于地面应用。它们之间的主要区别是辐射水平和维护可能性。对A层和C层故障管理的不同技术进行了分类,并评估了它们对系统可靠性的影响。提出了几种用于单层和双层故障管理器的体系结构。对于后者,提出了一种新颖,灵活和通用的架构。它以协调的方式同时管理两个层,并允许平衡冗余级别和可靠性。为了验证动态故障管理技术,开发了两种不同的解决方案。第一个是C层故障管理器的仿真框架,基于SystemC作为建模语言和事件驱动的模拟器。该框架及其关联的方法允许探索Fault Manager设计空间,将其设计与目标FPGA开发脱钩​​。该框架包括适用于FPGA C层和Fault Manager的模型,它们可以在不同的抽象级别(在配置框架级别以及JTAG或SelectMAP物理级别)进行交互。该框架是可配置的,可扩展的和通用的,并且包括故障注入功能。给出并讨论了某些场景的仿真结果。第二个是Xilinx Virtex FPGA故障管理器的验证平台。该平台包含三个Xilinx Virtex-4 FX12 FPGA模块和两个通用32位微控制器单元(MCU)模块。 MCU模块允许基于软件的CLayer和A层故障管理器进行原型设计。每个FPGA模块与一个MCU模块实现一条A层以太网链路(通过以太网交换机),而一条C层JTAG链路则与另一个MCU模块实现。此外,两个MCU模块都通过内部UART链路交换命令和数据。与仿真框架类似,实现了故障注入功能。还介绍并讨论了某些方案的测试结果。总而言之,本文涵盖了整个过程,从描述基于SRAM的FPGA中的辐射引起的故障问题,到识别和分类故障管理技术,提出故障管理器体系结构,最后通过仿真和测试对其进行验证。拟议的未来工作主要与防辐射系统故障管理器的实施有关。

著录项

  • 作者

    Herrera Alzu Ignacio;

  • 作者单位
  • 年度 2015
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号