首页> 中国专利> 一种基于片上监测的可切换错误恢复方式

一种基于片上监测的可切换错误恢复方式

摘要

本发明涉及一种基于片上监测的可切换错误恢复方式,包括片上监测单元电路、错误信号统计模块、电源管理模块、错误恢复控制模块、原地错误恢复模块和上层错误恢复模块。该方法过程中,错误信号统计模块统计片上监测单元电路监测到的错误率,并将统计结果送入错误恢复控制模块。错误恢复控制模块根据错误率和电源管理模块送入的电路当前工作状态,经过运算比较,选择原地错误恢复方式或上层错误恢复方式,同时,错误恢复控制模块将电压频率调节信号送入电源管理模块,电源管理模块动态地调节系统的工作状态。当系统工作频率比较低时,使用原地错误恢复方式可将系统尽快地从错误状态恢复过来(注:只要停一个时钟节拍)。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-29

    专利权的主动放弃 IPC(主分类):G06F11/07 专利号:ZL201210319577X 申请日:20120903 授权公告日:20180515 放弃生效日:20220317

    专利权的主动放弃

  • 2022-01-28

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F11/07 专利号:ZL201210319577X 变更事项:专利权人 变更前:江苏东大集成电路系统工程技术有限公司 变更后:东集技术股份有限公司 变更事项:地址 变更前:210012 江苏省南京市雨花区花神大道文竹路23号 变更后:210031 江苏省南京市江北新区星火路15号

    专利权人的姓名或者名称、地址的变更

  • 2018-05-15

    授权

    授权

  • 2015-07-29

    实质审查的生效 IPC(主分类):G06F11/07 申请日:20120903

    实质审查的生效

  • 2014-03-26

    公开

    公开

说明书

技术领域

本发明涉及一种基于片上监测的可切换错误恢复方式,具体涉及一种基于片 上错误监测并根据监测结果可切换错误恢复方式,属于集成电路设计领域。

背景技术

随着晶体管尺寸的不断缩小,单位面积上集成的晶体管数急剧增加,集成电 路的功耗问题成为和功能、面积同等重要的考虑因素。旨在降低电路功耗的动态 调节技术,因其显著地效果,逐渐成为重要的低功耗技术。

近年来出现的基于片上监测的动态电压和频率调节技术,将电路的工作条件, 如温度、工艺、噪声等的变化归结为电路的时序变化,通过片上监测手段实时监 测电路工作的时序变化,指导电路动态地调节工作参数。只有找到满足系统性能 的最低工作电压点,才能尽可能地减小电路设计时为最坏情况(Worst Case)预留 的电压或频率余量,以获得最大的功耗收益。

在动态地寻找系统工作任意时刻的最低电压点时,会让系统产生出错的风险, 因此必须设置一定的错误恢复机制,在系统出错时,可以帮助其从错误状态中恢 复过来。国内外实现这种错误恢复的方式主要有两种:原地错误恢复方式和上层 错误恢复方式。原地错误恢复方式是在电路的片上监测单元监测到时序错误后, 使用门控时钟的方法,将电路的时钟信号暂停,在此期间用正确的信号取代错误 信号输出。这种错误恢复方式的片上监测单元结构复杂,监测单元本身的功耗较 高,且对于工作频率较高的系统和应用场合,如果电路频繁出错,恢复时的代价 较高,极大影响了系统的吞吐率且降低功耗效果不显著。上层错误恢复方式也须 借助于片上监测单元,与原地恢复不同的是,这种恢复方式在片上监测单元监测 到时序错误后,通过重新执行出错的指令来恢复错误。这种恢复方式多用于流水 线结构的设计中,由于它所需要的恢复周期数较多,当系统工作频率较低时,恢 复时的代价较高,降低功耗效果不明显。目前动态调节电路的恢复方式只是单一 地使用上面两种方式中的一种,但是其系统应用具有较大的局限性,对于需要在 比较宽的频率范围内工作的应用,单一的错误恢复方式很难使系统的吞吐率和功 耗达到最优化。

发明内容

由于目前常用的基于片上监测的动态调节系统中的错误恢复方式的局限性, 本发明提出一种基于片上监测的可切换错误恢复方式,可以在片上监测单元监测 到电路时序错误后,根据电路的系统需求和工作状态动态地选择系统的错误恢复 方式,能够在原地错误恢复方式和上层错误恢复方式两种错误恢复方式间动态切 换。本发明所提出的方法适用于所有电路结构,克服了上层错误恢复方式适用范 围小的局限。解决了单一的错误恢复方式在比较宽的工作频率范围内的系统应用 场合局限、吞吐率低和功耗收益不理想的问题。

为了实现上述目的,本发明通过以下技术方案实现:

本发明包括流水线结构CPU内核和错误恢复单元。其中,错误恢复单元包 括片上监测单元电路、错误信号统计模块、电源管理模块、错误恢复控制模块、 原地错误恢复模块和上层错误恢复模块。

其中,片上监测单元电路将监测到的错误信号送到错误信号统计模块,错误 信号统计模块统计的错误率(错误信号占总的监测单元数量的百分数)和电源管 理模块的系统工作状态(电路的工作电压和工作频率)实时送到错误恢复控制模 块,错误恢复控制模块根据阈值比较选择机制的结果来选择原地错误恢复方式或 上层错误恢复方式。同时,错误恢复控制模块将系统的电压频率调节信号送到电 源管理模块中,以实现系统工作状态的动态调节。

上述错误恢复控制模块内阈值比较选择机制通过以下过程建立:

比较阈值是选择的界限值,包括三个数值的算术和(注:对三个重要影响因 子拟合,形成综合的影响结果),分别为错误率、工作电压比和工作频率比。其 中,错误率即为错误信号统计模块统计的系统一个时钟周期内的错误率,工作电 压比是电路的当前工作电压与电路的最大工作电压的比值,工作频率比是电路的 当前工作频率与电路的最大工作频率的比值。

首选,找出比较阈值。在电路的设计阶段,根据电路电源管理模块的调节方 式,计算一定调节步长下电路的各工作点的错误率、工作电压比和工作频率比的 算术和,即为比较参数,并分别采用上层错误恢复方式和原地错误恢复方式进行 错误恢复,得到两种错误恢复方式下的功耗收益。找出上层错误恢复方式功耗收 益大于原地错误恢复方式功耗收益的工作点,在此工作点下的比较参数即为比较 阈值。

其次,设定比较阈值。通过可编程的方式将找出的比较阈值设定到错误恢复 控制模块中,作为选择错误恢复方式的比较标准。

最后,选择错误恢复方式。错误恢复控制模块通过将比较参数与既定的比较 阈值比较,根据比较结果选择错误恢复方式。

附图说明

图1为本发明的结构框图;

图2为本发明中错误恢复单元的结构框图;

图3为本发明阈值比较选择机制建立的流程图;

图4为比较参数Tref的函数曲线图(注:其中,横坐标为错误率,纵坐标为 比较参数);

图5为恢复效率Erecovery(包括原地错误恢复效率Erecovery_local和上层错误 恢复效率Erecovery_global)对比较参数Tref的函数曲线图(注:其中,横坐标为比 较参数,纵坐标为恢复效率)。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下 面结合具体实施方式,进一步阐述本发明。

如图1所示,本发明包括流水线结构CPU内核和错误恢复单元7。错误恢复 单元7的具体组成结构如图2所示,包括片上监测单元电路1、错误信号统计模 块2、电源管理模块3、错误恢复控制模块4、原地错误恢复模块5和上层错误 恢复模块6。片上监测单元电路1将监测到的错误信号送到错误信号统计模块2, 错误信号统计模块2统计的错误率和电源管理模块3的系统状态送到错误恢复控 制模块4,错误恢复控制模块4根据阈值比较选择机制的结果选择将原地错误恢 复方式选择信号送到原地错误恢复模块5或将上层错误恢复方式选择信号送到 上层错误恢复模块6。同时,错误恢复控制模块4将系统的电压频率调节信号送 到电源管理模块中,以实现系统工作状态的动态调节。

其中,片上监测单元电路1集成在N级流水线结构CPU内核的前N-1级流水 线的各级流水线末端,其中,N是大于3且小于20的正整数,实时监测电路的 工作时序,生成错误信号;错误信号统计模块2统计一个时钟周期内监测到的错 误率(错误信号占总的监测单元数量的百分数);电源管理模块3将电路的工作 电压和工作频率实时送到错误恢复控制模块4,并根据电压频率调节信号动态调 节系统工作状态;错误恢复选择模块4包含阈值比较选择机制,并且生成电压频 率调节信号来指导电源管理模块3对系统工作状态动态调节。

当选择原地错误恢复方式时,电源管理模块3会将时钟门控信号送到原地错 误恢复模块5,把相关电路的时钟信号停一拍,原地错误恢复模块5将原地错误 恢复控制信号送到片上监测单元电路1,完成正确信号对错误信号的原地替换。 当选择上层错误恢复方式时,上层错误恢复模块6将流水线刷新信号送到流水线 相关电路模块,并配合其他控制模块完成上层错误恢复。

如图3所示,错误恢复控制模块4中的阈值比较选择机制通过以下过程建立:

首先,找出比较阈值Tthreshold

在电路的设计阶段,假设电路的动态电压调节的步长为Vstep,电路的动态频 率调节的步长为Fstep,电路的动态电压调节的最小工作电压为Vmin,最大工作电 压为Vmax,电路的动态频率调节的最小工作频率为Fmin,最大工作频率为Fmax。 电路动态调节的工作点分别为Vmin+n*Vstep或Fmin+k*Fstep,其中, 0≤n≤(Vmax-Vmin)/Vstep,0≤k≤(Fmax-Fmin)/Fstep,且n,k均为整数。 比较阈值Tthreshold包括错误率Rerror、工作电压比Vtemp/Vmax和工作频率比 Ftemp/Fmax,其中,电路的当前工作电压Vtemp=Vmin+i*Vstep,电路的当前工作 频率Ftemp=Fmin+j*Fstep,0≤i≤(Vmax-Vmin)/Vstep,0≤j≤(Fmax- Fmin)/Fstep,且i,j均为整数。在电路动态调节的各工作点分别计算比较参数 Tref=Rerror+Vtemp/Vmax+Ftemp/Fmax的值。由于错误率Rerror与工作电压比 Vtemp/Vmax成反比关系,与工作频率比Ftemp/Fmax成正比关系,公式Tref= Rerror+Vtemp/Vmax+Ftemp/Fmax可改写为其 中,m,n为大于0的常数,所以Tref对于错误率Rerror的函数曲线类似于第一象限 的双曲线(具有最低点),如图4所示。在电路设计阶段,电路工作在不同的工 作点时,分别在每一个工作点上使用上层错误恢复方式和原地错误恢复方式去恢 复电路工作状态,同时测量使用这两种恢复方式时的恢复效率,其中原地错误恢 复效率为Erecovery_local,上层错误恢复效率为Erecovery_global。得到恢复效率 Erecovery(分别为原地错误恢复效率Erecovery_local和上层错误恢复效率 Erecovery_global)与比较参数Tref的关系曲线,恢复效率Erecovery与比较参数Tref成 线性关系,如图5所示。当比较参数Tref超过某一个值时,上层错误恢复方式的 功耗收益较高。当Tref小于这个数值时,原地错误恢复方式的功耗收益较高。这 个值即为比较阈值Tthreshold

其次,设定比较阈值Tthreshold

选定好比较阈值Tthreshold后,通过可编程的方式将找出的比较阈值Tthreshold设定到错误恢复控制模块4中,作为选择错误恢复方式的比较标准。电路一旦给 定,此比较阈值Tthreshold就是固定的,在工作过程中无须更改。

最后,选择错误恢复方式。

由于错误信号统计模块2和电源管理模块3每个时钟周期都会更新传递到错 误恢复控制模块4的错误率Rerror、工作电压比Vtemp/Vmax和工作频率比 Ftemp/Fmax,错误恢复控制模块4每个时钟周期都会计算当前的比较参数Tref的 值,并将电路当前工作时的比较参数Tref与既定的比较阈值Tthreshold比较。如果 比较参数Tref大于比较阈值Tthreshold,则错误恢复控制模块4将上层错误恢复方 式选择信号送到上层恢复方式模块6,选择上层错误恢复方式;如果比较参数Tref小于比较阈值Tthreshold,则错误恢复控制模块4将原地错误恢复方式选择信号送 到原地错误恢复模块5,选择原地错误恢复方式。

本发明根据电路的错误率和系统状态,通过和既定的比较阈值进行比较来选 择合适的错误恢复方式,取得最大的功耗收益。

以上显示和描述了本发明的基本原理,主要特征和本发明的优点。本行业的 技术人员应该了解,本发明不受上述实施例的限制,上述实施例和发明专利说明 书中描述的只是本发明的原理,在不脱离本发明原理和范围的前提下,本发明还 会有各种变化和改进,这些变化和改进都落入本发明要求保护的范围内。本发明 要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号