首页> 中国专利> 超长指令字程序的二进制翻译方法

超长指令字程序的二进制翻译方法

摘要

本发明的实施例提出了一种超长指令字程序的二进制翻译方法,包括以下步骤:对程序中的超长指令字进行指令解码;还原所述程序中的控制流图以及数据流图;重建类数据流计算模型下的控制流图与数据流图;对所述程序进行超长指令字程序的二进制翻译。本发明提出的上述技术方案,能保证控制流计算模型的程序在类数据流处理器上执行的准确性,效率高,满足了类数据流处理器上数据依赖关系表达的特殊要求。本发明提出的上述方案实现简单,避免了专用编译器的设计开销,可以面向不同的类数据流体系结构处理器进行二进制翻译,并适用于多种目标平台,具有广泛的通用性。

著录项

  • 公开/公告号CN101907999A

    专利类型发明专利

  • 公开/公告日2010-12-08

    原文格式PDF

  • 申请/专利权人 中国科学技术大学;

    申请/专利号CN201010231147.3

  • 申请日2010-07-19

  • 分类号G06F9/45;

  • 代理机构北京市立方律师事务所;

  • 代理人马佑平

  • 地址 230026 安徽省合肥市金寨路96号

  • 入库时间 2023-12-18 01:18:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-06-26

    授权

    授权

  • 2011-01-19

    实质审查的生效 IPC(主分类):G06F9/45 申请日:20100719

    实质审查的生效

  • 2010-12-08

    公开

    公开

说明书

技术领域

本发明涉及软件移植技术领域,具体而言,本发明涉及超长指令字程序的二进制翻译方法。

背景技术

二进制翻译(Binary Translation)是一种直接翻译可执行二进制程序的技术,能够解决不同指令集结构硬件平台之间软件移植的问题。二进制翻译可以分为静态翻译与动态翻译两类。静态翻译是在源处理器代码执行之前对其进行翻译。动态翻译则在程序运行时对执行到的片断进行翻译。静态翻译的代码执行效率较高。

VLIW(Very Long Instruction Word,超长指令字)把许多条指令构成一个很长的指令组合,用来增加运算速度以及开发指令级并行性。VLIW体系结构的处理器在一个长指令字中编码所有功能单元上的操作,采用集中控制的方式组织计算资源,编译器能够静态地精确调度每一个操作,大大简化了运行时的资源调度开销。VLIW在嵌入式芯片设计领域中扮演了重要的角色。

传统的计算机模型分为控制流和数据流两大类。控制流的计算机又称为冯·诺依曼计算机,当代主流计算机主要采用这种体系结构模型。在这种结构中,通过程序计数器来控制指令的执行次序,需要用存储器或寄存器来暂存指令间传递的操作数。而在数据流的计算机中,指令按照数据流图来执行,指令间的依赖关系决定了指令的执行顺序,操作数无需用集中式的存储器或寄存器来暂存,生产者指令的计算结果直接传送到消费者指令操作数域指定的运算单元中,一旦指令执行所需要的全部操作数到达后指令就可以发射执行。

类数据流计算模型将全局的控制流计算和局部的数据流计算结合起来。即,按控制流图将程序划分成若干个控制相关的超块,在超块的内部实现局部的数据流驱动执行,而在超块之间由控制流驱动执行。所述的超块是指利用谓词执行技术将若干个基本块集合在一起形成的一段指令序列,仅有唯一的控制流入口,可有多个出口。这种计算模型不仅降低了数据流计算对硬件资源的要求,同时减少了用于依赖检测的集中式控制部件,有利于降低芯片功耗。

为了在类数据流处理器上利用较为成熟的VLIW编译技术,产生高效的可执行代码,可以利用二进制翻译技术,采用静态翻译方法,将VLIW指令序列翻译成类数据流处理器上的超块序列。使用二进制翻译器可以避免设计全套的编译工具链所带来的高昂代价。但是,现在尚无针对数据流计算模型的二进制翻译技术。原因在于不同计算模型的指令集格式之间无法实现一一对应,类数据流指令间的操作数依赖关系也无法显式确定,必须结合指令上下文来确定指令的执行顺序。

因此,有必要提出一种有效的超长指令字程序的二进制翻译方案,以提高代码的利用效率。

发明内容

本发明的目的旨在至少解决上述技术缺陷之一,特别是提出一种有效的超长指令字程序的二进制翻译方案,以提高代码的利用效率。

为了达到上述目的,本发明的实施例提出了一种超长指令字程序的二进制翻译方法,包括以下步骤:

对程序中的超长指令字进行指令解码;

还原所述程序中的控制流图以及数据流图;

重建类数据流计算模型下的控制流图与数据流图;

对所述程序进行超长指令字程序的二进制翻译。

根据本发明的实施例,所述对程序中的超长指令字进行指令解码包括:

解码获得并发执行的操作,并记录下每个操作的信息,所述操作的信息包括计算部件的操作码、寄存器读写的地址、访存操作的地址以及片上通信的位置信息。

根据本发明的实施例,所述还原所述程序中的控制流图以及数据流图为:

还原所述程序中的控制流图:确定并保存所述程序中指令的控制流方向;以及

还原所述程序中的数据流图:确定并保存指令间的数据依赖关系。

根据本发明的实施例,所述重建类数据流计算模型下的控制流图与数据流图包括:

调用超块生成算法确定超块的边界,将程序中的指令以超块为单位进行划分;

在所述还原所述程序中的数据流图的基础上,处理超块内部的数据和超块间的数据的依赖关系。

根据本发明的实施例,所述将程序中的指令以超块为单位进行划分包括:以每条超长指令字包含的指令组合成一个超块。

根据本发明的实施例,所述处理超块内部的数据和超块间的数据的依赖关系包括:

对超块内部的数据依赖,通过增加操作数域读写指令实现操作数的传递;

对超块间的数据依赖,通过增加寄存器读写操作来实现操作数传递。

根据本发明的实施例,所述对所述程序进行超长指令字程序的二进制翻译包括:

对所述程序进行超长指令进行静态翻译;

对所述程序进行超长指令进行指令调整和调度;以及

对所述程序进行超长指令进行指令编码与封装。

根据本发明的实施例,所述对所述程序进行超长指令进行静态翻译包括:

对解码得到的操作静态地翻译成类数据流的指令格式。

根据本发明的实施例,所述对所述程序进行超长指令进行指令调整和调度包括:

根据所述类数据流指令的格式限制对超块内部指令进行调整,使之满足指令格式的要求;

根据硬件信息对超块内部指令的放置进行调度,基于调度算法为每条指令分配硬件资源。

根据本发明的实施例,所述对所述程序进行超长指令进行指令编码与封装包括:

根据类数据流处理器的指令格式对指令进行编码,其后根据指令超块的封装规则进行指令封装。

本发明提出的上述方案具有下列显著的优点:保证了控制流计算模型的程序在类数据流处理器上执行的准确性,效率高,满足了类数据流处理器上数据依赖关系表达的特殊要求。本发明提出的上述方案实现简单,避免了专用编译器的设计开销。本发明提出的上述方案可以面向不同的类数据流体系结构处理器进行二进制翻译,可以适用于多种目标平台,具有广泛的通用性。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本发明实施例超长指令字程序的二进制翻译方法的流程图;

图2为TPA-PD使用的类数据流指令集格式示意图;

图3为超块封装格式示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

为了实现本发明之目的,本发明公开了一种超长指令字程序的二进制翻译方法,包括以下步骤:对程序中的超长指令字进行指令解码;还原所述程序中的控制流图以及数据流图;重建类数据流计算模型下的控制流图与数据流图;对所述程序进行超长指令字程序的二进制翻译。

如图1所示,为本发明实施例超长指令字程序的二进制翻译方法的流程图,包括以下步骤:

S110:对程序中的超长指令字进行指令解码。

在步骤S110中,通过对程序进行指令解码,获得若干条并发执行的操作,记录下各个操作的信息,包括计算部件的操作码,寄存器读写的地址,访存操作的地址,片上通信的位置信息等。

S120:还原程序中的控制流图以及数据流图。

在步骤S120中,包括还原程序控制流图以及还原程序数据流图。其中,还原所述程序中的控制流图包括:确定并保存所述程序中指令的控制流方向。还原所述程序中的数据流图包括:确定并保存指令间的数据依赖关系。

S130:重建类数据流计算模型下的控制流图与数据流图。

在步骤S130中,重建类数据流计算模型下的控制流图与数据流图包括:

调用超块生成算法确定超块的边界,将程序中的指令以超块为单位进行划分;

在所述还原所述程序中的数据流图的基础上,处理超块内部的数据和超块间的数据的依赖关系。

调用的算法可以根据具体情况确定,例如,一种简单的处理方式为,可以以每条超长指令字包含的指令组合成一个超块。

具体而言,处理超块内部的数据和超块间的数据的依赖关系包括:

对超块内部的数据依赖,通过增加操作数域读写指令实现操作数的传递;对超块间的数据依赖,通过增加寄存器读写操作来实现操作数传递。

S140:对所述程序进行超长指令字程序的二进制翻译。

在步骤S140中,对所述程序进行超长指令字程序的二进制翻译包括以下步骤:

对所述程序进行超长指令进行静态翻译;

对所述程序进行超长指令进行指令调整和调度;以及

对所述程序进行超长指令进行指令编码与封装。

具体而言,对程序进行超长指令进行静态翻译包括:

对解码得到的操作静态地翻译成类数据流的指令格式。

具体而言,对程序进行超长指令进行指令调整和调度包括:

根据所述类数据流指令的格式限制对超块内部指令进行调整,使之满足指令格式的要求;

根据硬件信息对超块内部指令的放置进行调度,基于调度算法为每条指令分配硬件资源。

具体而言,对程序进行超长指令进行指令编码与封装包括:

根据类数据流处理器的指令格式对指令进行编码,其后根据指令超块的封装规则进行指令封装。

本发明提出的上述方案具有下列显著的优点:保证了控制流计算模型的程序在类数据流处理器上执行的准确性,效率高,满足了类数据流处理器上数据依赖关系表达的特殊要求。本发明提出的上述方案实现简单,避免了专用编译器的设计开销。本发明提出的上述方案可以面向不同的类数据流体系结构处理器进行二进制翻译,可以适用于多种目标平台,具有广泛的通用性。

为了更好的理解本发明的技术方案,以下通过进一步的实施例对本发明作进一步描述。

以下基于KLBT作为本项实施例,KLBT是分片式流处理器TPA-PD上面向VLIW可执行程序的二进制翻译器。

TPA-PD是一款分片式流处理器,作为主机的一个协处理器完成计算任务。在主机和TPA-PD系统上实现两级的流编程模型,其中计算密集的核心级程序在TPA-PD上执行。面向另一款VLIW指令的流处理器Imagine使用核心级编译器ISCD将KernelC语言编写的核心级程序编译成VLIW格式的微代码。KLBT以该二进制代码为输入,应用本发明所述的二进制翻译方法,产生可在TPA-PD上执行的类数据流指令二进制微码作为输出。KLBT的实现的二进制翻译方法步骤包括:

步骤1:对输入的VLIW格式的微代码进行解码。

VLIW微码长度是569bit,对于以下每个部件都有一个对应的指令域:3个加法器、2个乘法器、一个除法/开方部件、便签簿存储区、通讯单元、微控制器单元中循环控制单元等。每个部件的指令域又包括以下子域:部件的操作码、条件码寄存器文件的读地址、LRF(本地寄存器文件)的读地址、LRF的写地址、LRF写端口的交叉开关地址编号。通过创建一个全局的数组VLIW_Decode来保存解码后的每一条VLIW指令的相关信息,其中包括计算部件操作,访存操作,寄存器读写操作和通信操作。

步骤2:对程序还原控制流图

由于KernelC的语法只允许循环作为控制转移指令,可以通过寻找循环指令来确定程序的控制流图。对于以索引计数作为循环控制检测的指令有下列两种组合,分别判断循环索引变量count的值是否为零来决定是否跳转到offset指定的指令行号:

CHECK_UCR(count);

NLOOP,offset=常数;

CHECK_UCR_DEC(count)

LOOP,offset=常数;

对于以流长度作为循环控制检测的指令也有两种组合,其中的CHECK_EOS(in)用于判断流的长度是否为零:

CHECK_EOS(in);

NLOOP,offset=常数;

CHECK_EOS(in);

LOOP,offset=常数;

在所有指令解码完成后,顺序搜索指令寻找和控制流相关的指令,参考相关的offset域,就可以还原整个kernel程序的控制流图。控制流图的表示是依靠在VLIW_Decoded数组的每一项中填写上所在基本块的起始指令编号和结束指令编号。

步骤3:还原程序数据流图

将VLIW解码提取出所有的有效的操作后,需要在这些操作间建立数据依赖关系,还原数据流图。这些操作间存在的寄存器依赖关系和指针依赖关系,寄存器依赖是指某个功能部件操作将结果写入LRF,另一个操作把写入的值作为自己的操作数,这两个操作间存在RAW关系。指针依赖是指对运算簇内部的便笺簿存储区(Scratch Pad)进行读写操作间的RAW关系,读写地址是不确定的,可以是动态生成的。寄存器依赖可以通过不同操作在不同的VLIW间静态的依赖关系来确定,而指针依赖由于访问数据的存放位置即地址值是动态确定的,所以不能直接建立操作间的RAW关系,只能按照操作在VLIW中的静态顺序来保证写操作和读操作间的顺序一致性。

在还原数据流图时,根据对寄存器读写的顺序,建立全局读写操作队列。不同的操作之间有寄存器依赖的就链接到对应操作的读写队列上。对全部操作经过一次遍历后即可还原程序的数据流图。

步骤4:构建类数据流计算模型下的控制流图和数据流图

可以使用任何一种超块生成算法来确定超块的边界。KLBT使用基本块作为超块的天然划分。对数据流图处理两种类型的数据依赖关系:

(4.1)块间数据依赖:我们使用LREAD和LWRITE指令实现块间操作数传递,LREAD指令将操作数写到DT中便签簿存储器中,在需要这个操作数的block中LWRITE指令把操作数从便签簿中取出。

(4.2)块内数据依赖:使用类数据流指令中的目标域来表示指令的操作数的传递方向。对于超过目标域个数限制的操作可能要增加操作数移动指令MOVT来实现操作数的传递。

步骤5:指令静态翻译

(5.1)计算操作:直接按照SIMD的语义翻译成对应的数条类数据流计算指令。

(5.2)控制流操作:将循环操作翻译成对应的寄存器指令和跳转指令序列。

(5.3)通信操作:按照不同的通信模式,翻译成对应的寄存器指令和操作数移动指令序列。

步骤6:指令调整和调度

根据TPA-PD的硬件信息,使用超块的指令调度算法来分配发射槽、保留站等硬件资源。

步骤7:类数据流指令编码与封装

按照指令格式,对指令的各个域进行二进制编码。TPA-PD使用的类数据流指令集格式见图2。

当指令的域都填充好,就可以开始指令封装。指令封装是以超块为单位,将超块中的指令封装成适合TPA-PD处理器取指、发射的格式如图3所示。微码中每个超块中chunk的个数是静态确定的。Chunk0中存放寄存器读写指令。chunk1中有分支转移指令BRANCH,chunk1-chunk8分别存放其它计算与通信指令。

本领域普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号