首页> 中国专利> 一种基于大规模粗粒度可重构处理器的SM4-128加密算法实现方法及系统

一种基于大规模粗粒度可重构处理器的SM4-128加密算法实现方法及系统

摘要

本发明公开了一种基于大规模粗粒度可重构处理器的SM4‑128加密算法实现方法及系统,该系统包括可重构处理器、微处理器、系统总线;所述可重构计算阵列包括可重构计算阵列块,可重构计算阵列块包括可重构阵列运算行、写端口运算行选择器、读端口运算行选择器;所述微处理器通过系统总线分别与配置控制模块的配置与控制接口,可重构处理器的输入先入先出寄存器组连接,所述输入先入先出寄存器组连接可重构计算阵列,可重构计算阵列连接输出端连接可重构处理器,输出端连接可重构处理器通过系统总线与微处理器连接。该系统及方法针对SM4‑128加密算法,通过将多轮迭代在可重构处理器中部分展开和中间结果数据缓存的方式进行优化和加速。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-06

    授权

    授权

  • 2016-09-28

    实质审查的生效 IPC(主分类):G06F15/78 申请日:20160506

    实质审查的生效

  • 2016-08-31

    公开

    公开

说明书

技术领域

本发明涉及嵌入式可重构系统领域,尤其涉及一种应用于通信、加密等领域的基于大规模粗粒度嵌入式可重构系统及其处理方法。

背景技术

通用处理器与专用集成电路(ASIC)是传统的计算机系统结构领域的两大主流方法。然而,随着应用领域对系统的性能、能耗、上市时间等指标需求的不断提高,这两种传统计算模式的弊端就暴露出来。

通用处理器方法适用范围广,但是计算效率低,专用集成电路虽然可以提高计算速度和计算效率,满足性能需求,但是ASIC器件的灵活性很差。

为了在灵活性和计算效率之间实现很好的权衡,可重构计算(reconfigurable computing)技术应运而生。可重构计算是当前计算机系统结构领域的发展趋势之一,它的架构介于通用处理器和ASIC之间,并且综合了二者长处。它通过对可重构设备进行配置,可以使之由一个通用的计算平台转化为一个专用的硬件系统,以完成具体的计算任务,相当于计算任务同时在时间和空间上展开,显示出了应用的灵活性和很高的计算性能。此外,可重构计算技术还具有系统能耗低、可靠性高、上市时间短等优势。这些优势使得可重构计算技术在各个应用领域尤其是嵌入式应用领域有着广阔的应用前景。很多在嵌入式领域中的主流应用,例如多媒体应用、加/解密应用以及通信应用等都非常适合利用可重构计算技术实现。当前的可重构计算技术主要还是用于尖端技术领域中的计算平台,但随着可重构逻 辑器件成本逐渐降低,运行时可重构计算技术不断完善,我们有理由相信可重构计算技术具备的种种优势会使其在更多的领域里大有作为。

目前国内外已研究有多重可重构系统,如ReMAP,AsAP,DRP等。但是,这些阵列的互联方式较为简单,在SM4-128加密算法方法的运算中需要大量的中间数据存储以及较多的轮数,因此运算的效率和速度较低。传统的可重构计算系统在SM4-128加密算法的运算效率与运算周期方面存在较大问题。

发明内容

为了克服现有技术中存在的不足,本发明的目的是提供一种基于大规模粗粒度可重构处理器的SM4-128加密算法系统,利用可重构技术的并行性处理、运算模块独立可配置等优点,在支持一定的灵活性的同时,通过提高对SM4-128加密算法算法的并行度以及优化流水线等方法以实现SM4-128加密算法算法的高效运算。

为实现上述目的,本发明采用的技术方案为:

一种基于大规模粗粒度可重构处理器的SM4-128加密算法系统,包括可重构处理器、微处理器、系统总线;

其中,所述可重构处理器包括配置控制模块、输入先入先出寄存器组、输出先入先出寄存器组、通用寄存器堆、可重构计算阵列;

所述配置控制模块包括依次连接的配置与控制接口、配置存储器、配置解析模块,配置控制模块的输出端连接可重构处理器;

所述可重构计算阵列包括可重构计算阵列块,可重构计算阵列块包括可重构阵列运算行、写端口运算行选择器、读端口运算行选择器;所 述可重构阵列运算行的输出端连接写端口运算行选择器的输入端,写端口运算行选择器的输出端连接通用寄存器堆;所述读端口运算行选择器的输入端接入通用寄存器堆,读端口运算行选择器的输出端连接可重构阵列运算行;

其中,所述可重构阵列运算行包括算术逻辑单元、查找表单元、比特置换网络、字节置换网络以及数据输入单元和数据输出单元;

所述微处理器通过系统总线分别与配置控制模块的配置与控制接口,可重构处理器的输入先入先出寄存器组连接,所述输入先入先出寄存器组连接可重构计算阵列,可重构计算阵列连接输出端连接可重构处理器,输出端连接可重构处理器通过系统总线与微处理器连接;

其中,通过分析SM4-128加密算法的特征来确定SM4-128加密算法的运算流程,将多轮的SM4-128加密算法运算展开成一幅数据流图映射到可重构处理器中,通过多幅数据流图最终完成SM4-128加密算法的整个运算;

微处理器通过系统总线发送明文数据给可重构处理器,可重构处理器将明文数据存入输入先入先出寄存器组,并在最终计算完成后输出密文数据到输出先入先出寄存器组,并发送中断信号,最终由微处理器读出输出至输出先入先出寄存器组中的数据。

首先对配置单元中的配置存储器进行初始化,微处理器将所需要的配置信息通过配置单元的配置与控制接口发送到配置存储器中,然后通过配置单元中的配置解析模块解析配置存储器,实现对计算阵列的配置、 启动以及切换操作。

进一步的,所述的可重构处理器有M个可重构计算阵列块、1个通用寄存器堆、1个输入先入先出寄存器组和1个输出先入先出寄存器组,其中M取整数;其中M个可重构计算阵列块通过一个1个通用寄存器堆互相进行数据的储存、读取和传递;且多个可重构计算阵列块中相邻的两个可重构计算阵列块通过数据输入单元和数据输出单元连接;第一个可重构计算阵列块通过第一个可重构阵列运算行的数据输入单元与输入先入先出寄存器组相连,同时第M个可重构计算阵列块通过最后一个个可重构阵列运算行的数据输出单元与输出先入先出寄存器组相连。作为优选方案,可重构处理器有10个可重构阵列块。

进一步的,所述的每个可重构计算阵列块包括N个可重构阵列运算行和1个读端口运算行选择器和1个写端口运算行选择器,其中N取整数;其每N个可重构阵列运算行共享1个通用寄存器堆的读端口和写端口。作为优选方案,可重构阵列块包括4个可重构阵列运算行。

进一步的,所述的可重构阵列运算行包括X1个数据输入单元,X2个数据输出单元,X3个字节置换网络,X4个比特置换网络和X5个8位算术逻辑单元,X6个查找表单元,其中X1,X2,X3,X4,X5和X6均取整数;数据经过数据输入单元,由选择器通过读取并解析不同的配置信息来选择数据流入的字节置换网络和比特置换网络;字节置换网络与比特置换网络的输出分为X5个8位的数据分别固定对应于X5个8位算术逻辑单元,并行运算X5/4组SM4-128加密算法数据;每个算术逻辑单元使用数据 选择器选择任意三个置换网络的输出作为其输入;数据输出单元暂存算术逻辑单元的结果并读取配置信息决定将数据输出到先入先出寄存器组、下一个可重构阵列运算行或通用寄存器堆。作为优选方案,可重构阵列运算行包括数据载入单元,数据输出单元,字节置换网络,比特置换网络和16个8位算术逻辑单元;数据经过数据载入单元,由选择器通过读取并解析不同的配置信息来选择数据流入的字节置换网络和比特置换网络;字节置换网络与比特置换网络的128位的输出分为16个8位的数据分别固定对应于16个8位算术逻辑单元,一次性可以运算4组SM4-128加密算法数据;每个算术逻辑单元可以使用数据选择器选择其中三个置换网络的输出作为其输入;数据载入单元可以暂存算术逻辑单元的结果并读取配置信息决定将数据输出到先进先出寄存器组、下一个可重构阵列运算行还是通用寄存器堆。

进一步的,所述算术逻辑单元及查找表用于实现异或运算、与运算、直通输出、查表操作的运算操作;同时每个算术逻辑单元有最多3个输入和最多2个输出,其中算术逻辑单元执行上述运算操作的同时,支持任选一个输入作为输出;每4个8位的算术逻辑单元通过进位端口连接成为1个32位的算术逻辑单元;每4个可重构阵列运算行共享一个查找表,来实现查表操作。作为优选方案,算术逻辑单元中包含3输入异或、2输入异或运算;同时每个算术逻辑单元有最多3个输入和最多2个输出,其中算术逻辑单元执行上述运算操作的同时,支持任选一个输入作为输出;查找表单元支持数据的查表操作,每4个可重构计算行单元共享一 个查找表单元。由于SM4-128加密算法方法中全部为32位运算,因此每4个8位的算术逻辑单元可以通过进位端口连接成为1个32位的算术逻辑单元。

进一步的,该系统的SM4-128加密算法包括如下6个步骤,对于32轮迭代的128比特的加密算法,对(2)~(6)步骤顺序操作并循环32次后,执行(6)执行1次,即可得到密文(其中0≤i≤31):

(1)生成Y[i]:数据输入单元将X[i+1],X[i+2],X[i+3]同时载入可重构运算单元行中,(其中0≤i≤31);对载入数据经过字节置换网络后,输入值同一个32比特的逻辑运算单元,进行三输入异或操作,得到Y[i],并将其计算结果存入通用寄存器中;

(2)生成A[i]:数据输入单元将轮密钥rk[i]及Y[i]同时载入可重构运算单元行中,在经过字节置换网络进行移位后,再对ri[i],Y[i]两者进行异或操作,将结果A[i]输出至缓存单元中;

(3)查表操作:数据输入单元将A[i]从缓存单元中载入至可重构运算单元行中;A[i]在通过字节置换网络后,在查找表中对A[i]进行查表操作,得到B[i],并将B[i]存入缓存单元中;

(4)线性变换:数据输入单元将B[i]从缓存单元中载入至可重构阵列单元行中;B[i]在经过比特置换网络后,生成中间数据B1[i],B2[i],将B1[i],B2[i],B[i]三者进行异或操作,生成M[i],并将M[i]及B[i]存入缓存单元;将上一行输出结果M[i]及B[i]从缓存单元中载入至可重构阵列单元行中,B[i]在经过比特置换网络后,生成中间数据B3[i],B4[i],将B3[i],B4[i],M[i]三者进行 异或操作,得到T[i];

(5)生成X[i+4]:数据输入单元将T[i]从缓存单元中载入至可重构阵列单元行中,对T[i]及X[i]进行异或操作,得到X[i+4];

(6)逆序操作:数据输入单元将X[32],X[33],X[34],X[35]从通用寄存器中载入至可重构计算单元行中,经过字节置换网络,实现逆序,得到从高位至低位按照X[35],X[34],X[33],X[32]的数据,输出至输出先入先出寄存器组,得到密文。

一种基于大规模粗粒度可重构处理器的SM4-128加密算法的实现方法,包括以下步骤:

(1)分析SM4-128加密算法的计算特点,并归纳出数据流图;

(2)确定数据流图之后,针对可重构处理器的硬件特点,在了解其各寄存器、运算器以及各功能模块的作用机制的情况下配置可重构处理器,并生成配置信息;

(3)通过微处理器将配置信息以及所需要的各种初始数据存入相应的存储器中;

(4)最后微处理器启动可重构处理器,并将配置信息及数据发送给可重构处理器;

(5)当可重构处理器完成当前任务后,发送中断信号。

有益效果:本发明基于大规模粗粒度动态可重构处理器,通过10个可重构阵列块包含多个运算单元,借助通用寄存器堆提高SM4-128加密算法算法的运算并行度,在具有一定灵活性的同时,提高SM4-128加密算法方 法的运算效率,尽可能的减少运算周期。

附图说明

图1为本发明的基于大规模粗粒度嵌入式可重构系统处理器框图;

图2a-图2d为一个可重构阵列块的运算流示意,共同构成本发明中SM4-128加密算法运算流图。

具体实施方式

下面结合附图对本发明作更进一步的说明。

如图1所示为一种基于大规模粗粒度可重构处理器的SM4-128加密算法系统,包括可重构处理器、微处理器、系统总线;

其中,所述可重构处理器包括配置控制模块、输入先入先出寄存器组、输出先入先出寄存器组、通用寄存器堆、可重构计算阵列;

所述配置控制模块包括依次连接的配置与控制接口、配置存储器、配置解析模块,配置控制模块的输出端连接可重构处理器;

所述可重构计算阵列包括可重构计算阵列块,可重构计算阵列块包括可重构阵列运算行、写端口运算行选择器、读端口运算行选择器;所述可重构阵列运算行的输出端连接写端口运算行选择器的输入端,写端口运算行选择器的输出端连接通用寄存器堆;所述读端口运算行选择器的输入端接入通用寄存器堆,读端口运算行选择器的输出端连接可重构阵列运算行;

其中,所述可重构阵列运算行包括算术逻辑单元、查找表单元、比特置换网络、字节置换网络以及数据输入单元和数据输出单元;

所述微处理器通过系统总线分别与配置控制模块的配置与控制接口,可重构处理器的输入先入先出寄存器组连接,所述输入先入先出寄存器组连接可重构计算阵列,可重构计算阵列连接输出端连接可重构处理器,输出端连接可重构处理器通过系统总线与微处理器连接;

其中,通过分析SM4-128加密算法的特征来确定SM4-128加密算法的运算流程,将多轮的SM4-128加密算法运算展开成一幅数据流图映射到可重构处理器中,通过多幅数据流图最终完成SM4-128加密算法的整个运算;

微处理器通过系统总线发送明文数据给可重构处理器,可重构处理器将明文数据存入输入先入先出寄存器组,并在最终计算完成后输出密文数据到输出先入先出寄存器组,并发送中断信号,最终由微处理器读出输出至输出先入先出寄存器组中的数据。

首先对配置单元中的配置存储器进行初始化,微处理器将所需要的配置信息通过配置单元的配置与控制接口发送到配置存储器中,然后通过配置单元中的配置解析模块解析配置存储器,实现对计算阵列的配置、启动以及切换操作。

可重构处理器有10个可重构计算阵列块、1个通用寄存器堆、1个输入先入先出寄存器组和1个输出先入先出寄存器组;其中10个可重构计算阵列块通过一个1个通用寄存器堆互相进行数据的储存、读取和传递;且多个可重构计算阵列块中相邻的两个可重构计算阵列块通过数据输入单元和数据输出单元连接;第一个可重构计算阵列块通过第一个可重构 阵列运算行的数据输入单元与输入先入先出寄存器组相连,同时第10个可重构计算阵列块通过最后一个个可重构阵列运算行的数据输出单元与输出先入先出寄存器组相连。

每个可重构计算阵列块包括4个可重构阵列运算行和1个读端口运算行选择器和1个写端口运算行选择器;其每4个可重构阵列运算行共享1个通用寄存器堆的读端口和写端口。

可重构阵列运算行包括数据载入单元,数据输出单元,字节置换网络,比特置换网络和16个8位算术逻辑单元;数据经过数据载入单元,由选择器通过读取并解析不同的配置信息来选择数据流入的字节置换网络和比特置换网络;字节置换网络与比特置换网络的128位的输出分为16个8位的数据分别固定对应于16个8位算术逻辑单元,一次性可以运算4组SM4-128加密算法数据;每个算术逻辑单元可以使用数据选择器选择其中三个置换网络的输出作为其输入;数据载入单元可以暂存算术逻辑单元的结果并读取配置信息决定将数据输出到先进先出寄存器组、下一个可重构阵列运算行还是通用寄存器堆。

算术逻辑单元中包含3输入异或、2输入异或运算;同时每个算术逻辑单元有最多3个输入和最多2个输出,其中算术逻辑单元执行上述运算操作的同时,支持任选一个输入作为输出;查找表单元支持数据的查表操作,每4个可重构计算行单元共享一个查找表单元。由于SM4-128加密算法方法中全部为32位运算,因此每4个8位的算术逻辑单元可以通过进位端口连接成为1个32位的算术逻辑单元。

该系统的SM4-128加密算法包括如下6个步骤,对于32轮迭代的128比特的加密算法,对(2)~(6)步骤顺序操作并循环32次后,执行(6)执行1次,即可得到密文(其中0≤i≤31):

(1)生成Y[i]:数据输入单元将X[i+1],X[i+2],X[i+3]同时载入可重构运算单元行中,(其中0≤i≤31);对载入数据经过字节置换网络后,输入值同一个32比特的逻辑运算单元,进行三输入异或操作,得到Y[i],并将其计算结果存入通用寄存器中;

(2)生成A[i]:数据输入单元将轮密钥rk[i]及Y[i]同时载入可重构运算单元行中,在经过字节置换网络进行移位后,再对ri[i],Y[i]两者进行异或操作,将结果A[i]输出至缓存单元中;

(3)查表操作:数据输入单元将A[i]从缓存单元中载入至可重构运算单元行中;A[i]在通过字节置换网络后,在查找表中对A[i]进行查表操作,得到B[i],并将B[i]存入缓存单元中;

(4)线性变换:数据输入单元将B[i]从缓存单元中载入至可重构阵列单元行中;B[i]在经过比特置换网络后,生成中间数据B1[i],B2[i],将B1[i],B2[i],B[i]三者进行异或操作,生成M[i],并将M[i]及B[i]存入缓存单元;将上一行输出结果M[i]及B[i]从缓存单元中载入至可重构阵列单元行中,B[i]在经过比特置换网络后,生成中间数据B3[i],B4[i],将B3[i],B4[i],M[i]三者进行异或操作,得到T[i];

(5)生成X[i+4]:数据输入单元将T[i]从缓存单元中载入至可重构阵列单元行中,对T[i]及X[i]进行异或操作,得到X[i+4];

(6)逆序操作:数据输入单元将X[32],X[33],X[34],X[35]从通用寄存器中载入至可重构计算单元行中,经过字节置换网络,实现逆序,得到从高位至低位按照X[35],X[34],X[33],X[32]的数据,输出至输出先入先出寄存器组,得到密文。

一种基于大规模粗粒度可重构处理器的SM4-128加密算法的实现方法,包括以下步骤:

(1)分析SM4-128加密算法的计算特点,并归纳出数据流图;

(2)确定数据流图之后,针对可重构处理器的硬件特点,在了解其各寄存器、运算器以及各功能模块的作用机制的情况下配置可重构处理器,并生成配置信息;

(3)通过微处理器将配置信息以及所需要的各种初始数据存入相应的存储器中;

(4)最后微处理器启动可重构处理器,并将配置信息及数据发送给可重构处理器;

(5)当可重构处理器完成当前任务后,发送中断信号。

该实现方法基于SM4-128加密算法方法,需要将其转化为数据流图,并制定SM4-128加密算法方法的数据输入方式,然后根据数据流图和数据输入方式对应特定的可重构系统处理器生成相应的配置信息,通过配置可重构阵列块将SM4-128加密算法映射到该阵列上,由此实现SM4-128加密算法方法。

以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述 实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号