首页> 中国专利> 基于DSP芯片的SAR成像系统中矩阵转置方法

基于DSP芯片的SAR成像系统中矩阵转置方法

摘要

本发明公开了一种基于DSP芯片的SAR成像系统中矩阵转置方法,主要解决雷达实时成像存储空间小实时性要求高的问题。其实现过程是:(1)横向划分原始矩阵;(2)纵向划分粗分矩阵;(3)获得单元小方阵;(4)开辟存储空间;(5)对单元小方阵分类;(6)对角单元小方阵转置处理;(7)非对角单元小方阵转置处理;(8)组合转置矩阵。本发明是针对于大规模雷达回波原始数据矩阵的转置运算,通过将大矩阵进行粗细划分为两类单元小方阵并应用不同的转置方法处理,节省了大量存储空间,并提高了运算效率。本发明简单易行,适用于各种雷达实时成像系统和其他系统中的转置运算。

著录项

  • 公开/公告号CN103412284A

    专利类型发明专利

  • 公开/公告日2013-11-27

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201310385864.5

  • 发明设计人 王虹现;方午梅;邢孟道;钱宏博;

    申请日2013-08-29

  • 分类号G01S7/02(20060101);G01S13/90(20060101);

  • 代理机构61205 陕西电子工业专利中心;

  • 代理人田文英;王品华

  • 地址 710071 陕西省西安市太白南路2号

  • 入库时间 2024-02-19 20:56:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-09

    未缴年费专利权终止 IPC(主分类):G01S 7/02 专利号:ZL2013103858645 申请日:20130829 授权公告日:20150520

    专利权的终止

  • 2015-05-20

    授权

    授权

  • 2013-12-18

    实质审查的生效 IPC(主分类):G01S7/02 申请日:20130829

    实质审查的生效

  • 2013-11-27

    公开

    公开

说明书

技术领域

本发明属于通信技术领域,更进一步涉及雷达数字信号处理技术领域中的一 种基于数字信号处理器(Digital Signal Processor DSP)芯片的合成孔径雷达 (Synthetize Aperture Radar SAR)成像系统中矩阵转置方法。本发明可用于 对大规模雷达回波数据进行快速转置,以解决合成孔径雷达成像实时性要求和存 储资源的不足。

背景技术

雷达回波数据矩阵转置数据量大,实时性要求高,但实际情况下处理存储空 间紧缺,所以如何在有限存储空间中实现大规模矩阵的快速转置方法成为亟待解 决的问题,这也为实现实时SAR成像奠定了基础,

江苏芯动神州科技有限公司申请的专利“一种矩阵转置的方法”(公开号: CN102253925A,申请号:201010174342.7,申请日:2010年05月18日)中公 开了一种矩阵转置的方法。该方法首先将待转置的矩阵划分为子矩阵,然后按顺 序从一个子矩阵中每次取出一行数据并将取出的数据逐个放入寄存器中直至全 部行数据放完,再按顺序逐个读取寄存器的数据放于转置后矩阵的对应位置。该 专利申请存在的不足是,由于寄存器空间太小,而利用此方法大规模矩阵转置需 要一块很大的存储空间,所以该方法不适用于大规模矩阵转置运算。

电子科技大学申请的专利“合成孔径雷达成像系统的矩阵转置方法及转置装 置”(公开号:CN103048644A,申请号:201210553860.9,申请日:2012年12 月19日)中公开了一种合成孔径雷达成像系统的矩阵转置方法及转置装置。该 方法首先对合成孔径雷达回波矩阵数据输入,然后对此矩阵进行分割及读写地址 的生成,再将回波矩阵数据写入SDRAM并回波矩阵数据读入输出缓存单元及回 波矩阵数据的转置输出。该专利申请存在的不足是,SDRAM的数据的读入和输 出速度都受总线的宽度约束,而矩阵转置装置需要在SDRAM中为中间变量开辟 大存储空间,所以每次数据搬移会耗费大量时间,这无法满足矩阵转置的实时性。

发明内容

本发明的目的在于针对上述已有技术的不足,提供一种针对雷达实时成像中 大规模雷达回波数据矩阵的快速转置方法,以实现在存储空间紧缺的条件下完成 实时雷达成像处理。

实现本发明的技术思路是:不开辟大存储空间来存放矩阵转置中间变量,将 大规模雷达回波数据原始矩阵粗分块,再将分块的小矩阵进行细划分,得到两类 单元小方阵,并用不同的方法对这两类小方阵进行转置处理,最后将转置后的矩 阵存储在对应DDR3地址上。

实现本发明目的的具体步骤如下:

(1)横向划分原始矩阵:

将存储于DSP芯片外部存储空间中纵向连续的雷达回波数据原始矩阵,按照 DSP芯片处理核的数目横向均分为M个粗分矩阵。

(2)纵向划分粗分矩阵:

将每个粗分矩阵纵向均分为N个初步方阵,得到粗划分后的M×N个初步方 阵。

(3)获得单元小方阵:

将每个初步方阵细均分为多个大小与DSP内部存储空间开辟的存放空间大 小相等的单元小方阵。

(4)开辟存储空间:

开辟四块与单元小方阵大小相同的内部存储空间地址。

(5)对单元小方阵分类:

将每一个初步方阵中位于对角线上的单元小方阵,划分为对角单元小方阵类 别,将位于非对角线上的单元小方阵,划分为非对角单元小方阵类别。

(6)对角单元小方阵转置处理:

6a)从对角单元小方阵类别中取一个对角单元小方阵;

6b)通过DSP芯片内部的直接存储器指令,将所取的对角单元小方阵,从 外部存储空间地址中搬运到步骤(4)所开辟内部存储空间地址中的一块;

6c)对占用内部存储空间地址中的对角单元小方阵进行转置处理,转置后存 储在已开辟的另一块内部存储空间地址中;

6d)通过DSP芯片内部的直接存储器指令,将转置后的对角单元小方阵, 从内部存储空间地址中搬运到该对角单元小方阵原存放的外部存储空间地址中, 释放占用的内部存储空间地址;

6e)判断对角单元小方阵是否取完;若未取完,则执行步骤6a);若取完, 执行步骤(7)。

(7)非对角单元小方阵转置处理:

7a)从非对角单元小方阵类别中,取两个关于对角线对称的非对角单元小方 阵;

7b)通过DSP芯片内部的直接存储器指令,将所取的两个非对角单元小方 阵,从外部存储空间地址中搬运到步骤(4)所开辟的两块内部存储空间地址中;

7c)分别对占用两块内部存储空间地址中的非对角单元小方阵进行转置处 理,转置后存储在已开辟的另两块内部存储空间地址中;

7d)通过DSP芯片内部的直接存储器指令,将转置后的两个非对角单元小 方阵,交叉搬运到原存放的外部存储空间地址中,释放占用的内部存储空间地址;

7e)判断非对角单元小方阵是否取完;若未取完,执行步骤7a);若取完, 则执行步骤(8)。

(8)组合转置矩阵:

8a)依次提取存储在DSP芯片外部存储空间地址中的粗分矩阵中每个初步 方阵的一个纵向数据列;

8b)将所提取的纵向数据列,按照初步方阵的顺序排列,组成雷达回波数据 转置矩阵的一个纵向数据列;

8c)判断初步方阵的纵向数据列是否取完,若未取完,则执行步骤8a)提取 初步方阵的下一列;若取完,得到雷达回波数据转置矩阵的纵向数据块,执行步 骤8d);

8d)将雷达回波数据转置矩阵的纵向数据块,按照DSP芯片M个处理核的 顺序排列,得到雷达回波数据的转置矩阵。

与现有技术相比,本发明具有以下优点:

第一,本发明分别对原始大规模矩阵粗细划分,避免了转置过程中开辟很大 的存储空间的要求,由此克服了现有技术中由于寄存器空间太小,不适用于大规 模矩阵转置运算的不足,使得本发明具有更大的适用范围的优点。

第二,本发明通过对原始矩阵粗细划分为两类单元小方阵,再对划分后小方 阵进行不同的转置运算,克服了现有技术中需要为中间变量开辟大存储空间的缺 点,使得本发明具有节省大量存储空间的优点。

第三,本发明对雷达回波数据原始矩阵划分处理,克服了现有技术实时处理 中数据搬移耗费大量时间的缺点,使得本发明具有处理速度快的优点,进一步提 高雷达成像的实时性。

附图说明

图1是本发明的流程图;

图2是本发明的雷达回波原始数据矩阵粗细划分的示意图;

图3是本发明的对单元小方阵分类示意图;

图4是本发明的对角单元小方阵转置处理示意图;

图5是本发明的非对角单元小方阵转置处理示意图;

图6是本发明的组合转置矩阵示意图。

具体实施方法

下面结合附图对本发明做进一步描述。

参照附图1,本发明的具体步骤如下:

步骤1,横向划分原始矩阵。

将存储于DSP芯片外部存储空间中纵向连续的雷达回波数据原始矩阵,按 照DSP芯片处理核的数目横向均分为M个粗分矩阵。

本发明实例中的雷达回波原始数据矩阵存储于DSP芯片TMS320C6678的外 部存储空间中,纵向连续,纵向点数为nrn,横向点数为nan。根据DSP芯片 TMS320C6678具有并行的八个核的特性,将回波原始数据横向分为八个粗分矩 阵分给八个核。

步骤2,纵向划分粗分矩阵。

由于粗分矩阵不是方阵,将每个粗分矩阵再纵向均分为N个初步方阵, 其中,N为初步方阵的个数,nan为原始回波数据矩阵的横向点 数,nrn为原始回波数据矩阵的纵向点数,M为粗分矩阵的个数,也等于DSP 芯片处理核的数目。

由于本发明的DSP芯片处理核的数目为8,所以本发明的实施例中M=8。

参照图2,可以清晰的看出,本发明将雷达回波数据原始矩阵按纵向划分为 八个粗分矩阵,再横向划分为N个初步方阵。图2是雷达回波原始数据矩阵粗 细划分的示意图,图2中上半部分是指原始矩阵划分为粗分矩阵1、粗分矩阵2、 粗分矩阵3、粗分矩阵4、粗分矩阵5、粗分矩阵6、粗分矩阵7、粗分矩阵8, 共8个粗分矩阵。图2的下半部分是将每个粗分矩阵纵向划分为a1,a2......,aN, 共N个初步方阵。通过对原始矩阵的横向和纵向划分,将原始矩阵划分为8×N个 初步方阵。

步骤3,获得单元小方阵。

通过横向划分和纵向划分两步,雷达回波原始数据矩阵划分成了M×N个初 步方阵。将每个初步方阵细均分为多个大小与DSP内部存储空间开辟的存放空 间大小相等的单元小方阵。本发明实例中针对16384×8192浮点型复数原始回波 矩阵,每个初步方阵的大小为2048×2048,再将初步方阵细分为128×128大小 的单元小方阵,每个初步方阵有16×16个单元小方阵。

根据512KB大小的内部存储空间L2中剩余存储空间的大小,本发明实施例 中单元小方阵大小定为128×128。在本发明的转置运算中,只需要额外开辟四 个128×128浮点型复数大小的数组,其中两个放原始取出来的128×128大小的 单元小方阵,另两个存放转置后的单元小方阵。

步骤4,开辟存储空间。

在内部存储空间L2中开辟四块与单元小方阵大小相同的空间,其中两块存 放从DDR3中取出来的单元小方阵,另两块存放转置后的单元小方阵。

本发明实施例中,在空间总大小为512KB的L2中开辟4个128×128浮点 型复数大小的空间。

步骤5,对单元小方阵分类。

将初步方阵中位于对角线上的单元小方阵,划分为对角单元小方阵类别,将 位于非对角线上的单元小方阵,划分为非对角单元小方阵类别。这样处理是在不 开辟外部存储空间中的数组来存储中间过程的矩阵的条件下,对每个单元小方阵 转置,并对应存储的方式来实现整个原始回波矩阵的转置。

参照图3,可以清晰的看出,本发明将单元小方阵划分为对角单元小方阵和 非对角单元小方阵。图3是对单元小方阵分类示意图,图3中将位于初步矩阵的 对角线上的单位小方阵划分为对角单元小方阵,其余的非对角线上的单元小方阵 划分为非对角单元小方阵。通过这种分类,不同类别单元小方阵可以做不同转置 运算处理。

步骤6,对角单元小方阵转置处理。

6a)从存储在外部存储空间的DDR3的对角单元小方阵类别中取一个对角 单元小方阵;

6b)通过DSP芯片内部的直接存储器指令,将所取的对角单元小方阵,从 外部存储空间地址中搬运到内部存储空间L2中所开辟内部存储空间地址中;

6c)在DSP程序段中调用TI库函数复数浮点型矩阵转置函数 DSPF_sp_mat_trans_cplx对对角单元小方阵进行转置处理,转置后存储在已开辟 的另一块内部存储空间地址中。

对角单元小方阵转置的具体步骤是:

第一步,任取位于单元小方阵中第m行第n列位置上的元素a。

第二步,取出位于单元小方阵中第n行第m列位置上的元素b。

第三步,互换元素a和元素b在单元小方阵中的存储位置,将元素a放于单 元小方阵中第n行第m列位置上,将元素b放于单元小方阵中第m行第n列位置 上。

第四步,判断单元小方阵中所有元素的位置是否交换完毕,若未交换完, 则执行第一步;否则,结束转置处理。

6d)通过DSP芯片内部的直接存储器指令,将转置后的对角单元小方阵, 从内部存储空间地址中搬运到该对角单元小方阵原存放的外部存储空间地址 DDR3中,释放占用的内部存储空间地址;

6e)判断对角单元小方阵是否取完;若未取完,则执行步骤6a);若取完, 执行步骤(7)。

参照图4,对一个对角单元小方阵进行转置运算。图4是对角单元小方阵转 置处理示意图,将图中位于初步矩阵对角线上的对角单位小方阵,从DDR的地 址中搬到L2地址中,并在L2中进行转置运算,再存到原始DDR地址上。通过 这样的处理,所有的对角单元小方阵完成了转置运算。

步骤7,非对角单元小方阵转置处理。

7a)从非对角单元小方阵类别中,利用DMA从外部存储空间地址中DDR3 的原始回波矩阵中取两个关于对角线对称的非对角单元小方阵,如第m行第n 列的小方阵和第n行第m列的小方阵;

7b)通过DSP芯片内部的直接存储器指令,将所取的两个非对角单元小方 阵,搬运到L2中所开辟的两块内部存储空间地址中;

7c)在DSP程序段中调用TI库中复数浮点型矩阵转置函数 DSPF_sp_mat_trans_cplx分别对这两个存储数组中的非对角单元小方阵进行转 置,转置后存储在已开辟的另两块内部存储空间地址中。

每个非对角单元小方阵转置的具体步骤是:

第一步,任取出位于单元小方阵中第m行第n列位置上的元素a。

第二步,取出位于单元小方阵中第n行第m列位置上的元素b。

第三步,互换元素a和元素b在单元小方阵中的存储位置,将元素a放于单 元小方阵中第n行第m列位置上,将元素b放于单元小方阵中第m行第n列位置 上。

第四步,判断单元小方阵中所有元素的位置是否交换完毕,若未交换完, 则执行第一步;否则,结束转置处理。

7d)通过DSP芯片内部的直接存储器指令,将转置后的两个非对角单元小 方阵,交叉搬运到原存放的外部存储空间地址中,释放占用的内部存储空间地址;

7e)判断非对角单元小方阵是否取完;若未取完,执行步骤7a);若取完, 非对角单元小方阵转置完成。

参照图5,对一个非对角单元小方阵进行转置运算。图5是非对角单元小方 阵转置处理示意图,将图中位于初步矩阵对角线对称的两个非对角单位小方阵从 DDR的地址中搬到L2地址中,并在L2中分别进行转置运算,再交叉存到对方 的DDR地址上。所有的非对角单元小方阵通过这样的处理便完成了转置运算。

步骤8,组合转置矩阵。

本发明实施例中单元小方阵全部进行转置处理结束后,2048×2048大小的 初步方阵就得到了转置,雷达回波原始数据矩阵的纵向连续变成了横向连续的雷 达回波转置矩阵。若要得到雷达回波转置矩阵的一个纵向数据列需要组合数据。

组合转置矩阵的具体实现按照以下步骤:

8a)依次提取存储在DSP芯片外部存储空间地址中的粗分矩阵中每个初步 方阵的一个纵向数据列;

8b)将所提取的纵向数据列,按照初步方阵的顺序排列,组成雷达回波数据 转置矩阵的一个纵向数据列;

8c)判断初步方阵的纵向数据列是否取完,若未取完,则执行步骤8a)提取 初步方阵的下一列;若取完,得到雷达回波数据转置矩阵的纵向数据块,执行步 骤8d);

8d)将雷达回波数据转置矩阵的纵向数据块,按照DSP芯片M个处理核的 顺序排列,得到雷达回波数据的转置矩阵。

参照图6,将转置后的初步方阵组合成雷达回波数据转置矩阵。图6是组合 转置矩阵示意图,图中位于粗分矩阵的一个方位向数据转置后变为四个初步方阵 的连续列数据,所以提取雷达回波数据转置矩阵的一个方位向数据,需要分别取 初步方阵的列向量,并按照DSP处理核的顺序组合这些列向量,即得到距离向连 续的回波矩阵的一个方位向数据。

至此,基于DSP芯片的SAR成像系统中矩阵转置方法已经完成。

本发明是基于SAR实时成像处理,简要介绍一下SAR成像的基本步骤为: 第一步求解回波数据矩阵的惯导参数,对距离向连续的回波数据距离脉压,非空 变和空变补偿;第二步将回波数据矩阵转置到方位向连续,变换到距离时域—方 位多普勒域;第三步将回波数据矩阵转置为距离向连续,进行距离徙动校正;第 四步将回波数据矩阵转置到方位向连续,将数据变换到距离时域—方位时域,估 计多普勒调频率并进行方位向脉压。整个SAR实时成像系统需要三次矩阵转置 运算,若能提高矩阵转置运算速度,将极大的提高实时成像的效率。

下面通过测试来对比本发明与传统的转置方法占用存储空间需求及运算时 间比较,进一步说明本发明的效果。

测试1:本发明与传统的转置方法占用存储空间对比。

本测试是基于TMS320C6678的开发板,雷达回波数据原始矩阵距离向连续 (纵向连续)的16384×8192浮点型复数矩阵,距离向点数为16384,方位向点 数为8192。

对TMS320C6678开发板的存储空间大小进行分析。TMS320C6678是一款 具有高性能和丰富的片上资源的数字信号处理器,具有八个处理核,主频高达 1.0GHz。

参照表1,TMS320C6678的存储器包含一个32KB的一级程序存储器(L1P)、 一个32KB的一级数据存储器(L1D)、一个512KB的二级存储器(L2)、4096KB 的多核共享存储空间(MSMC),外接2GB的外部存储空间(DDR3)。

表1:TMS320C6678开发板的存储空间大小

存储空间的大小(字节) 外部存储区DDR3 2G 一级程序存储区L1P 32K 一级数据存储区L1D 32K 二级存储区L2 512K 多核共享存储空间MSMC 4M

雷达回波数据原始矩阵需要1GB存储空间,因此2GB的DDR3刚好存放 ping-pong两组回波数据矩阵。若采用TI库中的转置函数对整个原始矩阵进行转 置,需要在DDR3中开辟一个大小为16384×8192浮点型复数的数组,这极大 的浪费了外部存储空间,而且此开发板的DDR3中也无多余的存储空间。

采用了本发明中的转置方法只需要在总大小为512KB的L2中开辟4个128 ×128浮点型复数大小的数组,其中两个存放从DDR3中取出来的单元小方阵, 另两个存放转置后的单元小方阵。

测试2:本发明与传统的转置方法耗费时间的对比

本测试是基于TMS320C6678的开发板,雷达回波数据原始矩阵距离向连续 的16384×8192浮点型复数矩阵,距离向点数为16384,方位向点数为8192。

比较利用EDMA间隔取方位向一列数据,调用TI库中矩阵转置函数转置后 再连续取方位向一列数据,利用本发明转置方法转置后再取方位向一列数据这三 种不同方法取16384×8192点雷达回波数据原始矩阵中不连续的方位向数据列, 统计并比较运算耗时。

参照表2,利用EDMA间隔取方位向一列数据这种方法矩阵转置加方位向 傅里叶变换所用时间为2.0656e+009时钟周期,调用TI库中矩阵转置函数转置 后再连续取方位向一列数据这种方法矩阵转置加方位向傅里叶变换所用时间为 9.5852e+009时钟周期,利用本发明转置方法转置后再取方位向一列数据这种方 法矩阵转置加方位向傅里叶变换所用时间为1.0311e+009时钟周期。

从表2中可知,调用TI库中复数矩阵转置函数转置后再连续取方位向一列 数据的这种方法,耗时最长,其次是利用EDMA间隔取方位向一列数据的方法, 用时最省的是利用本发明转置方法后取方位向一列数据。

表2:用三种不同的方法取非连续数据列的用时比较

经测试一个8192点复数向量的FFT需要228,220时钟周期,表2中所述时 间减去FFT耗时可知,利用本发明的转置方法能比调用TI库中复数矩阵转置函 数转置后再取方位向一列数据的方法节省近十倍时间,比利用EDMA间隔取方 位向一列数据的方法节省近一半时间。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号