首页> 中文学位 >面向软基带的高性能并行计算及其体系结构关键技术研究
【6h】

面向软基带的高性能并行计算及其体系结构关键技术研究

代理获取

目录

声明

第 一 章 绪 论

1.1 研究背景

1. 2 相关研究工作

1. 3 本文主要工作

1. 4 论文结构

第二章无线通信算法与体系结构需求分析

2.2 WCDMA系统模型

2.3 3GPP-LTE系统模型

2 .4 算法评测与特征分析

2 .5体系结构需求分析

2 .6 本章小结

第三章高能效并行FFT/IFFT运算体系结构

3.2 FFT/IFFT处理器研究现状

3 .3 并行FFT算法

3 .4 并行蝶形运算体系结构

3 .5 实验结果

3 .6 本章小结

第 四 章 基 于 M IM O均衡的并行体系结构研究与实现

4 .1 引言

4.2 MIMO均衡处理研究现状

4 .3 并行MIMO均衡算法

4 .4 并行MIMO均衡体系结构

4 .5 实验结果与分析

4.6 本章小结

第 五 章 USCA :面向软基带的统一并行计算架构

5 .2 相关研究与思考

5.3 USCA并行体系结构

5.4 USCA数据并行模式

5 .5 性能评测与分析

5 .6 本章小结

第六章分布式存储多核处理器的高效同步和核间通信 机制

6 .1 引言

6 .2 相关研究现状

6 .3 基于SPM的高速核间同步与细粒度数据传输机制

6 .4 无缓冲的核间数据交换机制

6 .5 实验结果

6 .6 本章小结

第七章结束语

7 .1 论文工作总结

7 .2 研究展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

随着多媒体应用和无线通信的快速发展,人们希望通过移动设备获得更多的服务和更高的传输速率,比如实现视频通话、观看网络高清视频等功能。同时,由于区域的不同性和无线网络标准的快速演进,导致目前多种无线通信标准共存发展的现象,多标准网络空中接口的无缝连接成为必要,这就要求无线通信信号处理器具有更高的性能和灵活性。传统的专用集成电路(ASIC)方案能够提供最优的性能功耗比,但较长的设计周期,以及较弱的可编程和可配置性使得其难以兼容多种协议和适应通信协议快速发展的现状。软基带处理器能够在同一个硬件平台上通过改变程序来实现不同算法和通信协议,被认为是未来基带信号处理器发展的方向。随着无线通信标准的不断演进,数据传输速率不断提高,同时协议之间的差异性也越来越大,其对基带处理器的吞吐率、灵活性、功耗提出了更高的要求。特别是对于移动设备,由于电池的容量和功率有限,要求基带处理器具有更高的性能功耗比。这些要求对软基带信号处理器的设计带来了前所未有的挑战。因此,研究面向软基带的高性能、低功耗、可编程的信号处理器体系结构技术具有重要的理论和实际意义。
  本文在分析了多种无线通信协议特征的前提下,选择了比较普遍使用的第三代无线通信(3G) WCDMA协议,以及即将大规模商用的第四代无线通信(4G) LTE协议作为研究和实现的对象,对这两种协议的基带处理算法的计算复杂度、并行性、访存特征进行了详细的分析,特别地对以OFDM调制解调、MIMO均衡、FIR滤波,卷积算法等算法为代表的高效能体系结构,专用指令集系统、可配置数据并行体系结构、多核处理器的核间通信和同步机制等四个方面进行了重点研究。本文主要的研究成果和创新点包括:
  1提出了一种可扩展的,具有固定混洗模式的并行FFT蝶形运算体系结构。本文采用分段处理的方式对FFT算法进行分解,每段包含多个蝶形运算组。向量处理以蝶形运算组为计算单位,每次只有在蝶形运算组的开始与结束才访问数据存储器,而蝶形运算组内计算的数据保存在本地寄存器当中,这种方法有效地减少了访存次数,从而降低了计算功耗。同时,通过调整FFT数据流图,使得蝶形运算组内具有固定的混洗模式,简化了向量处理单元之间的数据混洗模式和程序映射。并且在蝶形运算组内采用常数乘法器实现复数乘法,进一步降低了处理器的运算功耗。实验结果表明,本文所提出的并行FFT蝶形运算结构获得了 lllnJ/FFT的计算效能,优于当前的其他FFT处理结构,同时面积开销也较小。
  2提出了一种面向MIMO均衡算法的高效率,高吞吐率的并行运算结构。针对MIMO均衡算法当中大量的小规模矩阵计算,本文采用One Tone Per Lane(OMPL)策略进行映射,有效地减少向量处理单元之间的数据传输量。同时提出了一种可配置的本地寄存器文件,其能够对2x2的矩阵数据同时进行和列访问,而整个寄存器文件只有两个写端口和两个读端口,结合向量处理单元的复数向量运算,在运行4x4天线配置和64QAM调制的MIMO均衡算法时,矩阵逆运算吞吐率达到95MInVerSion/S,高于传统方案近一倍。同时处理器的面积效率(吞吐率除以面积)的提升超过了100%,系统整体吞吐率达到300MbpS,满足LTE协议的要求。
  3提出了基于软基带信号处理的统一并行计算架构-USCA,其采用超长指令字(Very Large Instruction Word,VLIW)和单指令流多数据流(Single Instruction Multiple Data,SIMD)技术开发目标应用的指令级并行和数据级并行。USCA采用了标量和向量的混合控制和处理模式,支持纯标量、纯向量以及标量向量混合执行的三种运算模式。并且针对算法中要求不同的数据处理粒度,本文提出一种可配置的向量处理器单元,SIMD功能单元可以根据不同指令进行动态配置,支持字节向量、半字向量、复数向量的运算操作。同时,设计中充分利用了资源共享来减少硬件面积,提高硬件的利用率,并保持系统的灵活性。实验结果表明,USCA并行体系结构的运算性能和效能分别达到130Gops和323Mops/s,相比于其他参考文献,U S C A具有更高的计算性能和效率,并且算法映射过程更加简单。
  4提出了一种面向软基带的多核处理器体系结构,实现了一种基于分布式共享存储的高效核间同步机制和快速核间通信机制。核间同步机制采用一个小容量的共享便签式存储器作为存储介质,结合信号灯的控制思想实现同步。其以较小的面积开销提供了点到点、点对多、多对一同步机制。快速核间通信机制CoDMA能够实现核间数据的高速传输,并且对于核间连续等量数据交换操作,支持核间双向数据传输,在不开辟临时缓冲区的情况下,直接在原数据地址进行数据交换。实验数据表明,CoDMA获得了最大76%的性能提升和可节省43%的存储器使用,而它本身面积只占系统的0.59%,同时能够减少了系统运行功耗。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号