面向软基带的高性能并行计算及其体系结构关键技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着多媒体应用和无线通信的快速发展，人们希望通过移动设备获得更多的服务和更高的传输速率，比如实现视频通话、观看网络高清视频等功能。同时，由于区域的不同性和无线网络标准的快速演进，导致目前多种无线通信标准共存发展的现象，多标准网络空中接口的无缝连接成为必要，这就要求无线通信信号处理器具有更高的性能和灵活性。传统的专用集成电路（ASIC)方案能够提供最优的性能功耗比，但较长的设计周期，以及较弱的可编程和可配置性使得其难以兼容多种协议和适应通信协议快速发展的现状。软基带处理器能够在同一个硬件平台上通过改变程序来实现不同算法和通信协议，被认为是未来基带信号处理器发展的方向。随着无线通信标准的不断演进，数据传输速率不断提高，同时协议之间的差异性也越来越大，其对基带处理器的吞吐率、灵活性、功耗提出了更高的要求。特别是对于移动设备，由于电池的容量和功率有限，要求基带处理器具有更高的性能功耗比。这些要求对软基带信号处理器的设计带来了前所未有的挑战。因此，研究面向软基带的高性能、低功耗、可编程的信号处理器体系结构技术具有重要的理论和实际意义。
　　本文在分析了多种无线通信协议特征的前提下，选择了比较普遍使用的第三代无线通信（3G) WCDMA协议，以及即将大规模商用的第四代无线通信（4G) LTE协议作为研究和实现的对象，对这两种协议的基带处理算法的计算复杂度、并行性、访存特征进行了详细的分析，特别地对以OFDM调制解调、MIMO均衡、FIR滤波，卷积算法等算法为代表的高效能体系结构，专用指令集系统、可配置数据并行体系结构、多核处理器的核间通信和同步机制等四个方面进行了重点研究。本文主要的研究成果和创新点包括：
　　1提出了一种可扩展的，具有固定混洗模式的并行FFT蝶形运算体系结构。本文采用分段处理的方式对FFT算法进行分解，每段包含多个蝶形运算组。向量处理以蝶形运算组为计算单位，每次只有在蝶形运算组的开始与结束才访问数据存储器，而蝶形运算组内计算的数据保存在本地寄存器当中，这种方法有效地减少了访存次数，从而降低了计算功耗。同时，通过调整FFT数据流图，使得蝶形运算组内具有固定的混洗模式，简化了向量处理单元之间的数据混洗模式和程序映射。并且在蝶形运算组内采用常数乘法器实现复数乘法，进一步降低了处理器的运算功耗。实验结果表明，本文所提出的并行FFT蝶形运算结构获得了 lllnJ/FFT的计算效能，优于当前的其他FFT处理结构，同时面积开销也较小。
　　2提出了一种面向MIMO均衡算法的高效率，高吞吐率的并行运算结构。针对MIMO均衡算法当中大量的小规模矩阵计算，本文采用One Tone Per Lane(OMPL)策略进行映射，有效地减少向量处理单元之间的数据传输量。同时提出了一种可配置的本地寄存器文件，其能够对2x2的矩阵数据同时进行和列访问，而整个寄存器文件只有两个写端口和两个读端口，结合向量处理单元的复数向量运算，在运行4x4天线配置和64QAM调制的MIMO均衡算法时，矩阵逆运算吞吐率达到95MInVerSion/S，高于传统方案近一倍。同时处理器的面积效率（吞吐率除以面积）的提升超过了100％，系统整体吞吐率达到300MbpS，满足LTE协议的要求。
　　3提出了基于软基带信号处理的统一并行计算架构-USCA，其采用超长指令字(Very Large Instruction Word，VLIW)和单指令流多数据流（Single Instruction Multiple Data，SIMD)技术开发目标应用的指令级并行和数据级并行。USCA采用了标量和向量的混合控制和处理模式，支持纯标量、纯向量以及标量向量混合执行的三种运算模式。并且针对算法中要求不同的数据处理粒度，本文提出一种可配置的向量处理器单元，SIMD功能单元可以根据不同指令进行动态配置，支持字节向量、半字向量、复数向量的运算操作。同时，设计中充分利用了资源共享来减少硬件面积，提高硬件的利用率，并保持系统的灵活性。实验结果表明，USCA并行体系结构的运算性能和效能分别达到130Gops和323Mops/s，相比于其他参考文献，U S C A具有更高的计算性能和效率，并且算法映射过程更加简单。
　　4提出了一种面向软基带的多核处理器体系结构，实现了一种基于分布式共享存储的高效核间同步机制和快速核间通信机制。核间同步机制采用一个小容量的共享便签式存储器作为存储介质，结合信号灯的控制思想实现同步。其以较小的面积开销提供了点到点、点对多、多对一同步机制。快速核间通信机制CoDMA能够实现核间数据的高速传输，并且对于核间连续等量数据交换操作，支持核间双向数据传输，在不开辟临时缓冲区的情况下，直接在原数据地址进行数据交换。实验数据表明，CoDMA获得了最大76%的性能提升和可节省43%的存储器使用，而它本身面积只占系统的0.59%，同时能够减少了系统运行功耗。

著录项

作者
陈艇;
展开▼
作者单位

国防科学技术大学;

展开▼
授予单位国防科学技术大学;
学科电子科学与技术
授予学位博士
导师姓名刘衡竹;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类运算器和控制器（CPU）;
关键词
软基带; 多核处理器; 并行计算; 信号处理; 多输入多输出; 均衡算法; 正交频分复用;
入库时间 2022-08-17 10:46:52

相似文献

中文文献
外文文献
专利

1. 高性能并行计算机体系结构的典型的DSM系统—SPP1200／XA [J] . 王文义 ,王若雨 . 郑州工业大学学报 . 1998,第003期
2. 高性能通用微处理器体系结构关键技术研究 [J] . 张民选 ,王永文 ,邢座程 . 计算机研究与发展 . 2006,第006期
3. 面向高性能数值计算的并行计算模型DRAM(h) [J] . 张云泉 . 计算机学报 . 2003,第012期
4. 面向飞行器设计的网络虚拟设计环境的体系结构和关键技术研究 [J] . 李波 ,刘洪 ,林新华 . 计算机应用与软件 . 2008,第012期
5. 面向高性能图形工作站的WebGIS模型关键技术研究 [J] . 傅扬 ,潘敏 ,鹿青 . 电脑编程技巧与维护 . 2015,第002期
6. 大规模并行计算资源管理体系结构的研究 [C] . 卢宇彤 ,朱敏 ,沈志宇 . 第七届全国并行计算学术交流会 . 2003
7. 面向图搜索的并行计算机体系结构关键技术研究与实现 [A] . 唐玉华 . 2018

面向软基带的高性能并行计算及其体系结构关键技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅