声明
摘要
插图目录
表格目录
本论文专用术语的注释表
第一章 绪论
1.1 论文的研究背景
1.1.1 毫米波无线通信技术的发展
1.1.2 基于GPU高性能并行计算的研究现状
1.2 论文的内容安排
1.3 数学符号约定
第二章 IEEE 802.11aj SC-MIMO物理层收发机关键技术
2.1 引言
2.2 发射机模块
2.2.1 扰码器
2.2.2 LDPC编码器
2.2.3 块补零
2.2.4 流解析
2.2.5 星座映射
2.2.6 空间扩展
2.2.7 脉冲成型
2.3 接收机模块
2.3.1 均衡检测
2.3.2 LDPC译码器
2.4 本章小结
第三章 MIMO接收机均衡检测算法的并行化优化设计
3.1 引言
3.2 系统模型
3.3 低复杂度复数矩阵求逆算法方案
3.3.1 Givens旋转变换
3.3.2 SDF-SGR算法方案设计
3.3.3 回代算法
3.3.4 矩阵求逆
3.4 复杂度分析
3.5 仿真结果
3.6 本章小结
第四章 基于混合多核架构的大维矩阵求逆算法实现
4.1 引言
4.2 混合多核架构模型
4.2.1 CPU线程与GPU线程
4.2.2 多核与众核
4.2.3 外部存储器
4.2.4 缓存
4.2.5 主机与设备
4.2.6 线程结构
4.2.7 CUDA软件体系
4.2.8 CUDA存储器模型
4.3 基于混合多核架构的快速并行化矩阵求逆实现方案
4.3.1 CUDA初始化
4.3.2 调用device端的kernell进行并行计算
4.3.3 在host端计算上三角矩阵U的逆矩阵
4.3.4 调用device端的kernel2进行并行计算
4.4 仿真结果
4.5 本章小结
第五章 基于IEEE 802.11aj的包编码的译码方案设计及GPU实现
5.1 引言
5.2 基于LDPC码的包编码方案
5.2.1 码块分割方法
5.2.2 LDPC编码
5.2.3 数据包编码
5.2.4 比特选择方法
5.3 LDPC译码方案
5.3.1 置信传播(BP)译码算法基本原理
5.3.2 解比特选择
5.3.3 分层修正最小和译码算法
5.3.4 Min-Sum算法计算错误码块的软比特信息
5.4 基于GPU的包编码译码方案实现
5.4.1 CUDA初始化
5.4.2 调用device端kernell函数进行解比特选择
5.4.3 基于分层修正最小和算法对每个LDPC码字译码的并行化实现
5.4.4 host端基于Min-Sum算法更新错误码块的软比特信息
5.5 仿真结果
5.5.1 译码性能仿真
5.5.2 GPU并行实现性能仿真
5.6 本章小结
第六章 全文总结
附录
参考文献
作者攻读硕士学位期间的研究成果
致谢