首页> 中文学位 >基于CUDA的三角形并行处理
【6h】

基于CUDA的三角形并行处理

代理获取

目录

文摘

英文文摘

声明

第1章序言

1.1 实时渲染图形流水线

1.1.1基于可编程着色器(programmable shader)的图形流水线

1.1.2统一着色器(Unified-Shader)架构

1.2 GPU硬件优化机制

1.2.1顶点高速缓存(Vertex Cache)

1.2.2提前深度剔除(Early-Z Culling)

1.3 CUDA简介

1.3.1 CUDA与DirectX、OpenGL协同工作

1.4基于GPU的并行三角形处理

1.4.1基于几何着色器的并行三角形处理

1.4.2基于相邻三角形图元的改进算法

1.4.3使用CUDA实现并行三角形处理

第2章预处理算法

2.1 GPU内存的合并访问(coalesced access)

2.1.1合并访问规则

2.1.2选取合适的合并访问方式

2.2 网格分块算法简介

2.3预处理算法

2.3.1相关顶点与相关三角形

2.3.2网格分块算法

2.3.3顶点重排序算法

2.3.4预处理算法实现细节

2.3.5支持GPU硬件优化机制

2.4预处理算法实验数据及讨论

2.4.1预处理算法运行时间与讨论

2.4.2 ACMR与MOVR数据讨论

2.4.3预处理算法结果

2.5 本章总结

第3章优化实时渲染图形算法

3.1 CUDA与图形流水线协同工作

3.2基于CUDA的背向面剔除优化

3.2.1算法实现细节

3.2.2实验数据分析与讨论

3.3优化阴影映射(shadow mapping)算法

3.3.1算法实现细节

3.3.2实验数据分析与讨论

3.4优化边缘边提取(silhouette extraction)算法

3.4.1算法实现细节

3.4.2实验数据分析与讨论

3.5本章总结

第4章论文总结与展望

4.1预处理算法

4.2优化实时渲染应用

4.3展望

参考文献

在读期间发表的学术论文

致 谢

展开▼

摘要

虚拟现实、游戏等应用通常使用三角形作为渲染图元。几何着色器的引入使得当前图形流水线支持三角形图元的并行处理。但是,数据必须经过整个图形流水线才能得到最终运算结果。同时,基于图形API的算法实现也不利于运算结果的重用。本文提出基于CUDA的三角形并行处理,本文的主要工作为以下两个部分:
   1.三角形网格预处理算法
   使用CUDA实现三角形并行处理的瓶颈是顶点数据的读取。基于当前GPU硬件特性,数据在合并访问(coalesced access)时有最高效率。本文针对GPU内存模型提出了一个两步骤的三角形网格预处理算法:首先将三角形网格划分为大小一致的三角形组(cluster)。然后基于分组结果将顶点缓存(vertex buffer)重新排序。
   预处理算法使得在运行时能够以合并读取的方式将三角形组的所有顶点一齐读入共享内存(shared memory),随后的顶点读取操作便可以在高速的共享内存中执行。
   2.优化实时渲染算法
   基于高效的顶点读取方法实现了背向面剔除及边缘边提取算法,并将CUDA运算的结果与图形流水线结合以优化实时渲染应用。实验数据显示,该方法对基于三角形图元的实时渲染应用有显著的加速效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号