声明
摘要
第1章 绪论
1.1 研究背景
1.1.1 计算机视觉应用的复杂性
1.1.2 多核和众核平台的复杂性
1.1.3 并行开发任务的复杂性
1.2 存在问题和相关研究方向
1.2.1 存在问题
1.2.2 相关研究方向
1.3 主要研究内容和目标
1.4 论文结构和章节安排
第2章 计算机视觉应用并行优化研究现状
2.1 计算机视觉应用特性分析
2.1.1 计算机视觉应用模型
2.1.2 计算机视觉应用负载分析
2.1.3 并行优化关键能力需求
2.2 多核平台并行优化相关研究
2.2.1 多核和众核硬件体系
2.2.2 并行计算模型
2.2.3 并行编程语言和规范
2.2.4 自动优化工具和框架
2.3 并行优化评估方法
2.3.1 并行加速比
2.3.2 负载均衡度
2.4 本章小结
第3章 并行计算模型和优化方法研究
3.1 并行计算模型研究
3.1.1 存在问题
3.1.2 扩展的TStreams模型
3.1.3 并行性描述能力的改进
3.2 并行优化方法研究
3.2.1 FAPOF:并行优化框架
3.2.2 细化的并行优化评估方法
3.3 本章小结
第4章 并行优化核心过程关键技术研究
4.1 并行性抽象和表达
4.1.1 基于扩展模型的中间表达
4.1.2 声明性并行说明语言
4.2 并行性发掘和发现
4.2.1 并行性发掘的基本过程
4.2.2 并行性发掘的规则
4.2.3 并行性发掘的搜索算法
4.3 输入依赖的动态调度
4.3.1 动态输入评估和调度算法
4.3.2 FAPOF动态调度的性能改进
4.4 本章小结
第5章 并行优化框架实现技术研究
5.1 并行优化框架结构
5.2 DSL语言支持
5.2.1 DSL编译器构造
5.2.2 中间表达构建API
5.2.3 骨架中间表达生成
5.3 自动优化工具支持
5.3.1 高层优化(HLO)实现
5.3.2 底层优化(LLO)实现
5.4 运行时环境支持
5.4.1 DWE模块实现
5.4.2 动态调度支持的相关问题
5.5 本章小结
第6章 并行优化关键技术应用和评估
6.1 目标算法与实验平台简介
6.1.1 车辆识别算法简介
6.1.2 多核体系实验平台简介
6.1.3 实验样本和测试方法
6.2 车辆识别算法整体的优化
6.3 基于知识的分割算法的优化和评估
6.3.1 串行算法简介
6.3.2 基于FAPOF的优化
6.3.3 分割算法优化评估
6.4 基于知识的识别算法优化和评估
6.4.1 串行算法简介
6.4.2 基于FAPOF的优化
6.4.3 基于知识的识别算法优化评估
6.5 基于机器学习的识别算法优化和评估
6.5.1 基于机器学习的识别算法简介
6.5.2 基于FAPOF的优化
6.5.3 机器学习算法优化评估
6.6 算法整体的优化性能评估
6.7 小结
第7章 结论
7.1 研究总结
7.2 未来研究方向
参考文献
致谢
作者简介
攻读学位期间发表的论文及科研工作