首页> 中文学位 >基于嵌入式多核系统的音频解码程序并行化方法
【6h】

基于嵌入式多核系统的音频解码程序并行化方法

代理获取

目录

声明

致谢

摘要

图目录

表目录

1 绪论

1.1 课题背景

1.2 相关工作

1.2.1 并行性分析

1.2.2 并行方案制定

1.2.3 代码生成

1.2.4 运行时管理

1.2.5 多媒体解码程序并行化

1.3 并行化框架

1.4 论文贡献及内容

1.4.1 论文贡献

1.4.2 论文内容

2 并行化分析

2.1 静态源文件分析框架ANTLR

2.2 动态二进制分析框架Valgrind

2.3 整体方案

2.4 程序结构分析

2.4.1 整体介绍

2.4.2 具体实现

2.4.3 程序分析工具对比

2.5 并行区域检测

2.5.1 整体介绍

2.5.2 具体实现

2.6 实验

2.6.1 APE编码算法

2.6.2 APE解码算法

2.6.3 APE解码程序分析

2.6.4 APE解码程序并行区域检测

2.7 本章小结

3 并行化方案

3.1 并行化框架

3.1.1 基本概念

3.1.2 框架介绍

3.2 数据并行

3.2.1 NEON扩展

3.2.2 代码变换

3.3 任务并行

3.3.1 DG转换为DAG

3.3.2 任务调度

3.3.3 任务优先级

3.3.4 处理器选择

3.3.5 代码变换

3.4 流水并行

3.4.1 DG转换为FG

3.4.2 依赖交换

3.4.3 任务调度

3.4.4 代码变换

3.5 实验

3.5.1 APE数据并行

3.5.2 APE任务并行

3.5.3 APE流水并行

3.6 本章小结

4 实验

4.1 实验方法

4.1.1 硬件平台

4.1.2 软件环境

4.1.3 评测程序及输入

4.1.4 对比方案

4.2 实例分析

4.2.1 APE解码程序评测

4.2.2 MP3解码程序评测

4.3 本章小结

5 总结和展望

参考文献

作者攻读硕士期间参加科研工作的情况

展开▼

摘要

随着多核处理器的发展,软件多线程日益成为制约程序性能的瓶颈。鉴于在嵌入式多核处理器上运行的很大一类程序是多媒体解码程序,本文研究对其进行并行化的方法。
  程序并行化包括4个步骤:1)并行性分析,2)并行方案制定,3)代码生成,4)运行时管理。本文重点研究其中的并行性分析部分,包括程序结构分析和并行区域检测两个步骤。
  本文的程序结构分析方法结合了动静态分析,该方法先对代码进行预编译,然后进行动态分析,把开销以注释的形式添加到源代码中,再进行静态分析,建立程序调用图,它以函数和循环为节点,以函数和循环间的调用关系为有向边,节点上的数值代表其开销。得到的程序调用图用于为后续的并行区域检测提供参考。
  本文的并行区域检测方法融合了多种粒度的并行区域检测。对于数据并行,检测对于连续地址的连续读写操作;对于任务并行,检测函数之间的读写依赖关系;对于流水并行,检测循环内各个任务之间的依赖关系。该检测方法基于动态分析,能够避免静态分析所带来的保守估计。
  我们使用APE和MP3解码程序作为实验对象,分别在2核和4核软件模拟器多核平台上进行了评估,分别获得了7.28和3.97的加速比,功耗比则分别为0.29和0.47,在提升速度的同时,也降低了功耗,证实了该方法的有效性和良好的可扩展性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号