首页> 中文学位 >高性能浮点除法及基本函数功能部件的研究
【6h】

高性能浮点除法及基本函数功能部件的研究

代理获取

目录

文摘

英文文摘

独创性声明和关于论文使用授权的说明

致谢

第一章引言

1.1问题的提出

1.2浮点除法部件在处理器中的重要性

1.2.1计算周期的影响

1.2.2编译器的影响

1.3基本函数功能部件在处理器中的重要性

1.4论文的基本架构

第二章实现除法和基本函数功能部件的算法概述

2.1 引言

2.2数字循环算法

2.2.1恢复余数算法

2.2.2不恢复余数法

2.2.3 SRT算法

2.2.4数字循环算法总结

2.3函数叠代算法

2.3.1 Newton-Raphson算法

2.3.2 Goldschmidt算法

2.3.3函数叠代算法舍入处理

2.3.4函数叠代算法小结

2.4极大基数算法(Very High RadixAlgorithms)

2.4.1精确商的逼近方法

2.4.2短位倒数的方法

2.4.3极大基数算法小结

2.5本章小结

第三章减小SRT除法算法时间延迟的方法

3.1引言

3.2 SRT除法算法

3.2.1 SRT除法算法的基本定义

3.2.2实现除法SRT算法的几个重要参数

3.2.3商的处理

3.3小基数SRT除法算法的传统结构及商选择函数的基本实现

3.4大基数SRT除法算法的传统实现以及优化

3.5小基数SRT算法的优化

3.6大基数SRT算法的优化

3.7实验环境及其结果

3.8小基数SRT算法的进一步优化

3.7本章小结

第四章减少SRT除法和开根算法循环次数的方法

4.1引言

4.2背景介绍

4.2.1除法的SRT算法

4.2.2开根的SRT算法

4.2.3改进SRT-4除法和开根算法结构的依据

4.3每次循环结果为“0”的百分比

4.4 SRT-4除法和开根的改进结构

4.5与传统结构关于时延和面积的对比

4.5.1与传统结构关于面积的比较

4.5.2与传统结构关于时延的比较

4.6进一步改进

4.7本章小结

第五章得到初始值逼近方法的概述

5.1引言

5.2直接查表法

5.3多项式逼近法

5.3.1线性逼近法

5.3.2二阶逼近法

5.4基于多表相加的逼近方法

5.5本章小结

第六章基于多表相加逼近得到初始值的方法

6.1引言

6.2 SBTM,STAM逼近方法及其改进的逼近方法

6.3 CSTAM方法

6.3.1基本介绍

6.3.2 CSTAM方法的误差分析

6.4 CSTAM方法得到初始值需要的查找表大小分析

6.5 CSTAM方法和SBTM,STAM方法的对比

6.5.1查找表大小的对比

6.5.2时间延迟的对比

6.6 CSTAM方法的进一步优化

6.6.1基本介绍

6.6.2误差分析

6.6.3查找表需要位数的大小及其对比

6.6.4对比说明

6.7 FPGA实现及其面积比较

6.8本章小结

第七章多项式逼近得到初始值的方法

7.1引言

7.2多段法逼近得到初始值

7.2.1二段法逼近得到初始值

7.2.2三段法逼近得到初始值

7.2.3四段法逼近得到初始值

7.3多段法逼近得到初始值的误差分析

7.4多段法逼近得到初始值方法的硬件需求分析及其比较

7.5与以前多项式逼近方法的对比

7.5.1 CPM方法

7.5.2对比结果

7.6本章小结

第八章不同基数的SRT算法和不同初始值的函数叠代算法实现的浮点除法部件关于面积,性能以及功耗的评估

8.1引言

8.2.背景介绍

8.2.1 SRT算法简介

8.2.2 Newton-Raphson算法简介

8.3得到13,16以及24位初始值的方法

8.3.1得到13,16位初始值的方法

8.3.2得到24位初始值的方法

8.4 SRT和Newton-Raphson算法各个设计的具体实现

8.4.1 SRT算法各个设计的具体实现

8.4.2 Newton-Raphson算法各个设计的具体实现

8.5实验介绍及其结果

8.5.1实验介绍

8.5.2计算周期对比

8.5.3面积对比

8.5.4功耗对比

8.5.5对比结论

8.6本章小结

第九章结束语

9.1本文的工作和主要贡献

9.2进一步的工作

参考文献

作者简历

展开▼

摘要

随着VLSI技术的发展,针对各个方面应用的处理器相继提出,特别是DSP,MMP等专用处理器.这些处理器对性能的要求使得除法和基本函数功能部件作为其中独立的运算部件成为可能.同时,除法和基本函数功能部件的性能也是影响这些处理器整体性能的一个重要方面.各种应用的处理器对计算速度,芯片面积以及功耗大小有不同的要求,这对除法和基本函数功能部件的设计提出了相应的要求.实现除法和基本函数功能部件的常用算法有两类,其中一类是数字循环方法,另一类是函数叠代方法.数字循环方法是使用基于减法的循环算法每次产生一个商数字;函数叠代方法是使用基于乘法方面的循环算法逼近精确结果.对于数字循环算法来说,实现该算法需要的时间延迟可以决定整个处理器的频率;实现该算法的计算周期可以影响整个处理器的性能.所以,在算法需要的计算周期不变的情况下,减少时间延迟;或者在时间延迟增加很小的情况下(增大后的时间延迟在处理器整体设计对时间延迟约束的范围内),减小算法需要的计算周期,对整个处理器的性能影响比较大.针对以前SRT算法的实现方法和结构,该文提出两种改进结构:一种结构可以减少SRT关键路径上的时间延迟;另一种结构在增加很少时间延迟的情况下,能够减少SRT-4算法(该算法是处理器中使用比较多的SRT算法)的循环次数.对于函数叠代算法(包括Newtow-Raphson和Goldschmid算法)来说,决定该算法性能的主要方面之一就是初始值的位数.如果初始值的位数越长,需要的循环次数就越少,实现该算法需要的计算周期也越少;如果初始值的位数越短,需要的循环次数就越多,实现该算法需要的计算周期也越多.得到初始值的方法很多,主要包括两种,一种是适合于得到较短位数初始值的基于多表相加逼近方法,另外一种是适合于得到较长位数初始值的多项式逼近方法.该文给出这两种不同类型的改进方法.对于基于多表相加逼近方法来说,该文给出的优化方法可以减少查找表需要的位数;对于多项式逼近方法来说,该文给出的新型方法可以减少需要的面积和时间延迟.对于这些方法,该文给出了详细的数学分析和严格的实验证明.最后,该文对采用不同参数设计的处理器中常用的浮点除法部件,其中包括基为4,8,16的SRT算法和初始值位数长度分别为13,16,24位的Newton-Raphson算法,在速度,面积和功耗上进行了详细的比较,并给出了相应的结论.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号