首页> 中国专利> 一种计算机系统、图形处理单元及其图形处理方法

一种计算机系统、图形处理单元及其图形处理方法

摘要

本发明提供一种图形处理单元,包括:一执行单元,用以执行着色处理及纹理读取;一固定功能单元,用以执行一图形渲染管线;一存储器存取单元;一纹理单元,用以依据该执行单元或该固定功能单元的需求通过该存储器存取单元由一存储器读取纹理数据;以及一命令流解析器,用以接收来自一显示驱动程序的一图形指令,并依据该图形指令的类型将该图形指令传送至该执行单元或该固定功能单元以进行图形处理;其中当该图形指令为一特定图形指令时,该命令流解析器仅将该特定图形指令传送至该固定功能单元以进行图形处理,并关闭该执行单元的电源。

著录项

  • 公开/公告号CN104933752A

    专利类型发明专利

  • 公开/公告日2015-09-23

    原文格式PDF

  • 申请/专利权人 上海兆芯集成电路有限公司;

    申请/专利号CN201510366715.3

  • 发明设计人 武凤霞;王渊峰;洪洲;阙恒;

    申请日2015-06-29

  • 分类号

  • 代理机构北京市柳沈律师事务所;

  • 代理人王珊珊

  • 地址 201203 上海市浦东新区张江高科技园区金科路2537号301室

  • 入库时间 2023-12-18 11:00:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-07

    授权

    授权

  • 2015-10-21

    实质审查的生效 IPC(主分类):G06T15/10 申请日:20150629

    实质审查的生效

  • 2015-09-23

    公开

    公开

说明书

技术领域

本发明有关于图形处理单元(Graphics Processing Unit),特别是有关于 可利用特殊图形命令以降低执行单元(Execution Unit)的功耗的一种用于移动 装置的计算机系统、图形处理单元及其图形处理方法。

背景技术

随着科技发展,移动装置(mobile device)亦已变得愈来愈普遍,其中智能 型手机(smartphone)在生活中所扮演的角色也愈来愈重要。然而,智能型手机 的电池充电能力是一门相当重要的课题,也因此设计者需要发展各种方式以 节省智能型手机的电力消耗。

在智能型手机中的图形处理单元(GPU)是一个相当重要的操作数件。一般 而言,图形处理单元的功耗很高,因此需要尽量降低其功耗,以延长智能型 手机的使用时间。

发明内容

本发明提供一种图形处理单元,包括:一执行单元,用以执行着色处理 及纹理读取;一固定功能单元,用以执行一图形渲染管线;一存储器存取单 元;一纹理单元,用以依据该执行单元或该固定功能单元的需求通过该存储 器存取单元由一存储器读取纹理数据;以及一命令流解析器,用以接收来自 一显示驱动程序的一图形指令,并依据该图形指令的类型将该图形指令传送 至该执行单元或该固定功能单元以进行图形处理;其中当该图形指令为一特 定图形指令时,该命令流解析器仅将该特定图形指令传送至该固定功能单元 以进行图形处理,并关闭该执行单元的电源。

本发明更提供一种图形处理方法,用于一图形处理单元,其中该图形处 理单元包括一执行单元,用以执行着色处理及纹理读取;以及一固定功能单 元,用以执行一图形渲染管线,该方法包括:判断该图形处理单元所接收来 自一显示驱动程序的一图形指令是否为一特定图形指令;以及当判断该图形 指令为该特定图形指令时,仅将该特定图形指令传送至该固定功能单元以进 行图形处理,并关闭该执行单元的电源。

本发明更提供一种计算机系统,包括:一中央处理器,用以执行一显示 驱动程序;以及一图形处理单元,包括:一执行单元,用以执行着色处理及 纹理读取;一固定功能单元,用以执行一图形渲染管线;一存储器存取单元; 一纹理单元,用以依据该执行单元或该固定功能单元的数据需求通过该存储 器存取单元由一存储器读取纹理数据;以及一命令流解析器,用以接收来自 一显示驱动程序的一图形指令,并依据该图形指令的类型将该图形指令传送 至该执行单元或该固定功能单元以进行图形处理;其中当该命令流解析器判 断该图形指令为一特定图形指令时,该命令流解析器仅将该特定图形指令传 送至该固定功能单元以进行图形处理,并关闭该执行单元的电源。

附图说明

图1是显示本发明一实施例中的移动装置的计算机系统的方块图。

图2是显示本发明另一实施例中的移动装置的计算机系统的方块图。

图3是显示依据本发明一实施例中的图形处理方法的流程图。

【符号说明】

100:计算机系统;

110:中央处理器;

111:显示驱动程序;

120:图形处理单元;

130:命令流解析器;

140:执行单元;

141:顶点着色器;

142:像素着色器;

143:算术逻辑单元;

144:指令缓存;

145:通用寄存器组;

150:固定功能单元;

151:光栅化单元;

152:插值单元;

153:深度测试单元;

154:写回单元;

155:高速缓存;

160:纹理单元;

170:存储器存取单元。

具体实施方式

为使本发明的上述目的、特征和优点能更明显易懂,下文特举一较佳实 施例,并配合所附图式,作详细说明如下。

图1是显示本发明一实施例中的移动装置的计算机系统的方块图。如图 1所示,计算机系统100包括一中央处理器110及一图形处理单元120,其中 图形处理单元120及中央处理器110所执行的显示驱动程序111例如支持 OpenGL ES标准。图形处理单元120包括一命令流解析器(command stream  parser)130、一执行单元(execution unit)140、一固定功能单元(fixed function  unit)150、一纹理单元160、以及一存储器存取单元(memory access unit)170。 图形处理单元120中的命令流解析器130接收来自计算机系统的中央处理器 (CPU)110执行的显示驱动程序(display driver)111所发出的图形指令,命令流 解析器130并会将图形指令直接传送至执行单元140。执行单元140用以负 责着色执行(shader execution)以及纹理读取(texture loading)的工作。固定功能 单元150用以处理图形渲染管线(graphics rendering pipeline)的各种运算,例如 是光栅化(rasterization)、深度测试(depth test)等等。纹理单元160依据执行单 元140的纹理读取需求,通过存储器存取单元170由存储器中读取所需的纹 理数据供执行单元140使用。

在一实施例中,执行单元140包括一顶点着色器(vertex shader)141、一像 素着色器(pixel shader)142、多个算术逻辑单元(ALU)143、一指令缓存144、 以及一通用寄存器组(common register file)145。顶点着色器141利用顶点信息 建立欲显示的对象的三角形及多边形。像素着色器142依据各种颜色特性处 理每一个像素及改变其颜色值,例如可依据光源的位置及顶点的法线来决定 反射或镜像色值及透明值的功能。算术逻辑单元143进行与图形指令相关的 运算。指令缓存144储存与图形命令相关的各种指令。通用寄存器组145用 以储存欲传送至固定功能单元150的图形数据以及纹理单元160所读取的纹 理数据。

固定功能单元150包括一光栅化单元(rasterization unit)151、一插值单元 (interpolation unit)152、一深度测试单元153、一写回单元(write back unit)154、 以及一高速缓存155。更进一步而言,当顶点着色器141完成其着色处理时, 会将处理后的图形数据传送至固定功能单元150中的光栅化单元151以进行 光栅化。光栅化单元151处理过后的图形数据通过插值单元152插值后传送 回执行单元140的通用寄存器组145进行储存。像素着色器142对储存于通 用寄存器组145的光栅化处理后的图形数据进行像素着色,且像素着色后的 像素数据会再传送回固定功能单元150中的深度测试单元153以进行深度测 试,最后写回单元154将深度测试后的像素数据进行混色(blending)处理,并 通过高速缓存155将最后要显示的画面数据利用存储器存取单元170储存于 一显示存储器(未绘示)。

需注意的是,在上述实施例中处理一般的图形处理指令时,仅有执行单 元140具有接口可与固定功能单元150进行沟通,而且执行单元140需一直 开启。

图2是显示本发明另一实施例中的移动装置的计算机系统的方块图。在 图2中,本发明更揭示了图形数据有别于图1的另一个处理流程,且图1中 的部分数据路径及控制路径在图2中并未使用,其在图2中是用虚线表示。 在另一实施例中,中央处理器110分析在移动装置上进行显示的各种应用程 序的画面,并分类出在着色器、纹理读取、以及混色处理中的固定样式 (pattern)。举例来说,顶点缓冲器(vertex buffer)(未绘示)及顶点着色器141在 特定情况下是较单纯的,例如通常使用具有简单转换及数个基本纹理读取的 几个大三角形。又,像素着色器142在上述特定情况下仅进行一些基本的混 色操作(blending operation),其可被转换至固定功能单元150所常用的函式。

更进一步而言,中央处理器110所执行的显示驱动程序先判断欲进行显 示的应用程序画面的图形指令及混色模式(blending mode)是否属于上述特定 情况,例如判断是否为某些像素类型(primitive type)或是某些特定属性样式 (attribute binding pattern)。若是,中央处理器110所执行的显示驱动程序则将 原本欲在执行单元140中所执行的一般图形指令转换为可直接在固定功能单 元150上所执行的特定图形指令,并将该特定图形指令传送至图形处理单元 120。当命令流解析器130接收到来自显示驱动程序的特定图形指令时,命令 流解析器130直接将该特定图形指令传送至固定功能单元150。此时,因为 后续的图形处理均是由固定功能单元150所进行,命令流解析器130则进一 步关闭执行单元140的电源,藉以降低功耗。

更进一步而言,当显示驱动程序将原本欲在执行单元140中所执行的一 般图形指令转换为可直接在固定功能单元150上所执行的特定图形指令时, 显示驱动程序将欲显示的区域的屏幕坐标、颜色信息、以及纹理坐标均编码 进该特定图形指令。因此,固定功能单元150中的光栅化单元可对该特定图 形指令中的数据进行光栅化处理。接着,颜色信息则通过插值单元152插值 后输出至写回单元154。纹理坐标则是通过插值单元152插值后输出至纹理 单元160。纹理单元160则进行纹理取样及过滤的处理以产生纹理数据,并 将纹理数据传送至写回单元154。

写回单元154同步接收来自插值单元152及纹理单元160的数据,并根 据显示驱动程序所指定的混色模式进行混色运算。最后,写回单元154将混 色处理后的显示数据通过高速缓存155经由存储器存取单元170写入显示存 储器中。

图3是显示依据本发明一实施例中的图形处理方法的流程图。在步骤 S310,判断图形处理单元120所接收来自显示驱动程序111的一图形指令是 否为一特定图形指令。在步骤S320,当判断图形指令为特定图形指令时,仅 将特定图形指令传送至固定功能单元150以进行图形处理,并关闭执行单元 140的电源。

综上所述,本发明提供了一种计算机系统、图形处理单元及其图形处理 方法,其可在欲显示的画面符合某特定类型时,显示驱动程序可将相应的图 形指令转换为仅由固定功能单元所执行的特定图形指令,并同时关闭执行单 元以降低功耗。

本发明虽以较佳实施例揭露如上,然其并非用以限定本发明的范围,任 何所属技术领域中普通技术人员,在不脱离本发明的精神和范围内,当可做 些许的更动与润饰,因此本发明的保护范围当视后附的权利要求书所界定者 为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号