流处理器
流处理器的相关文献在1993年到2022年内共计299篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、工业经济
等领域,其中期刊论文186篇、会议论文22篇、专利文献3878992篇;相关期刊52种,包括电信技术、电脑迷、计算机工程与科学等;
相关会议13种,包括第十九届计算机工程与工艺年会暨第五届微处理器技术论坛、湖南省第三届研究生创新论坛——信息与控制工程的新理论和新技术分论坛、2010全国开放式分布与并行计算学术年会等;流处理器的相关文献由327位作者贡献,包括张春元、文梅、伍楠等。
流处理器—发文量
专利文献>
论文:3878992篇
占比:99.99%
总计:3879200篇
流处理器
-研究学者
- 张春元
- 文梅
- 伍楠
- 任巨
- 何义
- 杨乾明
- 管茂林
- 荀长庆
- 吴伟
- 张民选
- 邢座程
- 高军
- 杨学军
- 柴俊
- 张明
- 曾献君
- 穆长富
- 衣晓飞
- 阳柳
- 陈庆奎
- 陈海燕
- 马驰远
- 倪晓强
- 唐遇星
- 张承义
- 李勇
- 李晋文
- 蒋江
- 马宇川
- 齐树波
- 叶笑春
- 安述倩
- 庄松林
- 晏小波
- 李京旭
- 毛志刚
- 苏华友
- 范东睿
- 谢憬
- 那丽春
- 邹云晓
- 隋兵才
- 丁晓东
- 全巍
- 刘艳欢
- 吴泉霖
- 吴琼
- 周海亮
- 唐玉华
- 宁宁
-
-
马宇川(文/图)
-
-
摘要:
鉴于处理器性能、技术规格和生产工艺在近年来有突飞猛进的提升,国内科技公司联想科技在近期推出了一款采用新型处理器、专为商务应用打造的整机产品—联想启天M540商务电脑,这款产品最大的特色就是采用AMD最新的锐龙4000系列APU。锐龙4000系列APU采用AMD 7nm Zen 2处理器核心,搭配Radeon Vega显示核心,主要由4核心的锐龙3、6核心的锐龙5、8核心的锐龙7组成。联想启天M540商务电脑选用了其中的锐龙74700G、锐龙5 4600G APU。锐龙7 4700G是其中的旗舰产品,采用8核心、16线程设计,显示核心拥有512个流处理器。
-
-
-
-
摘要:
英伟达(NVIDIA)在费米(Fermi)、开普勒(Kepler)和麦克斯韦(Maxwell)及更早期的显卡架构时代,都是通过“阉割”流处理器、光栅和纹理单元数量的方式,拉开同一时期桌面/移动显卡之间的性能差距。从帕斯卡(PascaI)架构开始,英伟达则采取了桌面/移动显卡“同芯”的策略(图1),但二者之间依旧存在一定的性能差异。那么,为什么移动显卡总是比不上作为老大哥的桌面显卡呢?
-
-
青岚1
-
-
摘要:
也许很难相信,在如今的主流处理器市场主流为42纳米~14纳米工艺,并且正在迈向40纳米和7纳米工艺之时,仍然会有28纳米工艺制造的“新品”上市。这就是AMD最近推岀的新入门级APU:A6-7480和A6-9400,它们配合速龙200GE,构成了比较奇特的AMD入门级产品阵营。
-
-
-
-
-
-
-
摘要:
近日,AMD对外公布了两款全新的锐龙APU产品,Ryzen72800H和Ryzen52600H,这是用于笔记本平台的标压处理器。具体规格方面,Rzyen72800H采用14nm光刻工艺,4核8线程设计,基础频率3.3GHz,加速频率3.8GHz,三级缓存4MB,支持双通道DDR4-3200内存,集成Vega11GPU(704个流处理器,1300MHz),热设计功耗45W(最低可配置35W,最高可配置54W)。Ryzen52600H,4C8T,主频3.2GHz,加速3.6GHz,三缓4MB,集成Vega8GPU(512个流处理器,1100MHz),热设计功耗45W。但是,目前尚不清楚Rzyen72800H和Ryzen52600H将会何时登陆笔记本平台。
-
-
-
-
摘要:
随着比特币的大热,显卡的价格也是一路高歌猛进,贵得“惨无人道”.想想一年前的显卡价格,小编顿时就忍住了“剁手”的冲动.然而家里的老旧台式机已经带不动小编想要玩的游戏了……,这时候又该咋办呢?AMD Ryzen 5 2400G或许是一个不错的选择.
-
-
-
李功丽;
戴紫彬;
徐进辉;
王寿成;
朱玉飞;
李丹
-
-
摘要:
Due to having many NOPs,VLIW(Very Long Instruction Word) exists serious code size expansion problem.As an efficient way to solve this problem,the code compression needs to deal with three key points:improving the compression ratio (CR),simplifying decomposition operations,and relocating the branch target.According to the characteristics of VLIW on stream architecture,a two-dimension (2-D) compression scheme is put forward,where VLIW code is compressed in both vertical and horizontal directions,the horizontal decompression and code execution can be implemented in parallel,and loop entrance addresses are buffered by stack registers.The experiment results illustrate that 2-D compression scheme can resolve code expansion issue effectively.Specifically,it has achieved a 36.48% area reduction of the on-chip instruction memory and a 7.85% area reduction of the CISP system.%VLIW(Very Long Instruction Word)指令因为含有较多的空操作导致严重的代码体积膨胀问题,代码压缩是解决这一问题的有效措施.VLIW代码压缩需要解决三个关键问题,一是提高压缩率;二是降低解压操作对性能的影响;三是分支目标重定位.针对流体系结构上的VLIW指令特点,提出了二维压缩,对VLIW进行垂直与水平两个方向上的压缩,且水平解压可以与代码执行并行,并通过设置堆栈寄存器缓存循环入口地址.实验结果表明二维压缩有效解决了VHW代码体积膨胀问题,可以使指令存储器的面积减少36.48%,并使得整个CISP系统面积减少了7.85%.
-
-
-
- 《2008年中国计算机学会体系结构专委会学术年会(ACA'08)》
| 2008年
-
摘要:
长流分段是提高流处理器上流寄存器文件(Stream Register File,简称SRF)带宽利用率的关键技术.其中,选择合适的优化策略(预取或重用)是确定最优分段的基础.rn 本文以典型的矩阵程序Jacobi和GEMM为例,研究了确定给定程序的优化策略和分段决策的技术,重点研究了有效重用度对程序优化策略选择的影响.实验结果表明,经过长流分段的Jacobi和GEMM程序能够有效避免和隐藏片外访存延迟,提高SRF的带宽利用率。
-
-
- 《2008年中国计算机学会体系结构专委会学术年会(ACA'08)》
| 2008年
-
摘要:
当前传统处理器体系结构已难以满足科学计算的需求.流体系结构适合计算密集型应用,其中媒体应用的适用性已得到验证,而科学计算的适用性仍在探索中.由于流处理器将体系结构细节暴露给程序员,而且相较于媒体程序,科学应用的数据访问方式和数据间依赖关系更为复杂,所以优化更为直接影响着科学应用流程序的性能.rn 本文以流体力学应用QNJ-5、光学应用LADT和Navier-Stokes方程为例进行流化,给出我们的流化方法,并在Isim流模拟器上进行性能模拟,与高性能x86处理器相比,获得了较高加速比,验证了科学计算类应用在流体系结构上的适用性;结合核心合并及核级优化,以QNJ-5的执行热点QMRCGSTAB的流程序为例,进行优化并分析结果,相较于未优化的流程序,优化可以获得更大的性能增益.
-
-
-
-
魏晓娟;
陈庆奎;
王海峰
- 《2010全国开放式分布与并行计算学术年会》
| 2010年
-
摘要:
为了对视频图像质量进行实时评价,在分析现有块效应评价算法基础之上,提出了在流处理器并行环境下视频图像块效应评价算法,采用CUDA技术实现该算法程序.实验结果表明,在NV Geforce GTX280上实现的并行算法比CPU上的串行算法提高了近30倍的效率.证明了CUDA技术在数字图像处理应用中具有极大的潜力,尤其是计算密集型任务处理.
-
-
任巨;
何义;
吴伟;
张春元
- 《2009年全国高性能计算学术年会》
| 2009年
-
摘要:
CAVLC是H.264中熵编码的一种重要实现方式,具有可挖掘的数据级并行特征,但同时具有较强的串行特点。本文分析了CAVLC的程序特征,提出了CAVLC的流式实现方法,并在流处理器STORM-1上进行了实现。实验结果表明本方法能够满足实时高清H.264编码的性能需求。
-
-
- 《2008年中国计算机学会体系结构专委会学术年会(ACA'08)》
| 2008年
-
摘要:
采用流体系结构的处理器Imagine在媒体应用,数字信号处理,科学计算等领域表现优秀,但其在信息安全领域的表现还未有评估.信息安全领域要求尽可快的对信息进行加解密,因此,缩短加解密算法的执行时间有重大意义。rn 本文在Imagine上实现了几种重要的对称分组密码算法:Blowfish,Rijndael,RC5等,以及Base64算法,比较了通用处理器上相应的实现.根据性能对比,我们总结了能够在Imagine上得到较好性能的应用所具备的特征:(1)应用本身具有数据级并行性;(2)核心加密过程无需随机访问数组,或需要随机访问的数组不超过256字.对于满足这两项特征的应用,只要程序设计得当,我们认为完全是能够在流体系结构上获得较好的性能提升的.
-
-
- 《第五届智能CAD与数字娱乐学术会议》
| 2008年
-
摘要:
提出一种新的基于可编程图形处理器的实时细分方法。本方法将复杂的3D模型分解为由几类简单面片组成,且这些简单面片之间是相互独立的,所以每个面片可以独立进行细分操作.因而,本方法具有很好的并行性。而且通过预先定义简单面片的细分模式,还可以加速整个模型执行细分算法的效率。除此之外,本方法将细分算法与可编程图形处理器结合,利用可编程图形处理器中流处理器强大的计算能力和并行处理能力,进一步提高了细分算法的运行效率。
-
-
李海燕;
张春元;
李礼;
刘东
- 《2007年全国高性能计算学术年会》
| 2007年
-
摘要:
流处理器在处理高度并行、计算密集且输入数据较少重用的流应用方面能够取得很好的性能。本文提出一种通用的流执行模型,并以Imagine流处理器和可编程GPU为例验证流执行模型的可用性与有效性。然后,分别在CPU、Imagine模拟器和GPU上实现了8×8离散余弦变换,实验数据表明,流处理器执行的编码效率远超过当前视频应用的实时需求,具有强大的性能优势。