掌桥科研
一站式科研服务平台
科技查新
收录引用
专题文献检索
外文数据库(机构版)
更多产品
首页
成为会员
我要充值
退出
我的积分:
中文会员
开通
中文文献批量获取
外文会员
开通
外文文献批量获取
我的订单
会员中心
我的包量
我的余额
登录/注册
文献导航
中文期刊
>
中文会议
>
中文学位
>
中国专利
>
外文期刊
>
外文会议
>
外文学位
>
外国专利
>
外文OA文献
>
外文科技报告
>
中文图书
>
外文图书
>
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
美国国防部AD报告
美国能源部DE报告
美国航空航天局NASA报告
美国商务部PB报告
外军国防科技报告
美国国防部
美国参联会主席指示
美国海军
美国空军
美国陆军
美国海军陆战队
美国国防技术信息中心(DTIC)
美军标
美国航空航天局(NASA)
战略与国际研究中心
美国国土安全数字图书馆
美国科学研究出版社
兰德公司
美国政府问责局
香港科技大学图书馆
美国海军研究生院图书馆
OALIB数据库
在线学术档案数据库
数字空间系统
剑桥大学机构知识库
欧洲核子研究中心机构库
美国密西根大学论文库
美国政府出版局(GPO)
加利福尼亚大学数字图书馆
美国国家学术出版社
美国国防大学出版社
美国能源部文献库
美国国防高级研究计划局
美国陆军协会
美国陆军研究实验室
英国空军
美国国家科学基金会
美国战略与国际研究中心-导弹威胁网
美国科学与国际安全研究所
法国国际关系战略研究院
法国国际关系研究所
国际宇航联合会
美国防务日报
国会研究处
美国海运司令部
北约
盟军快速反应部队
北约浅水行动卓越中心
北约盟军地面部队司令部
北约通信信息局
北约稳定政策卓越中心
美国国会研究服务处
美国国防预算办公室
美国陆军技术手册
一般OA
科技期刊论文
科技会议论文
图书
科技报告
科技专著
标准
其它
美国卫生研究院文献
分子生物学
神经科学
药学
外科
临床神经病学
肿瘤学
细胞生物学
遗传学
公共卫生&环境&职业病
应用微生物学
全科医学
免疫学
动物学
精神病学
兽医学
心血管
放射&核医学&医学影像学
儿科
医学进展
微生物学
护理学
生物学
牙科&口腔外科
毒理学
生理学
医院管理
妇产科学
病理学
生化技术
胃肠&肝脏病学
运动科学
心理学
营养学
血液学
泌尿科学&肾病学
生物医学工程
感染病
生物物理学
矫形
外周血管病
药物化学
皮肤病学
康复学
眼科学
行为科学
呼吸学
进化生物学
老年医学
耳鼻喉科学
发育生物学
寄生虫学
病毒学
医学实验室检查技术
生殖生物学
风湿病学
麻醉学
危重病护理
生物材料
移植
医学情报
其他学科
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
主题
主题
题名
作者
关键词
摘要
高级搜索 >
外文期刊
外文会议
外文学位
外国专利
外文图书
外文OA文献
中文期刊
中文会议
中文学位
中国专利
中文图书
外文科技报告
清除
历史搜索
清空历史
首页
>
外文会议
>
ACM international conference on supercomputing
ACM international conference on supercomputing
召开年:
2012
召开地:
Venice(IT)
出版时间:
-
会议文集:
-
会议论文
热门论文
全部论文
全选(
0
)
清除
导出
1.
Message from the General Co-chairs
机译:
联合主席致辞
作者:
Utpal Banerjee
;
Kyle A. Gallivan
会议名称:
《ACM international conference on supercomputing》
|
2012年
2.
Message from the Program Chairs
机译:
计划主席的话
作者:
Gianfranco Bilardi
;
Manolis Katevenis
会议名称:
《ACM international conference on supercomputing》
|
2012年
3.
High Performance Supercomputers: Should the Individual Processor be More than a Brick?
机译:
高性能超级计算机:单个处理器应该不仅仅是一块砖?
作者:
Yale N. Patt
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
exascale;
transformation hierarchy;
abstraction layers;
microarchitecture;
compiler;
run-time;
instruction level parallelism;
4.
Distributed Replay Protocol for Distributed Uniprocessors
机译:
分布式单处理器的分布式重播协议
作者:
Mengjie Mao
;
Hong An
;
Bobin Deng
;
Tao Sun
;
Xuechao Wei
;
Wei Zhou
;
Wenting Han
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Selective replay;
selective recovery;
selective re-execution;
data misspeculation;
distributed uniprocessors;
5.
Characterizing and Improving the Use of Demand-Fetched Caches in GPUs
机译:
表征和改善GPU中按需获取的缓存的使用
作者:
Wenhao Jia
;
Kelly A. Shaw
;
Margaret Martonosi
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
GPU cache;
CUDA;
GPGPU;
compiler optimization;
6.
One Stone Two Birds: Synchronization Relaxation and Redundancy Removal in GPU-CPU Translation
机译:
一石二鸟:GPU-CPU转换中的同步松弛和冗余删除
作者:
Ziyu Guo
;
Bo Wu
;
Xipeng Shen
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
GPU-CPU translation;
heterogeneous computing;
redundancy removal;
synchronization;
optimization;
7.
Fast Loop-level Data Dependence Profiling
机译:
快速循环级数据依赖分析
作者:
Hongtao Yu
;
Zhiyuan Li
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Software parallelization;
profiling;
data dependence;
instrumentation;
8.
Apricot: An Optimizing Compiler and Productivity Tool for x86-compatible Many-core Coprocessors
机译:
杏:用于x86兼容的多核协处理器的优化编译器和生产率工具
作者:
Nishkam Ravi
;
Yi Yang
;
Tao Bao
;
Srimat
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Intel MIC;
Compiler;
Offload;
Many-core;
Optimizations;
9.
UniFI: Leveraging Non-Volatile Memories for a Unified Fault Tolerance and Idle Power Management Technique
机译:
UniFI:利用非易失性存储器实现统一的容错和空闲电源管理技术
作者:
Somayeh Sardashti
;
David A. Wood
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Energy;
Reliability;
Checkpointing;
Idle power management;
10.
Fault Tolerant Preconditioned Conjugate Gradient for Sparse Linear System Solution
机译:
稀疏线性系统解决方案的容错预处理共轭梯度
作者:
Manu Shantharam
;
Sowmyalatha Srinivasmurthy
;
Padma Raghavan
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Algorithm based fault tolerance;
Iterative methods;
Soft errors;
11.
Data-driven Fault Tolerance for Work Stealing Computations
机译:
数据驱动的工作窃取容错
作者:
Wenjing Ma
;
Sriram Krishnamoorthy
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
fault tolerance;
load balancing;
work stealing;
12.
Fault Resilience of the Algebraic Multi-Grid Solver
机译:
代数多网格求解器的故障恢复能力
作者:
Marc Casas
;
Bronis R. de Supinski
;
Greg Bronevetsky
;
Martin Schulz
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Algebraic Multi-Grid Solver;
Resilience;
Transient Faults;
13.
Overcoming Single-Thread Performance Hurdles in the Core Fusion Reconfigurable Multicore Architecture
机译:
克服核心融合可重配置多核体系结构中的单线程性能障碍
作者:
Janani Mukundan
;
Saugata Ghose
;
Robert Karmazin
;
Engin ipek
;
Jose F. Martinez
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
microarchitecture;
multicore;
software diversity;
Core Fusion;
collective commit;
instruction steering;
genetic programming;
14.
CATS: Cache Aware Task-Stealing based on Online Profiling in Multi-socket Multi-core Architectures
机译:
CATS:基于多套接字多核体系结构中在线分析的缓存感知任务窃取
作者:
Quan Chen
;
Minyi Guo
;
Zhiyi Huang
会议名称:
《》
|
2012年
关键词:
Cache Aware;
Task-stealing;
Online Profiling;
Multi-socket Multi-core;
Cache misses;
15.
CVP: An Energy-Efficient Indirect Branch Prediction with Compiler-Guided Value Pattern
机译:
CVP:具有编译器指导的值模式的节能间接分支预测
作者:
Mingxing Tan
;
Xianhua Liu
;
Dong Tong
;
Xu Cheng
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Indirect branch prediction;
compiler-guided value pattern;
16.
Congestion Avoidance on Manycore High Performance Computing Systems
机译:
Manycore高性能计算系统上的拥塞避免
作者:
Miao Luo
;
Dhabaleswar K. Panda
;
Khaled Z. Ibrahim
;
Costin lancu
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Congestion;
Avoidance;
Management;
High Performance Computing;
Manycore;
Multicore;
InfiniBand;
Cray;
17.
Channel Borrowing: An Energy-Efficient Nanophotonic Crossbar Architecture with Light-Weight Arbitration
机译:
通道借用:具有轻型仲裁功能的节能纳米光子交叉开关架构
作者:
Yi Xu
;
Jun Yang
;
Rami G Melhem
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Network-on-Chip;
Nauophotonics;
Crossbar;
18.
HiRe: Using Hint Release to Improve Synchronization of Speculative Threads
机译:
雇用:使用提示和释放来改善推测线程的同步
作者:
Liang Han
;
Xiaowei Jiang
;
Wei Liu
;
Youfeng Wu
;
James Tuck
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Synchronization;
Dependence Prediction;
Thread-Level Speculation;
multi-core architecture;
19.
Enhancing the Performance of Assisted Execution Runtime Systems through Hardware/Software Techniques
机译:
通过硬件/软件技术提高辅助执行运行时系统的性能
作者:
Gokcen Kestor
;
Roberto Gioiosa
;
Osman Unsal
;
Adrian Cristal
;
Mateo Valero
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Exascale;
Assisted execution;
Transactional Memory;
Performance;
20.
Hardware Support for Enforcing Isolation in Lock-Based Parallel Programs
机译:
在基于锁的并行程序中执行隔离的硬件支持
作者:
Paruj Ratanaworabhan
;
Martin Burtscher
;
Darko Kirovski
;
Benjamin Zorn
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Race detection and toleration;
hardware support for reliability;
transactional memory;
21.
CRQ-based Fair Scheduling on Composable Multicore Architectures
机译:
可组合多核架构上基于CRQ的公平调度
作者:
Tao Sun
;
Hong An
;
Tao Wang
;
Haibo Zhang
;
Xiufeng Sui
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Composable Multicore;
Fair Scheduling;
Resource Allocation;
Centralized Run Queue;
22.
Quantifying the Effectiveness of Load Balance Algorithms
机译:
量化负载均衡算法的有效性
作者:
Olga Pearce
;
Todd Gamblin
;
Bronis R. de Supinski
;
Martin Schulz
;
Nancy M. Amato
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
load balance;
performance;
modeling;
simulation;
framework;
23.
Sparse Matrix-Vector Multiply on the HICAMP Architecture
机译:
HICAMP体系结构上的稀疏矩阵-向量乘法
作者:
John P. Stevenson
;
Amin Firoozshahian
;
Alex Soiomatnikov
;
Mark Horowitz
;
David Cheriton
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
SpMV;
Deduplication;
HICAMP;
24.
On the Communication Complexity of 3D FFTs and its Implications for Exascale
机译:
3D FFT的通信复杂性及其对万亿级的影响
作者:
Kenneth Czechowski
;
Casey Battaglino
;
Chris McClanahan
;
Kartik Iyer
;
P.-K. Yeung
;
Richard Vuduc
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
FFT;
Exascale;
Performance Model;
25.
Composable, non-Blocking Collective Operations on Power7 IH
机译:
Power7 IH上可组合的非阻塞集体操作
作者:
Gabriel Tanase
;
Gheorghe Almasi
;
Hanhong Xue
;
Charles Archer
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Hybrid;
Composition;
Collectives;
Parallel;
Libraries;
Messaging;
26.
Collective Algorithms for Sub-communicators
机译:
子通信器的集体算法
作者:
Anshul Mittal
;
Nikhil Jain
;
Thomas George
;
Sameer Kumar
;
Yogish Sabharwal
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Collectives;
Torus;
Sub-communicators;
27.
Space-Round Tradeoffs for MapReduce Computations
机译:
MapReduce计算的空间取舍
作者:
Andrea Pietracaprina
;
Geppino Pucci
;
Matteo Riondato
;
Francesco Silvestri
;
Eli Upfal
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
MapReduce;
tradeoff;
sparse and dense matrix multiplication;
matrix inversion;
matching;
28.
An Analysis of Computational Workloads for the ORNL Jaguar System
机译:
ORNL Jaguar系统的计算工作量分析
作者:
Wayne Joubert
;
Shi-Quan Su
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
HPC;
workload;
applications;
science;
Cray;
ORNL;
metrics;
petascale;
exascale;
scaling;
29.
Unified Memory Optimizing Architecture: Memory Subsystem Control with a Unified Predictor
机译:
统一内存优化架构:具有统一预测器的内存子系统控制
作者:
Yasuo Ishii
;
Mary Inaba
;
Kei Hiraki
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
multi-core processor;
data prefetching;
cache management;
memory access scheduling;
30.
Blue Gene/Q: Design for Sustained Multi-Petaflop Computing
机译:
Blue Gene / Q:可持续的多Petaflop计算设计
作者:
Michael Gschwind
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Blue Gene;
Blue Gene/Q;
petascale computing;
memory wall;
power wall;
scalability wall;
communication wall;
reliability wall;
SIMD;
quad-vector processing unit (QPU);
quad-vector processing extensions (QPX);
transactional memory;
speculative execution;
interconnection networks;
design for reliability;
supercomputing applications;
31.
Multiple Sub-Row Buffers in DRAM: Unlocking Performance and Energy Improvement Opportunities
机译:
DRAM中的多个子行缓冲器:释放性能和能源改进机会
作者:
Nagendra Gulur
;
R Manikantan
;
Mahesh Mehendale
;
R Govindarajan
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
DRAM;
Memory Performance;
Multi-Core Architecture;
32.
Exploiting Communication and Packaging Locality for Cost-effective Large Scale Networks
机译:
利用通信和包装本地性来构建具有成本效益的大型网络
作者:
Keith D. Underwood
;
Eric Borch
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
interconnection networks;
topology;
cube collective;
33.
Locality Utility Co-optimization for Practical Capacity Management of Shared Last Level Caches
机译:
共享的最后一级缓存的实际容量管理的位置和实用程序协同优化
作者:
Dongyuan Zhan
;
Hong Jiang
;
Sharad C. Seth
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Chip Multiprocessors;
Shared Last Level Caches;
Practical Capacity Management;
Locality Utility Co-Optimization;
34.
High-Performance Code Generation for Stencil Computations on GPU Architectures
机译:
用于GPU架构上模版计算的高性能代码生成
作者:
Justin Holewinski
;
Louis-Noeel Pouchet
;
P. Sadayappan
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
GPU;
OpenCL;
Overlapped Tiling;
Stencils;
DSL;
35.
An Efficient Work-Distribution Strategy for Gridding Radio-Telescope Data on GPUs
机译:
用于在GPU上网格化无线电望远镜数据的高效工作分配策略
作者:
John W. Romein
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Gridding;
sky image;
convolutions;
GPU;
36.
cISpMV: A Cross-Platform OpenCL SpMV Framework on GPUs
机译:
cISpMV:GPU上的跨平台OpenCL SpMV框架
作者:
Bor-Yiing Su
;
Kurt Keutzer
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
clSpMV;
OpenCL;
GPU;
SpMV;
Sparse Matrix Format;
Autotuner;
Cocktail Format;
37.
GPU Merge Path - A GPU Merging Algorithm
机译:
GPU合并路径-GPU合并算法
作者:
Oded Green
;
Robert McColl
;
David A. Bader
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Parallel algorithms;
Parallel systems;
Graphics processors;
Measurement of multiple-processor systems;
38.
SnuCL: An OpenCL Framework for Heterogeneous CPU/GPU Clusters
机译:
SnuCL:用于异构CPU / GPU集群的OpenCL框架
作者:
Jungwon Kim
;
Sangmin Seo
;
Jun Lee
;
Jeongho Nah
;
Gangwon Jo
;
Jaejin Lee
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
OpenCL;
Clusters;
Heterogeneous computing;
Programming models;
39.
Enabling and Scaling Matrix Computations on Heterogeneous Multi-Core and Multi-GPU Systems
机译:
在异构多核和多GPU系统上启用和缩放矩阵计算
作者:
Fengguang Song
;
Stanimire Tomov
;
Jack Dongarra
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
Heterogeneous algorithms;
hybrid CPU-GPU architectures;
numerical linear algebra;
runtime systems;
40.
An Optimized Large-Scale Hybrid DGEMM Design for CPUs and ATI GPUs
机译:
针对CPU和ATI GPU的优化的大型混合DGEMM设计
作者:
Jiajia Li
;
Xingjian Li
;
Guangming Tan
;
Mingyu Chen
;
Ninghui Sun
会议名称:
《ACM international conference on supercomputing》
|
2012年
关键词:
High Performance Computing;
Heterogeneous Architecture;
GPU;
DGEMM;
41.
Small-Ruleset Regular Expression Matching on GPGPUs: Quantitative Performance Analysis and Optimization
机译:
GPGPU中的小规则定期表达式匹配:定量性能分析和优化
作者:
Jamin Naghmouchi
;
Daniele Paolo Scarpazza
;
Mladen Berekovic
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
algorithms;
design;
performance;
42.
Streamlining GPU Applications On the Fly: Thread Divergence Elimination through Runtime Thread-Data Remapping
机译:
简化GPU应用程序:通过运行时线程重新映射通过运行时的线程消除
作者:
Eddy Z. Zhang
;
Yunlian Jiang
;
Ziyu Guo
;
Xipeng Shen
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
GPGPU;
thread divergence;
thread-data remapping;
CPU-GPU pipelining;
data transformation;
43.
High-throughput Bayesian Network Learning using Heterogeneous Multicore Computers
机译:
使用异构多核计算机的高吞吐量贝叶斯网络学习
作者:
Michael D. Linderman
;
Vivek Athalye
;
Teresa H. Meng
;
Narges Bani Asadi
;
Robert Bruggner
;
Garry P. Nolan
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
GPU;
MCMC;
bayesian networks;
44.
Adaptive Multi-Level Cache Allocation in Distributed Storage Architectures
机译:
分布式存储体系结构中的自适应多级缓存分配
作者:
Ramya Prabhakar
;
Shekhar Srikantaiah
;
Mahmut Kandemir
;
Christina Patrick
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
storage cache;
multi-level;
multi-server;
SLO;
I/O;
45.
FPGA Accelerating Double/Quad-Double High Precision Floating-Point Applications for ExaScale Computing
机译:
FPGA加速DiCe /四倍双高精度浮点应用,用于Exascale Computing
作者:
Yong Dou
;
Yuanwu Lei
;
Guiming Wu
;
Song Guo
;
Jie Zhou
;
Li Shen
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
double-double precision;
quad-double precision;
high precision floating-point multiplication and accumulation (HP-MAC);
FPGA;
46.
ParaLearn: A Massively Parallel, Scalable System for Learning Interaction Networks on FPGAs
机译:
ParaLearn:用于在FPGA上学习交互网络的大规模平行,可扩展系统
作者:
Narges Bani Asadi
;
John Wawrzynek
;
Christopher W. Retcher
;
Wing H. Wong
;
Greg Gibeling
;
Garry P. Nolan
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
FPGA;
bayesian networks;
markov chain monte carlo;
re-configurable computing;
signal transduction networks;
47.
Evaluation of Parallel H.264 Decoding Strategies for the Cell Broadband Engine
机译:
对细胞宽带发动机并行H.264解码策略的评价
作者:
Chi Ching Chi
;
Ben Juurlink
;
Cor Meenderinck
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
H.264;
video;
decoding;
cell;
parallel;
programming;
48.
Compiler and Runtime Support for Enabling Generalized Reduction Computations on Heterogeneous Parallel Configurations
机译:
编译器和运行时支持在异构并行配置上启用通用减少计算
作者:
Vignesh T. Ravi
;
Wenjing Ma
;
David Chiu
;
Gagan Agrawal
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
generalized reductions;
dynamic work distribution;
multi-cores;
GPGPU;
49.
Speeding Up Nek5000 with Autotuning and Specialization
机译:
使用自动调速和专业加快NEK5000
作者:
Jaewook Shin
;
Chun Chen
;
Mary W. Hall
;
Paul F. Fischer
;
Jacqueline Chame
;
Paul D. Hovland
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
empirical performance tuning;
autotuning;
specialization;
50.
Timing Local Streams: Improving Timeliness in Data Prefetching
机译:
定时本地流:提高数据预取的及时性
作者:
Huaiyu Zhu
;
Yong Chen
;
Xian-He Sun
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
data prefetching;
cache memory;
prefetching simulation;
prefetching performance;
51.
InterferenceRemoval: Removing Interference of Disk Access for MPI Programs through Data Replication
机译:
干涉缺点:通过数据复制去除MPI程序的干扰
作者:
Xuechen Zhang
;
Song Jiang
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
MPI program;
MPI-IO;
and I/O interference;
52.
Cache Oblivious Parallelograms in Iterative Stencil Computations
机译:
缓存在迭代模版计算中忽略了平行四边形
作者:
Robert Strzodka
;
Mohammed Shaheen
;
Dawid Pajak
;
Hans-Peter Seidel
;
z
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
memory wall;
memory bound;
stencil;
time skewing;
temporal blocking;
cache oblivious;
parallelism and locality;
53.
Large-Scale FFT on GPU Clusters
机译:
GPU集群上的大型FFT
作者:
Yifeng Chen
;
Xiang Cui
;
Hong Mei
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
FFT;
GPU clusters;
array dimensions;
54.
Decomposable and Responsive Power Models for Multicore Processors using Performance Counters
机译:
使用性能计数器的多核处理器的可分解和响应电源模型
作者:
Ramon Bertran
;
Marc Gonzalez
;
Xavier Martorell
;
Nacho Navarro
;
Eduard Ayguade
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
power estimation;
performance counters;
55.
Optimal Bucket Algorithms for Large MPI Collectives on Torus Interconnects
机译:
Torus互连大MPI集体的最佳桶算法
作者:
Nikhil Jain
;
Yogish Sabharwal
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
MPI;
collective;
communication;
torus network;
56.
Fast and Accurate NCBI BLASTP: Acceleration with Multiphase FPGA-Based Prefiltering
机译:
快速准确的NCBI BLASTP:加速与基于多相FPGA的预过滤器
作者:
Atabak Mahram
;
Martin C. Herbordt
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
FPGA-based coprocessors;
high performance reconfigurable computing;
bioinformatics;
biological sequence alignment;
57.
Overlapping Communication and Computation by Using a Hybrid MPI/SMPSs Approach
机译:
通过使用混合MPI / SMPS方法来重叠通信和计算
作者:
Vladimir Marjanovic
;
Jesus Labarta
;
Eduard Ayguade
;
Mateo Valero
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
parallel programming model;
MPI;
hybrid MPI/SMPSs;
LINPACK;
58.
Making Nested Parallel Transactions Practical using Lightweight Hardware Support
机译:
使用轻量级硬件支持使嵌套并行事务实用
作者:
Woongki Baek
;
Nathan Bronson
;
Christos Kozyrakis
;
Kunle Olukotun
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
transactional memory;
nested parallelism;
parallel programming;
59.
Static Reuse Distances for Locality-based Optimizations in MATLAB
机译:
MATLAB中基于位置的优化的静态重用距离
作者:
Arun Chauhan
;
Chun-Yu Shei
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
memory hierarchy;
locality;
compilers;
MATLAB;
60.
Clustering Performance Data Efficiently at Massive Scales
机译:
在大规模尺度上有效地聚类性能数据
作者:
Todd Gamblin
;
Bronis R. de Supinskr
;
Martin Schulz
;
Rob Fowler
;
Daniel A. Reed
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
algorithms;
measurement;
performance;
61.
Handling Task Dependencies Under Strided and Aliased References
机译:
处理任务依赖性在中行和锯齿引用
作者:
Josep M. Perez
;
Rosa M. Badia
;
Jesus Labarta
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
regions;
domains;
discontiguous data;
region tree;
dependencies;
tasks;
parallelism;
62.
The Auction: Optimizing Banks Usage in Non-Uniform Cache Architectures
机译:
拍卖:在非统一缓存架构中优化银行使用情况
作者:
Javier Lira
;
Carlos Molina
;
Antonio Gonzalez
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
chip multiprocessors (CMP);
non-uniform cache architecture (NUCA);
bank replacement policy;
63.
An Approach to Resource-Aware Co-Scheduling for CMPs
机译:
用于CMP的资源感知共调度的方法
作者:
Major Bhadauria
;
Sally A. McKee
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
CMP;
scheduling;
performance;
energy efficiency;
64.
SAMS Multi-Layout Memory: Providing Multiple Views of Data to Boost SIMD Performance
机译:
SAMS多布局内存:提供多个数据视图以提升SIMD性能
作者:
Chunyang Gou
;
Georgi Kuzmanoy
;
Georgi N. Gaydadjiev
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
design;
performance;
65.
Exascale Science: The Next Frontier in High Performance Computing
机译:
Exascale Science:高性能计算的下一个边疆
作者:
Stephen S. Pawlowski
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
exascale systems;
memory and storage bandwidth;
millions of cores;
power consumption;
software scalability;
system resiliency;
66.
Quantifying Performance Benefits of Overlap using MPI-2 in a Seismic Modeling Application
机译:
在地震建模应用中使用MPI-2量化重叠的性能效益
作者:
Sreeram Potluri
;
Ping Lai
;
Karen Tomko
;
Sayantan Sur
;
Yifeng Cui
;
Mahidhar Tatineni
;
Karl W. Schulz
;
William L. Barth
;
Amitava Majumdar
;
Dhabhaleswar K. Panda
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
MPI-2;
one-sided;
RDMA;
latency hiding;
67.
A Compiler-automated Array Compression Scheme for Optimizing Memory Intensive Programs
机译:
用于优化内存密集型程序的编译器自动化阵列压缩方案
作者:
Lixia Liu
;
Zhiyuan Li
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
compression;
memory intensive programs;
adaptive code selection;
bandwidth consumption reduction;
compiler implementation;
68.
Enigma: Architectural and Operating System Support for Reducing the Impact of Address Translation
机译:
ENIGMA:架构和操作系统支持减少地址转换的影响
作者:
Lixin Zhang
;
Evan Speight
;
Ram Rajamony
;
Jiang Lin
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
design;
69.
Indemics: an Interactive Data Intensive Framework for High Performance Epidemic Simulation
机译:
Indemics:高性能流行模拟的互动数据密集型框架
作者:
Keith R. Bisset
;
Jiangzhuo Chen
;
Xizhou Feng
;
Yifei Ma
;
Madhav V. Marathe
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
parallel computation;
interactive computation;
infectious disease;
network dynamics;
modeling and simulation;
70.
An Empirically Tuned 2D and 3D FFT Library on CUDA GPU
机译:
CUDA GPU上的经验调整的2D和3D FFT库
作者:
Liang Gu
;
Xiaoming Li
;
Jakob Siegel
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
2D FFT;
3D FFT;
library generation;
empirical tuning;
GPU;
CUDA;
71.
An Experimental Approach to Performance Measurement of Heterogeneous Parallel Applications using CUDA
机译:
使用CUDA的异构平行应用性能测量的实验方法
作者:
Allen D. Malony
;
Scott Biersdorff
;
Wyatt Spear
;
Shangkar Mayanglambam
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
performance tools;
GPGPU;
profiling;
tracing;
72.
How to Unleash Array Optimizations on Code Using Recursive Data Structures
机译:
如何使用递归数据结构释放阵列优化
作者:
Harmen L.A. van der Spek
;
C.W. Mattias Holm
;
Harry A.G. Wijshoff
会议名称:
《ACM international conference on supercomputing》
|
2010年
关键词:
pointer optimization;
control flow optimization;
restructuring compilers;
recursive data structures;
73.
SRC: Damaris - Using Dedicated I/O Cores for Scalable Post-petascale HPC Simulations
机译:
SRC:Damaris - 使用专用I / O核心用于可扩展的PetaScale HPC模拟
作者:
Matthieu Dorier
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
exascale computing;
multicore architectures;
I/O;
dedicated cores;
74.
Poster: DVFS Management in Real-Processors
机译:
海报:实际处理器中的DVFS管理
作者:
Vasileios Spiliopoulos
;
Georgios Keramidas
;
Stefanos Kaxiras
;
Konstantinos Efstathiou
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
dynamic voltage and frequency scaling;
performance and power modeling;
performance monitoring hardware;
intel and AMD processors;
75.
Challenges and Opportunities in Renewable Energy and Energy Efficiency
机译:
可再生能源和能源效率的挑战和机遇
作者:
Steven Hammond
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
renewable;
energy;
efficiency;
climate;
76.
Hystor: Making the Best Use of Solid State Drives in High Performance Storage Systems
机译:
HYSTOR:在高性能存储系统中充分利用固态驱动器
作者:
Feng Chen
;
David Koufaty
;
Xiaodong Zhang
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
solid state drive;
hard disk drive;
hybrid storage system;
77.
F~2BFLY: An On-Chip Free-Space Optical Network with Wavelength-Switching
机译:
F〜2bfly:带波长切换的片上自由空间光网络
作者:
Jin Ouyang
;
Chuan Yang
;
Dimin Niu
;
Yuan Xie
;
Zhiwen Liu
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
free-space optical interconnects;
network-on-chip;
78.
SRC: Automatic Extraction of SST/macro Skeleton Models
机译:
SRC:SST /宏骨架模型的自动提取
作者:
Amruth Rudraiah Dakshinamurthy
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
algorithms;
performance;
design;
experimentation;
human factors;
verification;
79.
SRC: Soft Error Detection and Recovery for High Performance Linpack
机译:
SRC:高性能LINPACK的软错误检测和恢复
作者:
Teresa Davies
;
Zizhong Chen
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
high performance linpack benchmark;
LU factorization;
fault tolerance;
algorithm-based recovery;
80.
Multiset Signatures for Transactional Memory
机译:
交易记忆的多立签
作者:
Ricardo Quislant
;
Eladio Gutierrez
;
Oscar Plata
;
Emilio L. Zapata
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
hardware transactional memory;
signatures;
bloom filters;
H3 hashing;
locality of reference;
81.
Optimizing the Datacenter for Data-Centric Workloads
机译:
优化数据中心以数据中心工作负载
作者:
Stijn Polfliet
;
Frederick Ryckbosch
;
Lieven Eeckhout
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
datacenter;
data-centric workloads;
workload characterization;
heterogeneity;
82.
Predictive Coordination of Multiple On-Chip Resources for Chip Multiprocessors
机译:
芯片多处理器多芯片资源的预测协调
作者:
Jian Chen
;
Lizy K. John
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
microprocessor;
resource management;
program characteristics;
performance modeling;
83.
A Composite and Scalable Cache Coherence Protocol for Large Scale CMPs
机译:
大规模CMP的复合和可扩展高速缓存相干协调协议
作者:
Yi Xu
;
Yu Du
;
Youtao Zhang
;
Jun Yang
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
cache coherence protocol;
thousand-core;
CMP;
optical network;
nanophotonics;
84.
Generic Topology Mapping Strategies for Large-scale Parallel Architectures
机译:
大型并行架构的通用拓扑映射策略
作者:
Torsten Hoefler
;
Marc Snir
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
topology mapping;
MPI graph topologies;
85.
Automatic SIMD Vectorization of Fast Fourier Transforms for the Larrabee and AVX Instruction Sets
机译:
Larrabee和AVX指令集快速傅里叶变换的自动SIMD矢量化
作者:
Daniel S. McFarlin
;
Volodymyr Arbatov
;
Franz Franchetti
;
Markus Puschel
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
autovectorization;
super-optimization;
SIMD;
program generation;
fourier transform;
86.
The Elephant and the Mice: The Role of Non-Strict Fine-Grain Synchronization for Modern Many-Core Architectures
机译:
大象和小鼠:非严格的细粒度同步对现代多核架构的作用
作者:
Juergen Ributzka
;
Yuhei Hayashi
;
Joseph B. Manzano
;
Guang R. Gao
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
design;
87.
SRC: FenixOS - A Research Operating System Focused on High Scalability and Reliability
机译:
SRC:Fenixos - 一种专注于高可扩展性和可靠性的研究操作系统
作者:
Stavros Passas
;
Sven Karlsson
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
operating systems;
performance;
reliability;
88.
Poster: Programming Clusters of GPUs with OmpSs
机译:
海报:使用ompss的GPU的编程簇
作者:
Javier Bueno
;
Alejandro Duran
;
Xavier Martorell
;
Eduard Ayguade
;
Rosa M. Badia
;
Jesus Labarta
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
heterogeneous architectures;
89.
Karma: Scalable Deterministic Record-Replay
机译:
业力:可扩展的确定性记录重播
作者:
Arkaprava Basu
;
Jayaram Bobba
;
Mark D. Hill
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
deterministic record-replay;
multi-core processors;
90.
Active Pebbles: Parallel Programming for Data-Driven Applications
机译:
活动鹅卵石:数据驱动应用程序的并行编程
作者:
Jeremiah J. Willcock
;
Torsten Hoefler
;
Nicholas Edmonds
;
Andrew Lumsdaine
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
irregular applications;
programming models;
active messages;
91.
A QHD-Capable Parallel H.264 Decoder
机译:
有效的平行H.264解码器
作者:
Chi Ching Chi
;
Ben Juurlink
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
H.264;
4k× 2k;
decoding;
cell;
NUMA;
SMP;
parallel;
92.
Rethinking Shared-Memory Languages and Hardware
机译:
重新思考共享内存语言和硬件
作者:
Sarita V. Adve
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
cache coherence;
determinism;
memory consistency;
memory models;
93.
High Performance Linpack Benchmark:A Fault Tolerant Implementation without Checkpointing
机译:
高性能LINPACK基准:没有检查点的容错实现
作者:
Teresa Davies
;
Christer Karlsson
;
Hui Liu
;
Chong Ding
;
Zizhong Chen
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
high performance linpack benchmark;
LU factorization;
fault tolerance;
algorithm-based recovery;
94.
Page Placement in Hybrid Memory Systems
机译:
混合内存系统中的页面放置
作者:
Luiz Ramos
;
Eugene Gorbatov
;
Ricardo Bianchini
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
design;
performance;
95.
SRC: OpenSHMEM Library Development
机译:
SRC:OpenShmem图书馆开发
作者:
Swaroop Pophale
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
ICS poster;
SHMEM;
openSHMEM;
PGAS;
96.
SRC: Information Retrieval as a Persistent Parallel Service on Supercomputer Infrastructure
机译:
SRC:信息检索作为超级计算机基础架构上的持久并行服务
作者:
Tobias Berka
;
Marian Vajtersic
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
vector space model;
symmetric multiprocessing;
dense vector computations;
message passing interface;
97.
Coordinating Processor and Main Memory for Efficient Server Power Control
机译:
协调处理器和高效服务器电源控制的主存储器
作者:
Ming Chen
;
Xiaorui Wang
;
Xue Li
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
power control;
server;
power capping;
memory;
data center;
98.
SRC: Virtual I/O Caching: Dynamic Storage Cache Management for Concurrent Workloads
机译:
SRC:Virtual I / O缓存:用于并发工作负载的动态存储缓存管理
作者:
Michael R. Frasca
;
Ramya Prabhakar
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
storage cache;
I/O performance;
99.
Performance Impact and Interplay of SSD Parallelism through Advanced Commands,Allocation Strategy and Data Granularity
机译:
通过高级命令,分配策略和数据粒度的SSD并行性的性能影响和相互作用
作者:
Yang Hut
;
Hong Jiang
;
Dan Feng
;
Lei Tian
;
Hao Luo
;
Shuping Zhang
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
NAND-flash;
SSD;
simulator;
advanced commands;
parallelism;
100.
MP-PIPE: A Massively Parallel Protein-Protein Interaction Prediction Engine *
机译:
MP-管:大规模平行的蛋白质 - 蛋白质相互作用预测引擎*
作者:
A. Schoenrock
;
F. Dehne
;
J.R. Green
;
A. Golshani
;
S. Pitre
会议名称:
《ACM international conference on supercomputing》
|
2011年
关键词:
massively parallel application;
computational biology;
protein interaction prediction;
high throughput;
意见反馈
回到顶部
回到首页