您现在的位置: 首页> 研究主题> 共享存储器

共享存储器

共享存储器的相关文献在1990年到2022年内共计323篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、工业经济 等领域,其中期刊论文107篇、会议论文5篇、专利文献3483420篇;相关期刊74种,包括哈尔滨工程大学学报、西安交通大学学报、机械与电子等; 相关会议5种,包括第八届中国通信学会学术年会、全国计算机在现代科学技术领域应用学术会议、第四届中国通信专用集成电路发展战略高级研讨会等;共享存储器的相关文献由596位作者贡献,包括什尔皮·萨胡、凯普·斯瑞德哈、劳伦·汤马斯等。

共享存储器—发文量

期刊论文>

论文:107 占比:0.00%

会议论文>

论文:5 占比:0.00%

专利文献>

论文:3483420 占比:100.00%

总计:3483532篇

共享存储器—发文趋势图

共享存储器

-研究学者

  • 什尔皮·萨胡
  • 凯普·斯瑞德哈
  • 劳伦·汤马斯
  • 桑杰伊·噶日
  • 毕帕莎·高什
  • 爱德华斯·格温
  • 理查德·泰勒尔
  • 维皮恩·南布迪瑞
  • 尼克希尔·巴拉姆
  • C·A·萨尔兹伯格
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • KE Xuan; SHI Ying; ZHANG Wei; ZHANG Zhen; HE Wei
    • 摘要: 最小二乘逆时偏移算法可对地下复杂构造精确成像,但由于计算量大,目前仍难以在实际资料处理中广泛推广应用,因此研究该方法的高效计算策略具有重要意义.结合Pthread标准,提出了多线程多图形处理器(Graphics Processing Unit,GPU)并行加速策略,在共炮点道集域分解计算任务,由多GPU并行计算并实时更新数据;并结合GPU存储器优化方法,调用GPU端共享存储和寄存器等高速存储器,提高波场模拟的计算效率;最终实现了二维空间的时域最小二乘逆时偏移算法大幅加速计算.分别对Marmousi2截断模型和Marmousi模型进行加速成像测试,结果表明:基于多线程多GPU并行加速的最小二乘逆时偏移算法具有普适性;随着数据规模的增加,该方法的加速效率可逐渐逼近线性加速,数据同步延迟小,加速效率显著.
    • 戴小氐; 王婷
    • 摘要: According to the communication requirements of integrated avionics system onboard the new generation fighter,a data processing module system architecture based on RapidIO network was studied.A communication protocol software adaptive for avionics application mode and based on ARINC653 partition operating system was designed and implemented,which has found practical application in engineering.Function and performance verification showed that it can meet the large-data-volume and high-performance communication requirements in avionic system applications.The communication protocol software is implemented by hierarchical architecture,which is feasible for cross-platform migration,software reusing,and the subsequent hardware upgrading.%针对新一代战斗机综合化航电系统对系统通信的要求,研究了一种基于RapidIO网络的数据处理模块的系统架构,设计并实现了一种满足航电应用模式、基于ARINC653分区操作系统的通信协议软件,并且在工程中得到实际应用,经过功能和性能验证,能够满足航电应用之间大数据、高性能的通信需求.该通信协议软件采用分层架构实现,有利于跨平台移植、软件重用以及后续的硬件升级.
    • 金星; 荆明娥; 曾晓洋
    • 摘要: In order to take full advantage of the communication bandwidth,this paper presents an improved task mapping algorithm based on heterogeneous communication mechanisms for a multicore processor with both Network on Chip(NoC) and shared-memory inter-core communication mechanisms.The proposed algorithm uses the branch and bound algorithm to reduce the search space,and then improves the quality of mapping by iteratively exchanging the positions of the tasks.Experimental results show that,compared with the NMAP algorithm,the communication cost of the proposed algorithm is reduced by an average of 18.3% for random task graphs,and the communication cost can be reduced by up to 30.6% for parallel sorting applications.%为提高结合共享存储器和片上网络进行核间通信的多核处理器的通信带宽使用效率,基于异构通信机制,提出一种改进的任务映射算法.使用分支定界算法缩小搜索空间,通过迭代交换任务的位置提高映射质量.实验结果表明,与NMAP算法相比,该算法对于随机任务图的通信代价平均降低18.3%,对于并行排序应用最高降低30.6%.
    • 高升; 陈月峰
    • 摘要: 针对哲学家就餐问题这一操作系统中进程间通信的经典范例,设计了该范例的一个具有代表性的算法的技术实现方案.方案以Linux操作系统作为运行平台,通过进程而不是线程来体现哲学家的并发行为特征,以自动和随机相结合的灵活自然的人机交互模式模拟哲学家的状态,控制其状态切换;提出了两种形式的哲学家状态监控程序,它们能够生动、直观、准确地表达出哲学家状态的变化过程.字符形式的监控程序在字符终端和图形终端中均可使用,主要面向以超级终端登录到多用户Linux系统的用户;利用QT5开发的动画形式的监控程序适合在桌面Linux的图形终端中使用.
    • 华锋亮
    • 摘要: 针对GPU追求高性能引起的功耗问题,通过分析CUDA的存储模型,提出了将应用程序的变量分别存储在全局存储器和共享存储器的方法对比二者功耗的差异。实验以CUDA实现向量加法为例,利用模拟器模拟这两种方法下的应用程序内核功耗,并对结果进行对比和分析。
    • 华锋亮
    • 摘要: 针对GPU追求高性能引起的功耗问题,通过分析CUDA的存储模型,提出了将应用程序的变量分别存储在全局存储器和共享存储器的方法对比二者功耗的差异。实验以CUDA实现向量加法为例,利用模拟器模拟这两种方法下的应用程序内核功耗,并对结果进行对比和分析。
    • 高伟; 李维良; 林妍
    • 摘要: Aiming at the parallel processing of remote sensing image classification, the existing researches are generally carried out through computer cluster and workstation. These ways have the disadvantage of high cost and are difficult to establish. Only a few researches which are based on GPU mainly intend to demonstrate the availability of this parallel architecture from the perspective of workflow and pay little attention to the significant storage optimization strategies. Directed against the shortages of the existing studies, taking the high performance computing of hyperspectral image clas-sification using the method of spectrum waveform matching and spectral angle mapping based on CUDA for example, this paper places emphasis on researching the optimization strategies of GPU storage and their improvement method. The experimental results show that, the optimization strategies of GPU storage and their improvements are effective, besides, for a variety of images of different sizes and data volume, the efficiency of algorithm has been promoted remarkably com-pared with the situation before these strategies are applied. At the same time, The hyperspectral image classification based on CUDA acquires accurate computing results.%针对高光谱遥感影像分类的并行化处理,现有研究一般是通过集群和工作站来开展,成本较高,部署困难。少数基于GPU方式的研究主要是从流程的角度来论证该并行架构对提高算法效率的有效性,对于算法关键的存储器优化策略等研究相对较少或不详细。针对现有研究的不足,以CUDA架构下高光谱遥感影像的光谱波形匹配法和光谱角填图法分类的高性能计算为例,对算法存储优化策略进行重点研究,深入探讨了一系列存储优化及其改进方法。通过实验论证分析表明:存储优化策略及其改进方法有效,并且对于多种不同尺寸与数据量的影像,CUDA架构下算法的运行效率都有了较为显著的提升。同时,基于CUDA的高光谱影像分类维护了计算结果的准确性。
    • 摘要: 本刊讯 近日,中国第一台关键应用主机浪潮天梭K1系统正式上市。据记者了解。在硬件领域,浪潮设计完成了基于CC—NUMA的多平面全互连紧耦合共享存储器体系结构等关键技术,研制了支持两级目录Cache一致性协议的处理器协同芯片组。建立了中国关键应用主机硬件核心技术群。
    • 张凌洁; 赵英
    • 摘要: Floyd—Warshall算法是图论中APSP(All—Pair Shortest Paths)问题的经典算法,为了加快计算速度,提出使用GPU通用计算来实现。文章先从算法的原理入手,层层深入,提出了可以在GPU上运行的并行F—W算法。之后,又根据矩阵分块的原理和GPU共享存储器的使用,实现了改进的GPU并行F—W算法。通过大量测试实验,得到了该GPU并行程序相对于传统CPU并行程序产生超过百倍的加速比的结论。%How to use GPU-based Floyd-Warshall algorithm to deal with the APSP (All-Pair Shortest Paths) problem in graph theory is introduced. First, on the basis of the principle of F-W algorithm, its parallelized version is put forwards on GPU. Then, according to the matrix segmentation and the exploit of the shared memory in GPU, an improved parallel version of F-W algorithm on GPU is introdctced. At last, we make a comprehensive comparison and analysis of these algorithms, the speedup is over 100x.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号