首页> 中国专利> 一种大类别深度学习GPU并行加速的方法

一种大类别深度学习GPU并行加速的方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种大类别深度学习GPU并行加速的方法，包括：采用模型并行对深度神经网络结构中的softmax层的模型参数进行训练，每个GPU训练各自的模型分片，各GPU的softmax层之间通过交互模型参数的数据特征，完成深度学习；本发明采用混合式架构，即softmax层之前的所有层级，依然是采用数据并行方式，softmax层采用模型并行方式，突破了大类别深度学习并行运算的瓶颈，克服了在深度神经网络结构中的最后一层全链接层上，进行参数交互的通信成本和花费的通信时间过高的问题，能够在保持原有深度学习效果的同时，大幅度提升模型学习效率，减少GPU占用率。

著录项

公开/公告号CN108108813A

专利类型发明专利
公开/公告日2018-06-01

原文格式PDF
申请/专利权人中国科学院重庆绿色智能技术研究院;
展开▼

申请/专利号CN201711251410.3
发明设计人石宇;徐卉;程诚;周祥东;
展开▼

申请日2017-12-01
分类号G06N3/08(20060101);G06T1/20(20060101);
代理机构上海光华专利事务所(普通合伙);
代理人尹丽云
地址 400714 重庆市北碚区方正大道266号
入库时间 2023-06-19 05:29:54

法律信息

法律状态公告日

法律状态信息

法律状态
2018-06-26

实质审查的生效 IPC(主分类):G06N3/08 申请日:20171201

实质审查的生效
2018-06-01

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种大类别深度学习GPU并行加速的方法 [P] . 中国专利： CN108108813A . 2018-06-01
2. GPU集群深度学习任务并行化方法、装置及电子设备 [P] . 中国专利： CN110399222B . 2022.01.21
3. Parallel graphics system employing multiple graphics processing pipelines with multiple graphics processing units (GPUS) and supporting an object division mode of parallel graphics processing using programmable pixel or vertex processing resources provided with the GPUS [P] . 美国专利： US8497865B2 . 2013-07-30

机译：并行图形系统，其采用具有多个图形处理单元（GPUS）的多个图形处理流水线，并使用GPUS提供的可编程像素或顶点处理资源来支持并行图形处理的对象划分模式。
4. PC-based computing system employing parallelized graphics processing units (GPUS) interfaced with the central processing unit (CPU) using a PC bus and a hardware graphics hub having a router [P] . 美国专利： US7808499B2 . 2010-10-05

机译：基于PC的计算系统，该系统采用并行化图形处理单元（GPUS），该并行化图形处理单元（GPUS）通过PC总线和具有路由器的硬件图形集线器与中央处理单元（CPU）接口
5. Computing system employing a multi-GPU graphics processing and display subsystem supporting single-GPU non-parallel (multi-threading) and multi-GPU application-division parallel modes of graphics processing operation [P] . 美国专利： US9275430B2 . 2016-03-01

机译：采用多GPU图形处理和显示子系统的计算系统，支持单GPU非并行（多线程）和多GPU应用程序分区图形处理操作的并行模式