首页> 中国专利> 张量处理方法及相关产品

张量处理方法及相关产品

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请提供一种张量处理的方法及装置，本申请提供的技术方案将高维张量转换成多维张量，实现了高维张量的处理。

著录项

公开/公告号CN112257857A

专利类型发明专利
公开/公告日2021-01-22

原文格式PDF
申请/专利权人中科寒武纪科技股份有限公司;
展开▼

申请/专利号CN201910664091.1
发明设计人不公告发明人;
展开▼

申请日2019-07-22
分类号G06N3/063(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构44202 广州三环专利商标代理有限公司;
代理人郝传鑫;熊永强
地址 100000 北京市海淀区科学院南路6号科研综合楼644室
入库时间 2023-06-19 09:36:59

说明书

技术领域

本申请涉及神经网络领域，尤其涉及一种张量处理方法及相关产品。

背景技术

人工神经网络(Artificial Neural Network，即ANN)，是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点(或称神经元)之间相互联接构成。现有的神经网络的运算基于CPU(Central Processing Unit，中央处理器)或GPU(英文：Graphics Processing Unit，图形处理器)来实现神经网络的运算，现有的神经网络运算无法支持高维张量的运算。

发明内容

本申请实施例提供了一种张量计算方法及相关产品，可以实现高维张量的运算。

第一方面，提供一种张量处理方法，该方法包括：

获取待计算的α维张量以及对人工智能学习库支持的操作，所述α为正整数且α≥5；

将所述α维张量中的至少二个维度映射至β维张量中的目标维度上，所述β为正整数且β≤4；

对所述β维张量执行所述操作，实现所述β维张量处理。。

可选的，所述将所述α维张量中的至少二个维度映射至β维张量中的目标维度上的步骤具体包括：

解析所述操作确定该操作的类型，依据所述类型确定该β维张量中的目标维度，将所述α维张量中的至少二个维度映射至该目标维度。

可选的，所述依据所述类型确定该β维张量中的目标维度具体包括：

如所述操作为算术运算操作或转置操作，确定所述目标维度为所述β维张量中除最内层维度的任一维度。

可选的，如所述β＝4，所述目标维度具体为：第1维度或第-3维度。

可选的，所述算术运算操作包括：乘法操作、加法操作的一种或任意组合。

可选的，所述依据所述类型确定该β维张量的目标维度具体包括：

如所述操作为某维度操作，确定所述目标维度为所述β维张量中除最内层维度和某维度以外的任一维度。

可选的，所述某维度操作具体包括：softmax、reducemax、splite、concat、transpose中的一个或任意组合。

第二方面，提供一种张量处理装置，所述装置包括：

获取单元，用于获取待计算的α维张量以及对人工智能学习库支持的操作，所述α为正整数且α≥5；

解析单元，用于解析所述操作确定该操作的类型；

映射单元，用于将所述α维张量中的至少二个维度映射至β维张量中的目标维度，所述β为正整数且β≤4；

计算单元，用于对所述β维张量执行所述操作，实现所述β维张量处理。

可选的，所述解析单元，具体用于解析所述操作确定该操作的类型，依据所述类型确定该β维张量中的目标维度，将所述α维张量中的至少二个维度映射至该目标维度。

可选的，所述解析单元，具体用于如所述操作为算术运算操作或转置操作，确定所述目标维度为所述β维张量中除最内层维度的任一维度。

可选的，如所述β＝4，所述目标维度具体为：第2维度或第-3维度。

可选的，所述算术运算操作包括：乘法操作、加法操作的一种或任意组合。

可选的，所述解析单元，具体用于如所述计算操作为某维度操作指令，确定所述目标维度为所述β维张量中除最内层维度和某维度以外的任一维度。

可选的，所述某维度操作指令具体包括：softmax、reducemax、splite、concat、transpose中的一个或任意组合。

第三方面，提供一种计算芯片，所述计算芯片包括：第二方面提供的装置。

第四方面，提供一种电子设备，所述电子设备包括第三方面提供的芯片或第二方面提供的装置。

第五方面，提供一种计算机可读存储介质，存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行第一方面提供的方法。

第六方面，提供一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行第一方面提供的方法。

附图说明

图1是人工智能学习库支持的多种类型的基本算子的示意图；

图2是一种4维向量的示意图。

图3是一种张量处理方法的流程示意图。

图4是一种张量处理装置的结构示意图。

图5是本申请提供的计算芯片的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于更好的理解本技术方案，下面先解释本申请实施例所涉及的技术术语：

人工智能学习库：用于在人工智能处理器上加速各种人工智能学习算法。这里，人工智能学习算法包括但不限于深度学习算法，例如，卷积神经网络算法、循环神经网络算法等。具体地，人工智能学习库用于支持多种类型的基本算子。具体实现中，通过基本算子的组合，可以实现多样的机器学习算法，从而满足通用性、灵活性、可扩展性需求。

更具体地，这里所涉及的多种类型的基本算子可以包括：常见的神经网络算子1、矩阵、向量、标量算子2、循环神经网络算子3。参见图1，是本申请实施例提供的一种人工智能学习库支持的多种类型的基本算子的示意图，如图1所示，人工智能学习库支持的多种类型的基本算子包括常见的神经网络算子1包括卷积/反卷积算子11，池化算子12，激活算子13、LRN/批规范化算子14，Softmax算子15，全连接算子16。其中，激活算子13可以包括但不限于ReLU、Sigmoid、Tanh以及其他可以用插值方式实现的算子。矩阵、向量、标量算子2包括矩阵乘算子21、张量加、减算子22、张量逻辑运算算子23、Tensor变换算子24、ROIPooling算子25、Proposal算子26。其中，Tensor变换算子24可以包括但不限于Crop、Reshape、Slice、Concat等；循环神经网络算子3包括LSTM算子31、基本循环神经网络RNN(Recurrent NeuralNetwork,RNN)、循环神经网络RNN算子32、SVDF算子33。在实际应用中，用户还可以根据自身需求自由在人工智能学习库中添加新算子或更改不同版本的人工智能学习库，这里不再详述，会在调试人工智能学习任务时详细描述在软件开发平台上如何基于人工智能学习库优化人工智能学习任务。

对于高维张量，本申请中的高维张量如无特殊说明，特指5维以及5维以上的张量。参阅图2，图2为一个四维张量示意图，如图2所示，该四维张量的4个维度分别可以表示为:N、H、W、C。对于4维张量可以看成是多个3维张量组成的，如图1所示的4维张量可以看成是由N个HWC的三维张量组成的。如图2所示的4维张量中，每个正方形表示一个元素。为了描述的方便，可以将4维张量按维度的排列顺序表示为NHWC，其中，N表示最外层维度，H、W表示中间维度，C表示最内层维度。为了方便维度的表示，可以将NHWC从左到右表示为，0维、1维、2维、4维，或者可以将NHWC从左到右表示为，-4维、-3维、-2维、-1维。

随着计算机技术的发展，高维张量的越来越多的出现在计算中，如何使用较小的开销来解决高维张量的计算成为一个急需解决的技术问题，对此，本申请提供的技术方案将高维张量改变成4维张量，将改变后的4维张量执行计算从而实现了对高维张量的计算。

参阅图3，图3提供了一种张量处理方法，该方法可以由计算装置执行，该计算装置可以包括：神经网络芯片、CPU、GPU中的一种或任意组合。当然上述计算装置还可以为智能终端，该智能终端包括但不限于：机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备、交通工具、家用电器、和/或医疗设备。该交通工具包括飞机、轮船和/或车辆；所述家用电器包括电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机；该医疗设备包括核磁共振仪、B超仪和/或心电图仪。该方法如图3所示，包括如下步骤：

步骤S301、获取待计算的α维张量以及对人工智能学习库支持的操作；所述α为正整数且α≥5；

上述步骤S301中的α维张量具体可以包括：高维张量，即等于或大于5维的张量。上述对人工智能学习库支持的操作包括但不限于：加法操作、乘法操作、softmax、reducemax、splite、concat、transpose中的一个或任意组合。

下面介绍一下softmax、reducemax、splite、concat、transpose中每个操作的含义：

softmax，或称归一化指数函数计算。

reducemax，用于计算张量指定维度的最大值。

splite，用于对一个张量切割成多个张量的计算。

concat，用于对多个张量合并成一个张量的计算。

transpose，用于对张量执行转置计算。

步骤S302、将所述α维张量中的至少二个维度映射至β维张量中的目标维度，所述β为正整数且β≤4；

上述β可以选择4，当然也可以选择4以下的数值。需要说明的是，这里优先选择4，因为如果β越小，那么映射至β维度的一个维度的选择就越小，映射的维度数量就越多，增加的开销就越多，因此，这里优先选择β＝4。

上述目标维度具体可以为β维张量中的一个维度，例如第x维度。

步骤S303、对所述β维张量执行该操作得到操作结果。

本申请提供的技术方案在获取一个高维张量α张量后，确定该α张量的操作的类型，然后依据该类型从β个维度中确定目标维度(例如可以为x维度)，将α张量中至少二个维度映射到β维张量中的目标维度，从而减少了高维张量的计算维度，实现了高维张量的计算，因此本申请的技术方案具有实现高维张量运算的优点。

可选的，上述步骤S302的实现方法具体可以包括：

解析所述操作，确定该操作的类型，依据所述类型确定该β维张量中的目标维度，将所述α维张量中的至少二个维度映射至所述目标维度。

上述目标维度可以是β维张量中的一个维度，也可以是β维张量中的二个维度，大多数情况下，均为一个维度，下面也以一个维度为例来进行说明。

具体的，可以采用如下确定目标维度的方式，如该操作为算术运算操作或转置操作，该算术运算操作包括但不限于：乘法操作、加法操作，则可以确定该目标维度为除了最内层维度以外的任意一个维度。

上述将最内层维度排除在目标维度之外是因为如果映射到最内层维度，会改变存储器内存储的元素值的顺序，改变存储器内存储的元素值的顺序会产生存储开销，将目标维度确定为除最内层维度之外的任意维度，可以不改变存储器内存储的元素值的顺序，不会产生存储开销，具有减少存储开销的优点。

可选的，如β＝4，目标维度可以为第1维度或第-3维度。以NHWC为例，该第1维度或第-3维度即为H维度，因为选择H维度作为目标维度，方便将映射维度转移至与H维度相邻的维度。例如，x维度为H维度时，可以通过一个reshape指令即能够双向调整H维度，例如将映射维度调整至w维度或N维度，如果该x维度不是H维度，例如w维度，那么如果要调整w维度至N维度，对于放置w维度增加硬件的开销，对于放置在N维度，缺乏灵活性。

为了更好的说明H维度与w维度(这里以w维度为例来说明)，以一个实际的例子来说明。比如6维张量(A0,A1,A2,A3,A4,A5),目标维度为H维度，映射成了(A0,A1*A2*A3,A4,A5)，如果需要在A2维度进行操作，可以先进行reshape，数据变为(A0*A1，A2，A3*A4,A5)，这样就可以对A2进行操作了。这个reshape没有任何开销。如果目标维度为w维：(A0,A1,A2,A3,A4,A5),映射成了(A0,A1，A2*A3*A4,A5)，如果需要对A2进行操作，需要进行reshape，变为(A0,A1，A2,A3*A4*A5),这样就可以对A2进行操作了，但是这个reshape改动了最低维度(即-4维度)，因此会增加硬件的开销。如果目标维度为N维：(A0,A1,A2,A3,A4,A5),映射成了(A0*A1*A2,A3,A4,A5)，如果需要对A1进行操作，需要进行reshape，变为(A0,A1，A2*A3*A4,A5),然后对A1操作。此时不会增加硬件开销，但是在代码实现没有H维度灵活，缺乏灵活性。

任意维度的transpose(转置)操作，可以通过4维的transpose+reshape操作组合实现，因为4维的transpose是一个完备的计算集合。

比如transpose的输入α维(α＝5)张量的形状为(A0,A1,A2,A3,A4),perm()＝(0,2,1,3,4)。则确定该β维张量的x可以为除了最内层维度以外的任意维度，例如x＝1，那么传递给人工智能学习库的β维张量形状为(A0,A1*A2,A3,A4)，那么执行transpose指令时，先将(A0,A1*A2,A3,A4)reshape成(A0,A1,A2,A3*A4),再转置为(A0,A2,A1,A3*A4),再reshape成(A0,A2*A1,A3,A4)得到输出结果。这里需要说明的是，在执行transpose时，初始输入即β维张量的最内层维度不能映射多个维度，输出结果的最内层维度也不能映射多个维度。

可选的，上述步骤S202的实现方法具体可以包括：

如所述操作为某维度操作，确定所述目标维度为所述β维张量中除最内层维度和某维度以外的任一维度。

上述某维度操作具体包括：softmax、reducemax、splite、concat、transpose中的任意一种操作。

对于某维操作，例如reducemax操作，其需要对高维张量中的一个维度执行最大值计算，那么该维度不能与其他维度映射在β维张量的目标维度上，如果和其他维度映射在目标维度上，则无法执行某维操作的运算。例如一个5维张量(A0,A1,A2,A3,A4)，其需要对第0维或第-5维执行reducemax运算，那么第0维或第-5维即A0维不能与其他维映射在一起，换句话说，β维张量中的第0维不能是目标维度，该目标维度可以选择第1维或第2维，具体的，例如β维张量具体可以为：(A0,A1*A2,A3,A4)或(A0,A1,A2*A3,A4)。

下面以一个大于5维的高维张量为例来说明，假设这里的高维张量为(a[0],a[1],…a[x-1],a[x],a[x+1],…,a[-2],a[-1])，假设这里需要对第x维执行reducemax操作，则可以确定该目标维度可以为β维度中除了某维以及最内层维度以外的维度，即第0维和第2维，该β维张量具体可以为：(a[0]*a[1]*…a[x-1],a[x],a[x+1]*…*a[-2],a[-1])。

参阅图4，图4提供一种张量处理装置，所述装置包括：

获取单元401，用于获取待计算的α维张量以及计算操作，所述α为正整数且α≥5；

解析单元402，用于解析所述计算操作确定该计算操作的类型；

映射单元403，用于将所述α维张量中的至少二个维度映射至β维张量的目标维度，所述β为正整数且β≤4；

计算单元404，用于对所述β维张量执行操作，实现所述张量处理。

可选的，解析单元402，具体用于解析所述计算操作确定该计算操作的类型，依据所述类型确定该β维张量的目标维度，将所述α维张量中的至少二个维度映射至目标维度。

可选的，解析单元402，具体用于如所述计算操作为算术运算操作，确定所述目标维度为所述β维张量中除最内层维度的任一维度；如所述计算操作为转置操作，确定所述目标维度为所述β维张量中除最内层维度的任一维度。

可选的，如所述β＝4，所述目标维度具体为：第2维度或第-3维度。

可选的，所述算术运算操作包括：乘法操作、加法操作的一种或任意组合。

可选的，解析单元402，具体用于如所述计算操作为某维度操作，确定所述目标维度为所述β维张量中除最内层维度和某维度以外的任一维度。

可选的，所述某维度操作具体包括：softmax、reducemax、splite、concat、transpose中的任意一个或任意组合。

参阅图5，图5为本申请还提供一种计算芯片，所述计算芯片包括：如图4所示装置。

本申请还提供一种电子设备，所述电子设备包括如图5所示的芯片或如图4所示装置。

本申请还提供一种计算机可读存储介质，存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如图3所示的方法。

本申请还提供一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如图3所示的方法。

以上所述的具体实施例，对本申请的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本申请的具体实施例而已，并不用于限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 张量处理方法及相关产品 [P] . 中国专利： CN112257857A . 2021-01-22
2. 一种基于并行分支和张量切分的张量处理方法和处理系统 [P] . 中国专利： CN113485837A . 2021-10-08
3. Tensor factorization processing apparatus, tensor factorization processing method, and tensor factorization processing program [P] . 日本专利： JP6535355B2 . 2019-06-26

机译：张量分解处理设备，张量分解处理方法和张量分解处理程序
4. TENSOR FACTOR DECOMPOSITION PROCESSING APPARATUS, TENSOR FACTOR DECOMPOSITION PROCESSING METHOD AND TENSOR FACTOR DECOMPOSITION PROCESSING PROGRAM [P] . 日本专利： JP2018128708A . 2018-08-16

机译：张量因子分解处理设备，张量因子分解处理方法和张量因子分解处理程序
5. Tensor factorization processor, tensor factorization processing method and the tensor factorization program [P] . 日本专利： JP6038987B2 . 2016-12-07

机译：张量分解处理器，张量分解处理方法和张量分解程序