首页> 中国专利> 基于多路径路由的片上网络重组缓存的上界优化方法

基于多路径路由的片上网络重组缓存的上界优化方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了基于多路径路由的片上网络重组缓存的上界优化方法，通过以下步骤来实现：首先计算片上网络的路由节点冲突矩阵；计算每条子业务流冲突系数；求目标业务流无交叉路径组的冲突系数表；从冲突系数表得出最大最小预测范围；计算重组缓存值，得出优化结果。本发明的有益效果是提出来一种冲突预测片上网络重组缓存上界的优化方法来预测重组缓存的最大值和最小值，相比于全遍历方法，可以缩短分析时间，简化算法复杂度，提高效率，从而有效减少重组缓存区面积，降低片上网络设计成本。

著录项

公开/公告号CN103955584A

专利类型发明专利
公开/公告日2014-07-30

原文格式PDF
申请/专利权人合肥工业大学;
展开▼

申请/专利号CN201410199100.1
发明设计人杜高明;李苗;宋宇鲲;张多利;王春来;刘鑫;尹勇生;
展开▼

申请日2014-05-12
分类号G06F17/50(20060101);H04L12/721(20130101);G06F15/173(20060101);
代理机构北京科亿知识产权代理事务所(普通合伙);
代理人汤东凤
地址 230000 安徽省合肥市屯溪路193号
入库时间 2023-12-17 00:30:37

法律信息

法律状态公告日

法律状态信息

法律状态
2017-08-25

授权

授权
2014-09-10

实质审查的生效 IPC(主分类):G06F17/50 申请日:20140512

实质审查的生效
2014-07-30

公开

公开

说明书

技术领域

本发明属于集成电路片上网络设计技术领域，涉及基于多路径路由的片上网络重组缓存的上界优化方法。

背景技术

《Very Large Scale Integration Design》2007年1-11页中‘Amethod for routing packets across multiple paths in NoCs with in-order delivery and fault-tolerance guarantees’一文提出针对无交叉子业务流的多路径路由方法，以降低网络带宽需求和功耗需求，并针对瞬时和永久错误提出容错方案；不足之处在于没有讨论如何设置重组缓存的大小，从而存在丢包或重组缓存面积过大的风险；

《Design,Automation & Test in Europe》2009年1058–1063页中 ‘In-network reorder buffer to improve overall NoC performance while resolving thein-order requirement problem’一文中介绍了通过将重组缓存从路由器外边移到路由器里边，通过共享给其他业务流来提高重组缓存的利用率；不足之处同样没有给出重组缓存的设置方案，存在丢包或重组缓存面积过大的风险；

《IEEE TRANSACTIONS ON COMPUTER-AIDED DESIGN OF INTEGRATED CIRCUITS AND SYSTEMS》2010年12期1973-1986 页中‘Buffer Optimization in Network-on-Chip Through Flow Regulation’一文基于网络演算理论提出了片上路由器输入缓存的分析模型及其大小的分析方法；不足之处在于没有进一步研究位于业务流输出端的包重组缓存大小的分析方法。

《IEEE TRANSACTIONS ON COMPUTER-AIDED DESIGN OF INTEGRATED CIRCUITS AND SYSTEMS》第31卷第一期(2012年 1月)第146-159页文章‘Memory-Efficient On-Chip Network with Adaptive Interface’提出使用一种流线型的重新排序机制来实现业务在目的节点的排序，不足之处仍然没有给出重组缓存大小的设置方案，存在丢包或重组缓存面积过大的风险。

《中国科技论文在线电子杂志》2013年64期中‘多路径路由 NoC重组缓存区的分析及优化’一文基于网络验算提出了计算两条目标子流的重组缓存区模型，不足之处在于该文章在优化重组缓存上界中采用传统全遍历法，分析时间长，算法复杂度大。

基于以上背景，本发明提出来一种冲突预测片上网络重组缓存上界的优化方法，通过冲突矩阵，推导出每条子业务流的冲突系数，进而从无交叉路径组冲突系数表中选出最大最小范围，来预测重组缓存的最大值和最小值。

发明内容

本发明的目的在于提供基于多路径路由的片上网络重组缓存的上界优化方法，解决了现有技术没有给出重组缓存上界的设置方案，存在重组缓存面积过大、浪费成本的问题。

本发明所采用的技术方案是通过以下步骤来实现：

步骤a：计算片上网络的路由节点冲突矩阵；

步骤b：计算每条目标子业务流冲突系数；

步骤c：求目标业务流无交叉路径组的冲突系数表；

步骤d：从冲突系数表得出最大最小预测范围；

步骤e：根据预测路径计算重组缓存值，得出优化结果。

进一步，所述路由为多路径最短路由，所述片上网络为 N×N(N≥2)的网络结构。

进一步，业务流为分析路径得到的业务流划分为目标业务流和冲突业务流，目标业务流定义为所需要研究的对象，拆分为两条目标子业务流；冲突业务流定义为对目标业务流造成冲突的业务流，由于冲突的存在导致目标流中数据包后发先至形成重组缓存区。

进一步，所述子业务流，为通过全遍历得到全拆分情况下所产生的所有子流，全拆分指每个路由节点都完全拆分。

进一步，所述目标主流重组缓存值的上界普通计算公式为

$BufferSize = \max {\frac{(D_{1}^{upp} - D_{2}^{low})}{{Δt}_{2}}, \frac{(D_{2}^{upp} - D_{1}^{low})}{{Δt}_{1}}},$

式中Δt₁表示目标子流1上数据包的注入时间间隔，Δt₂表示目标子流2上数据包的注入时间间隔，为目标子流1延迟上界与目标子流2延迟下界的差值，为目标子流2延迟上界与目标子流1延迟下界的差值。

进一步，所述冲突矩阵为N²×4矩阵，行代表路由节点，范围为 ∈(1,N²)，列代表东西南北四个方向，由于是最短路由，北和西方向均为0，每个元素代表路由节点在其方向上的冲突系数，假设网路中共有M条冲突流，则节点在其方向上的冲突系数定义为 (其中k代表冲突流，i代表路由节点，d代表路由节点的方向)，即为每条冲突流的参数(εr+ηb)乘以相应冲突流的节点拆分流量p的总和，r和b分别为表示业务流特性的平均转发速率和突发度，ε和η分别为平均转发速率和突发度对冲突的贡献指数，p为冲突流在每个节点的拆分流量，其中ε，η∈(0,1]。

进一步，所述每条目标子业务流冲突系数，为把每条目标子流经过的节点在其方向上的冲突系数加和C_sub-tag＝ΣC_i,d(其中i代表目标子流经过的节点，d代表节点的方向)。

进一步，所述无交叉，定义为拆分的两条目标子流不共享除起始节点和目的节点外的任一相同路由节点，通过设置约束条件 A＝4(N-1),N≥2进行挑选。

进一步，所述无交叉路径组冲突系数表，为挑选出无交叉路径组中路径冲突系数大的，作为无交叉路径组的冲突系数 C_(m,n)＝max(C_sub-tag-m,C_sub-tag-n)(其中m代表路径组的第一条子流，n代表路径组的第二条子流)，依据为路径组中重组缓存上界与延迟上界大的趋势一致，而子流冲突系数与子流延迟的趋势一致，因而可以用路径组中冲突系数大的来表征重组缓存上界。

进一步，所述从冲突系数表得出最大最小预测范围，为从无交叉路径组对应的冲突系数表中得到由所有相同最值组成的预测范围对应的路径组，根据预测路径组计算相应的重组缓存值，从中挑选出重组缓存最大最小值。

本发明的有益效果是提出来一种冲突预测片上网络重组缓存上界的优化方法来预测重组缓存的最大值和最小值，可以减少运行时间，降低运算复杂度。

附图说明

图1是本发明的方法步骤流程图；

图2是本发明实施例的业务流配置图；

图3(a)-(d)是本发明实施例目标业务流f和冲突业务流f₄、f₃f₅、 f₆的全拆分图；

图3(e)是本发明实施例目标子业务流f₁的冲突情况图；

图3(e*)是本发明实施例切割后目标子业务流f₁的冲突情况图；

图3(f)是本发明实施例目标子业务流f₂的冲突情况图；

图4(a)-(d)是本发明实施例冲突流f₃f₄f₅f₆的均匀拆分分布图；

图5是本发明实施例冲突流f₃f₄f₅f₆对应的拆分矩阵图；

图6是本发明实施例20条目标子业务流冲突系数与延迟上界的对比图；

图7是本发明实施例4条冲突流对应的预测结果图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

如图1所示本发明的步骤流程，本发明涉及一种片上网络多路径最短路由算法，尤其涉及一种片上网络重组缓存上界的优化预测方法。

本发明克服了现有优化方法中分析时间长，算法复杂度大等不足，提供了一种以最短多路径路由方式为切入点，以冲突预测为核心，片上网络(NoC)中重组缓存上界的优化方法。

为了解决上述问题，本发明是通过以下方案实现的：

步骤a：计算片上网络的路由节点冲突矩阵；

步骤b：计算每条目标子业务流冲突系数；

步骤c：求目标业务流无交叉路径组的冲突系数表；

步骤d：从冲突系数表得出最大最小预测范围；

步骤e：根据预测路径计算重组缓存值，得出优化结果。

通过冲突矩阵，推导出每条子业务流的冲突系数，进而从无交叉路径组冲突系数表中选出最大最小范围，来预测重组缓存的最大值和最小值，相比于普通遍历方法，可以缩短分析时间，简化算法复杂度，提高效率，从而有效减少重组缓存区面积，并降低片上网络设计成本。

本发明一种片上网络重组缓存上界的优化方法特点还在于：

优化方法中路由为多路径最短路由，所述片上网络为N×N(N≥2) 的网络结构。

优化方法中业务流，为分析路径得到的业务流划分为目标业务流和冲突业务流，目标业务流定义为所需要研究的对象，拆分为两条目标子业务流；冲突业务流定义为对目标业务流造成冲突的业务流，由于冲突的存在导致目标流中数据包后发先至形成重组缓存区。

优化方法中子业务流，为通过全遍历得到全拆分情况下所产生的所有子流，全拆分指每个路由节点都完全拆分。

优化方法中目标主流重组缓存上界公式为

$BufferSize = \max {\frac{(D_{1}^{upp} - D_{2}^{low})}{{Δt}_{2}}, \frac{(D_{2}^{upp} - D_{1}^{low})}{{Δt}_{1}}},$

式中Δt₁表示目标子流1上数据包的注入时间间隔，Δt₂表示目标子流 2上数据包的注入时间间隔，为目标子流1延迟上界与目标子流2延迟下界的差值，为目标子流2延迟上界与目标子流1延迟下界的差值。

优化方法中冲突矩阵，为N²×4矩阵，行代表路由节点，范围为 ∈(1,N²)，列代表东西南北四个方向，由于是最短路由，北和西方向均为0，每个元素代表路由节点在其方向上的冲突系数，假设网路中共有M条冲突流，则节点在其方向上的冲突系数定义为 (其中k代表冲突流，i代表路由节点，d代表路由节点的方向)，即为每条冲突流的参数(εr+ηb)乘以相应冲突流的节点拆分流量p的总和，r和b分别为表示业务流特性的平均转发速率和突发度，ε和η分别为平均转发速率和突发度对冲突的贡献指数，p为冲突流在每个节点的拆分流量，其中ε，η∈(0,1]。

优化方法中每条子业务流冲突系数，为把每条目标子流经过的节点在其方向上的冲突系数加和C_sub-tag＝ΣC_i,d(其中i代表目标子流经过的节点，d代表节点的方向)。

优化方法中无交叉，定义为拆分的两条目标子流不共享除起始节点和目的节点外的任一相同路由节点，通过设置约束条件 A＝4(N-1),N≥2进行挑选。

优化方法中无交叉路径组冲突系数表，为挑选出无交叉路径组中路径冲突系数大的，作为无交叉路径组的冲突系数 C_(m,n)＝max(C_sub-tag-m,C_sub-tag-n)(其中m代表路径组的第一条子流，n代表路径组的第二条子流)，依据为路径组中重组缓存上界与延迟上界大的趋势一致，而子流冲突系数与子流延迟的趋势一致，因而可以用路径组中冲突系数大的来表征重组缓存上界。

优化方法中从冲突系数表得出最大最小预测范围，为从无交叉路径组对应的冲突系数表中得到由所有相同最值组成的预测范围对应的路径组。

优化方法中预测重组缓存最大最小值，得出优化结果，为根据预测路径组计算相应的重组缓存值，从中挑选出重组缓存最大最小值。

本发明通过冲突矩阵，推导出每条子业务流的冲突系数，进而从无交叉路径组冲突系数表中选出最大最小范围，来预测重组缓存的最大值和最小值，相比于普通遍历方法，可以缩短分析时间，简化算法复杂度，提高效率，从而有效减少重组缓存区面积，并降低片上网络设计成本。

下面列举具体实施例对本发明进行说明：

实施例1：以网络规模为4×4、拓扑结构为二维网格的片上网格为例，推导优化过程。

推导过程中所需的公式如表1所示。(下面公式中，m代表路由节点号，n代表流号，N代表N×N的网络结构)：

表1

如图2所示，f_＜1,16＞为目标业务流，f_＜2,12＞f_＜3,8＞f_＜6,11＞和f_＜6,16＞为冲突业务流(f_＜m,n＞中m代表源节点，n代表目的节点)，为了方便计算，令f＝f_＜1,16＞、f₃＝f_＜2,12＞、f₄＝f_＜3,8＞、f₅＝f_＜6,11＞和f₆＝f_＜6,16＞。

本实施例中设置目标流f的输入到达曲线(表示每100个周期发送8个数据包，一次最多发送一个数据包)；冲突流f₃的输入到达曲线：冲突流f₄的输入到达曲线：冲突流f₅的输入到达曲线：冲突流f₆的输入到达曲线：在本发明中r和b可以取任意值。

所有的路由节点采用FCFS仲裁策略，提供的服务曲线为 β(t)＝R(t-T)⁺，其中，R表示服务速率，T表示处理延迟，且当t＞T时， (t-T)⁺＝t-T；当t≤T时，(t-T)⁺＝0。本实施例中设置β(t)＝0.33(t-3)⁺，表示每三周期处理一个数据包，处理延迟为三个周期。在本发明中R 和T可以取任意值。

步骤1：计算片上网络的路由节点冲突矩阵：

按照图4a-d的冲突流配置，得到16×4冲突矩阵，行代表16个路由节点，列代表东西南北四个方向，如图5中a,b,c和d分别为由p 构成的冲突流f₃,f₄,f₅和f₆的拆分矩阵。设定ε＝η＝1(本发明中 ε，η∈(0,1]，为了精确计算结果，实例中设定ε＝η＝1)，把各个冲突流的r和b，分别带入各自的拆分矩阵，最后将四个修改后的拆分矩阵相加，表2为路由节点在其方向上的冲突系数：

表2

表2构成目标业务流的冲突矩阵B：

$B = (\begin{matrix} 1 \\ 2 \\ 3 \\ 4 \\ 5 \\ 6 \\ 7 \\ 8 \\ 9 \\ 10 \\ 11 \\ 12 \\ 13 \\ 14 \\ 15 \\ 16 \end{matrix}) (\begin{matrix} E & W & S & N \\ 0 & 0 & 0 & 0 \\ 10.04 & 0 & 10.04 & 0 \\ 10.06 & 0 & 10.06 & 0 \\ 0 & 0 & 10.06 & 0 \\ 0 & 0 & 0 & 0 \\ 40.1 & 0 & 40.1 & 0 \\ 20.08 & 0 & 30.08 & 0 \\ 0 & 0 & 20.06 & 0 \\ 0 & 0 & 0 & 0 \\ 30.08 & 0 & 10.02 & 0 \\ 20.06 & 0 & 10.02 & 0 \\ 0 & 0 & 20.04 & 0 \\ 0 & 0 & 0 & 0 \\ 10.02 & 0 & 0 & 0 \\ 20.04 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{matrix})$

步骤2：计算每条子业务流的冲突系数：

f_＜1,16＞为目标业务流，进行全拆分共有20条目标子流(此处为最短路由，设置业务流的路径时只有两个方向)，通过分析冲突情况建立冲突矩阵，计算出20条目标子流中每条子流的冲突系数，即把子流经过的节点在其对应方向上的冲突系数加和，节点冲突系数为设定ε＝η＝1，如上表2所示，通过加和得出20 条子流所对应的冲突系数，图6为20条子流对应的冲突系数与延迟上界的对比图，可以看出结果基本吻合，表明可以用冲突系数来表征延迟。

例如：

目标子流1经过节点(1 2 3 4 8 12 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向东，3节点向东，4节点向南，8节点向南，12节点向南的节点冲突系数加和为70.26。

目标子流2经过节点(1 2 3 7 8 12 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向东，3节点向南，7节点向东，8节点向南，12节点向南的节点冲突系数加和为80.28。

目标子流3经过节点(1 2 3 7 11 12 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向东，3节点向南，7节点向南，11 节点向东，12节点向南的节点冲突系数加和为90.28。

目标子流4经过节点(1 2 3 7 11 15 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向东，3节点向南，7节点向南，11 节点向南，15节点向东的节点冲突系数加和为80.24。

目标子流5经过节点(1 2 6 7 8 12 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向南，6节点向东，7节点向东，8节点向南，12节点向南的节点冲突系数加和为110.32。

目标子流6经过节点(1 2 6 7 11 12 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向南，6节点向东，7节点向南，11 节点向东，12节点向南的节点冲突系数加和为120.32。

目标子流7经过节点(1 2 6 7 11 15 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向南，6节点向东，7节点向南，11 节点向南，15节点向东的节点冲突系数加和为110.28。

目标子流8经过节点(1 2 6 10 11 12 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向南，6节点向南，10节点向东，11 节点向东，12节点向南的节点冲突系数加和为120.32。

目标子流9经过节点(1 2 6 10 11 15 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向南，6节点向南，10节点向东，11 节点向南，15节点向东的节点冲突系数加和为110.28。

目标子流10经过节点(1 2 6 10 14 15 16)，根据目标业务流的冲突矩阵B，把1节点向东，2节点向南，6节点向南，10节点向南， 14节点向东，15节点向东的节点冲突系数加和为90.22。

目标子流11经过节点(1 5 6 7 8 12 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向东，6节点向东，7节点向东，8节点向南，12节点向南的节点冲突系数加和为100.28。

目标子流12经过节点(1 5 6 7 11 12 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向东，6节点向东，7节点向南，11 节点向东，12节点向南的节点冲突系数加和为110.28。

目标子流13经过节点(1 5 6 7 11 15 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向东，6节点向东，7节点向南，11 节点向南，15节点向东的节点冲突系数加和为100.24。

目标子流14经过节点(1 5 6 10 11 12 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向东，6节点向南，10节点向东，11 节点向东，12节点向南的节点冲突系数加和为110.28。

目标子流15经过节点(1 5 6 10 11 15 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向东，6节点向南，10节点向东， 11节点向南，15节点向东的节点冲突系数加和为100.24。

目标子流16经过节点(1 5 6 10 14 15 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向东，6节点向南，10节点向南， 14节点向东，15节点向东的节点冲突系数加和为80.18。

目标子流17经过节点(1 5 9 10 11 12 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向南，9节点向东，10节点向东， 11节点向东，12节点向南的节点冲突系数加和为70.18。

目标子流18经过节点(1 5 9 10 11 15 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向南，9节点向东，10节点向东， 11节点向南，15节点向东的节点冲突系数加和为60.14。

目标子流19经过节点(1 5 9 10 14 15 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向南，9节点向东，10节点向南， 14节点向东，15节点向东的节点冲突系数加和为40.08。

目标子流20经过节点(1 5 9 13 14 15 16)，根据目标业务流的冲突矩阵B，把1节点向南，5节点向南，9节点向南，13节点向东， 14节点向东，15节点向东的节点冲突系数加和为30.06。

步骤3：求目标业务流无交叉路径组的冲突系数表：

目标业务流f<1,16>通过流量分割共有20条目标子流(与步骤 2中的20条求出冲突系数的子流相同)，这20条目标子流为全遍历所得到的从源节点1到目的节点16的所有可能的目标子流，此处我们讨论的是多路径路由(即目标业务流拆分为多条目标子流的情况)，本发明设定目标流拆分为两条目标子流，因此对20条所有可能的目标子流进行两两组合，共有190对。无交叉为拆分的两条目标子流不共享除起始节点和目的节点外的任一相同路由节点，通过设置约束条件A＝4(N-1),N≥2,进行挑选。本实施例中对于4×4网格，通过设置约束条件为A＝4(4-1)＝12，从190对路径组中挑选得到40对无交叉的路径组，每一对路径组即为一对目标流，此处目标流和冲突流均匀拆分，拆分比为0.5，与图4中冲突流均匀全拆分相统一，而本发明中目标流和冲突流拆分比取值范围为(0.1-0.9)，求解40对无交叉路径组对应的冲突系数表。取路径组中子流冲突系数大的为该路径组的冲突系数。

1.目标子流1的冲突系数为70.26，目标子流13的冲突系数为 100.24，路径组(113)的冲突系数为目标子流13的冲突系数100.24。

2.目标子流1的冲突系数为70.26，目标子流15的冲突系数为 100.24，路径组(115)的冲突系数为目标子流15的冲突系数100.24。

3.目标子流1的冲突系数为70.26，目标子流16的冲突系数为 80.18，路径组(116)的冲突系数为目标子流16的冲突系数80.18。

4.目标子流1的冲突系数为70.26，目标子流18的冲突系数为 60.14，路径组(118)的冲突系数为目标子流1的冲突系数70.26。

5.目标子流1的冲突系数为70.26，目标子流19的冲突系数为 40.08，路径组(119)的冲突系数为目标子流1的冲突系数70.26。

6.目标子流1的冲突系数为70.26，目标子流20的冲突系数为 30.06，路径组(120)的冲突系数为目标子流1的冲突系数70.26。

7.目标子流2的冲突系数为80.28，目标子流13的冲突系数为 100.24，路径组(213)的冲突系数为目标子流13的冲突系数100.24。

8.目标子流2的冲突系数为80.28，目标子流15的冲突系数为 100.24，路径组(215)的冲突系数为目标子流15的冲突系数100.24。

9.目标子流2的冲突系数为80.28，目标子流16的冲突系数为 80.18，路径组(216)的冲突系数为目标子流2的冲突系数80.28。

10.目标子流2的冲突系数为80.28，目标子流18的冲突系数为 60.14，路径组(218)的冲突系数为目标子流2的冲突系数80.28。

11.目标子流2的冲突系数为80.28，目标子流19的冲突系数为 40.08，路径组(219)的冲突系数为目标子流2的冲突系数80.28。

12.目标子流2的冲突系数为80.28，目标子流20的冲突系数为 30.06，路径组(220)的冲突系数为目标子流2的冲突系数80.28。

13.目标子流3的冲突系数为90.28，目标子流15的冲突系数为 100.24，路径组(315)的冲突系数为目标子流15的冲突系数100.24。

14.目标子流3的冲突系数为90.28，目标子流16的冲突系数为 80.18，路径组(316)的冲突系数为目标子流3的冲突系数90.28。

15.目标子流3的冲突系数为90.28，目标子流18的冲突系数为 60.14，路径组(318)的冲突系数为目标子流3的冲突系数90.28。

16.目标子流3的冲突系数为90.28，目标子流19的冲突系数为 40.08，路径组(319)的冲突系数为目标子流3的冲突系数90.28。

17.目标子流3的冲突系数为90.28，目标子流20的冲突系数为 30.06，路径组(320)的冲突系数为目标子流3的冲突系数90.28。

18.目标子流4的冲突系数为80.24，目标子流11的冲突系数为 100.28，路径组(411)的冲突系数为目标子流11的冲突系数100.28。

19.目标子流4的冲突系数为80.24，目标子流14的冲突系数为 110.28，路径组(414)的冲突系数为目标子流14的冲突系数110.28。

20.目标子流4的冲突系数为80.24，目标子流17的冲突系数为 70.18，路径组(417)的冲突系数为目标子流4的冲突系数80.24。

21.目标子流5的冲突系数为110.32，目标子流15的冲突系数为100.24，路径组(515)的冲突系数为目标子流5的冲突系数110.32。

22.目标子流5的冲突系数为110.32，目标子流16的冲突系数为80.18，路径组(516)的冲突系数为目标子流5的冲突系数110.32。

23.目标子流5的冲突系数为110.32，目标子流18的冲突系数为60.14，路径组(518)的冲突系数为目标子流5的冲突系数110.32。

24.目标子流5的冲突系数为110.32，目标子流19的冲突系数为40.08，路径组(519)的冲突系数为目标子流5的冲突系数110.32。

25.目标子流5的冲突系数为110.32，目标子流20的冲突系数为30.06，路径组(520)的冲突系数为目标子流5的冲突系数110.32。

26.目标子流6的冲突系数为120.32，目标子流15的冲突系数为100.24，路径组(615)的冲突系数为目标子流6的冲突系数120.32。

27.目标子流6的冲突系数为120.32，目标子流16的冲突系数为80.18，路径组(616)的冲突系数为目标子流6的冲突系数120.32。

28.目标子流6的冲突系数为120.32，目标子流18的冲突系数为60.14，路径组(618)的冲突系数为目标子流6的冲突系数120.32。

29.目标子流6的冲突系数为120.32，目标子流19的冲突系数为40.08，路径组(619)的冲突系数为目标子流6的冲突系数120.32。

30.目标子流6的冲突系数为120.32，目标子流20的冲突系数为30.06，路径组(620)的冲突系数为目标子流6的冲突系数120.32。

31.目标子流7的冲突系数为110.28，目标子流14的冲突系数为110.28，路径组(714)的冲突系数为目标子流7或14的冲突系数 110.28。

32.目标子流7的冲突系数为110.28，目标子流17的冲突系数为70.18，路径组(717)的冲突系数为目标子流7的冲突系数110.28。

33.目标子流8的冲突系数为120.32，目标子流13的冲突系数为100.24，路径组(813)的冲突系数为目标子流8的冲突系数120.32。

34.目标子流8的冲突系数为120.32，目标子流19的冲突系数为40.08，路径组(819)的冲突系数为目标子流8的冲突系数120.32。

35.目标子流8的冲突系数为120.32，目标子流20的冲突系数为30.06，路径组(820)的冲突系数为目标子流8的冲突系数120.32。

36.目标子流9的冲突系数为110.28，目标子流11的冲突系数为100.28，路径组(911)的冲突系数为目标子流9的冲突系数110.28。

37.目标子流9的冲突系数为110.28，目标子流12的冲突系数为110.28，路径组(912)的冲突系数为目标子流9或12的冲突系数 110.28。

38.目标子流10的冲突系数为90.22，目标子流11的冲突系数为100.28，路径组(1011)的冲突系数为目标子流11的冲突系数 100.28。

39.目标子流10的冲突系数为90.22，目标子流12的冲突系数为110.28，路径组(1012)的冲突系数为目标子流12的冲突系数 110.28。

40.目标子流10的冲突系数为90.22，目标子流17的冲突系数为70.18，路径组(1017)的冲突系数为目标子流10的冲突系数90.22。

如表3所示为无交叉路径组冲突系数表与全遍历所得重组缓存表。

表3

步骤4：从冲突系数表得出最大最小预测范围：

从无交叉冲突系数表中挑选出突系数最大值对应的路径组为(6 15)、(616)、(618)、(619)、(620)、(813)、(819)、(820)，根据网络演算，计算出路径组(615)、(616)、(618)、(619)、(620)、 (813)、(819)、(820)对应的重组缓存依次为35.4869、34.4503、 34.6949、29.8786、29.8891、32.5543、26.4018、26.4122。因此，重组缓存最大值为35.4869。

从无交叉冲突系数表中挑选出突系数最小值对应的路径组为(1 18)、(119)、(120)，根据网络演算，计算出路径组(118)、(119)、 (120)对应的重组缓存依次为25.809、21.0235、21.0339。因此，重组缓存最小值为35.4869。

步骤5：计算40对无交叉路径组对应的重组缓存值：

全遍历得到40对无交叉路径组对应的重组缓存值，得到重组缓存最大值为35.4869，相应路径组为(615)；最小值为21.0235，相应路径组为(119)与冲突预测所得结果吻合(步骤4)，验证了冲突预测优化方法的准确性。

以40对无交叉路径组中的任一路径组为例(此处为方便计算，选取(119)路径组，即目标流拆分为路径f₁(1 2 3 4 8 12 16)和路径f₂(1 5 9 10 14 15 16))，分析重组缓存的推导过程，步骤如下：

(1)比例计算：

对于目标流(119)路径组的情况，如图3.(a)(b)(c)(d)所示通过流量拆分，目标流f_＜1,16＞拆分成两条子流，分别为标号为1的f₁和标号为19的f₂；冲突流分别为f₃、f₄、f₅和f₆。均匀全拆分情况下， f₃拆分为f₃₁、f₃₂，f₄拆分成f₄₁、f₄₂、f₄₃、f₄₄、f₄₅、f₄₆，f₅拆分为f₅₁、f₅₂， f₆拆分为f₆₁、f₆₂、f₆₃、f₆₄、f₆₅、f₆₆。

由图3和图4可知，所有流的拆分比例分别为： $P_{(f_{31})} = P_{(f_{32})} = 0.5, P_{(f_{41})} = P_{(f_{46})} = 0.25, P_{(f_{42})} = P_{(f_{43})} = P_{(f_{44})} = P_{(f_{45})} = 0.125,$ $P_{(f_{51})} = P_{(f_{52})} = 0.5, P_{(f_{61})} = P_{(f_{66})} = 0.25, P_{(f_{62})} = P_{(f_{63})} = P_{(f_{64})} = P_{(f_{65})} = 0.125 .$

(2)所有流的输入到达曲线：

目标流f的输入到达曲线

目标子流f₁的输入到达曲线

目标子流f₂的输入到达曲线

冲突流f₃的输入到达曲线：

冲突子流f₃₁的输入到达曲线 $α_{3}^{f_{31}} = r_{31} t + b_{31} = P_{(f_{31})} (0.08 t + 10);$

冲突子流f₃₂的输入到达曲线 $α_{3}^{f_{32}} = r_{32} t + b_{32} = P_{(f_{32})} (0.08 t + 10);$

冲突流f₄的输入到达曲线：

冲突子流f₄₁的输入到达曲线 $α_{2}^{f_{41}} = r_{41} t + b_{41} = P_{(f_{41})} (0.08 t + 20);$

冲突子流f₄₂的输入到达曲线 $α_{2}^{f_{42}} = r_{42} t + b_{42} = P_{(f_{42})} (0.08 t + 20);$

冲突子流f₄₃的输入到达曲线 $α_{2}^{f_{43}} = r_{43} t + b_{43} = P_{(f_{43})} (0.08 t + 20);$

冲突子流f₄₄的输入到达曲线 $α_{2}^{f_{44}} = r_{44} t + b_{44} = P_{(f_{44})} (0.08 t + 20);$

冲突子流f₄₅的输入到达曲线 $α_{2}^{f_{45}} = r_{45} t + b_{45} = P_{(f_{45})} (0.08 t + 20);$

冲突子流f₄₆的输入到达曲线 $α_{2}^{f_{46}} = r_{46} t + b_{46} = P_{(f_{46})} (0.08 t + 20);$

冲突流f₅的输入到达曲线：

冲突子流f₅₁的输入到达曲线 $α_{6}^{f_{51}} = r_{51} t + b_{51} = P_{(f_{51})} (0.08 t + 30);$

冲突子流f₅₂的输入到达曲线 $α_{6}^{f_{52}} = r_{52} t + b_{52} = P_{(f_{52})} (0.08 t + 30);$

冲突流f₆的输入到达曲线：

冲突子流f₆₁的输入到达曲线 $α_{6}^{f_{61}} = r_{61} t + b_{61} = P_{(f_{61})} (0.08 t + 40);$

冲突子流f₆₂的输入到达曲线 $α_{6}^{f_{62}} = r_{62} t + b_{62} = P_{(f_{62})} (0.08 t + 40);$

冲突子流f₆₃的输入到达曲线 $α_{6}^{f_{63}} = r_{63} t + b_{63} = P_{(f_{63})} (0.08 t + 40);$

冲突子流f₆₄的输入到达曲线 $α_{6}^{f_{64}} = r_{64} t + b_{64} = P_{(f_{64})} (0.08 t + 40);$

冲突子流f₆₅的输入到达曲线 $α_{6}^{f_{65}} = r_{65} t + b_{65} = P_{(f_{65})} (0.08 t + 40);$

冲突子流f₆₆的输入到达曲线 $α_{6}^{f_{66}} = r_{66} t + b_{66} = P_{(f_{66})} (0.08 t + 40) .$

(3)目标子流等价服务曲线计算：

a.计算目标子流f₁的等价服务曲线：

如图3.(e)所示，有13条流与f₁形成冲突，f₄₁和f₆₁之间为交叉冲突，对f₄₁在路由节点4和路由节点8之间进行切割，切割后的流记为f₄₁'，如图3.(e*)。

f₁的等价服务曲线推导如下：

从节点3、4中去除f₃₁的服务，得到节点3、4提供给f₁和f₄₁的等价服务曲线为： $β_{(3,4)}^{{f_{1}, f_{41}}} = \in (β_{3} \otimes β_{4}, α_{3}^{f_{31}})$

从节点2中去除f₄₂、f₄₄的服务，得到节点2、3、4提供给f₁和f₄₁的等价服务曲线为： $β_{(2,3,4)}^{{f_{1}, f_{41}}} = \in (β_{2}, α_{2}^{f_{42} + f_{44}}) \otimes \in (β_{3} \otimes β_{4}, α_{3}^{f_{31}})$

从节点2、3、4中去除f₄₁的服务，得到节点2、3、4提供给f₁的等价服务曲线为： $β_{(2,3,4)}^{{f_{1}}} = \in (\in (β_{2}, α_{2}^{f_{42} + f_{44}}) \otimes \in (β_{3} \otimes β_{4}, α_{3}^{f_{31}}), α_{2}^{f_{41}})$

从节点8中移除f′₄₁、f₄₂、f₄₃的服务，得到节点8提供给f₁和f₆₁的等价服务曲线为： $β_{(8)}^{{f_{1}, f_{61}}} = \in ({β_{8}, α}_{8}^{{f_{41}^{'} + f}_{42} + f_{43}})$

从节点16中去除f₂、f₆₄、f₆₅、f₆₆的服务，得到节点16提供给f₁、 f₆₁、f₆₂、f₆₃的等价服务曲线： $β_{(16)}^{{f_{1}, f_{61}, f_{62}, f_{63}}} = \in (β_{16}, α_{16}^{f_{2} + f_{64} + f_{65} + f_{66}})$

从节点12、16中移除f₆₂、f₆₃的服务，得到节点12、16提供给f₁和f₆₁的等价服务曲线为： $β_{(12,16)}^{{f_{1}, f_{61}}} = \in (β_{12} \otimes \in (β_{16}, α_{16}^{f_{2} + f_{64} + f_{65} + f_{66}}), α_{12}^{f_{62} + f_{63}})$

因此节点8、12、16提供给f₁和f₆₁的等价服务曲线为：

$β_{(8,12,16)}^{{f_{1}, f_{61}}} = \in (β_{8}, α_{8}^{f_{41}^{'} + f_{42} + f_{43}}) \otimes \in (β_{12} \otimes \in (β_{16}, α_{16}^{f_{2} + f_{64} + f_{65} + f_{66}}), α_{12}^{f_{62} + f_{63}})$

从节点8、12、16中移除f₆₁的服务，得到节点8、12、16提供给f₁的等价服务曲线为：

$β_{(8,12,16)}^{{f_{1}}} = \in (\in (β_{8}, α_{8}^{f_{41}^{'} + f_{42} + f_{43}}) \otimes \in (β_{12} \otimes \in (β_{16}, α_{16}^{f_{2} + f_{64} + f_{65} + f_{66}}), α_{12}^{f_{62} + f_{63}}), α_{8}^{f_{61}})$

最后，根据串联定理，求出节点1、2、3、4、8、12、16提供给 f₁的等价服务曲线为：

$(\begin{matrix} β_{eq}^{{f_{1}}} = β_{1} \otimes β_{(2,3,4)}^{{f_{1}}} \otimes β_{(8,12,16)}^{{f_{1}}} \\ = β_{1} \otimes \in (\in (β_{2}, α_{2}^{f_{42} + f_{44}}) \otimes \in (β_{3} \otimes β_{4}, α_{3}^{f_{31}}), α_{2}^{f_{41}}) \\ \otimes \in (\in (β_{8}, α_{8}^{f_{41}^{'} + f_{42} + f_{43}}) \otimes \in (β_{12} \otimes \in (β_{16}, α_{16}^{f_{2} + f_{64} + f_{65} + f_{66}}), α_{12}^{f_{62} + f_{63}}), α_{8}^{f_{61}}) \\ = R_{(1,16)}^{f_{1, eq}} {(t - T_{(1,16)}^{f_{1, eq}})}^{+} \end{matrix})$

b.计算目标子流f₂的等价服务曲线：

如图3.(f)所示，有7条流与f₂形成冲突,分别为 f₁、f₆₁、f₆₂、f₆₃、f₆₄、f₆₅、f₆₆。

从节点16中去除f₁、f₆₁、f₆₂、f₆₃的服务，得到节点16提供给f₂、 f₆₄、f₆₅、f₆₆的等价服务曲线为： $β_{(16)}^{{f_{2}, f_{64}, f_{65}, f_{66}}} = \in (β_{16}, α_{16}^{f_{1} + f_{61} + f_{62} + f_{63}})$

从节点15、16中移除f₆₄、f₆₅的服务，得到节点15、16提供给f₂和f₆₆的等价服务曲线为： $β_{(15,16)}^{{f_{2}, f_{66}}} = \in (β_{15} \otimes \in (β_{16}, α_{16}^{f_{1} + f_{61} + f_{62} + f_{63}}), α_{15}^{f_{64} + f_{65}})$

从节点10、14、15、16中移除f₆₆的服务，得到节点10、14、15、 16提供给f₂的等价服务曲线为：

$β_{(10,14,15,16)}^{{f_{2}}} = \in (β_{10} \otimes β_{14} \otimes \in (β_{15} \otimes \in (β_{16}, α_{16}^{f_{1} + f_{61} + f_{62} + f_{63}}), α_{15}^{f_{64} + f_{65}}), α_{10}^{f_{66}})$

最后，根据串联定理，求出节点1、5、9、10、14、15、16提供给f₂的等价服务曲线为：

$(\begin{matrix} β_{eq}^{{f_{1}}} = β_{1} \otimes β_{5} \otimes β_{9} \otimes β_{(10,14,15,16)}^{{f_{2}}} \\ = β_{1} \otimes β_{5} \otimes β_{9} \otimes \in (β_{10} \otimes β_{14} \otimes \in (β_{15} \otimes \in (β_{16}, α_{16}^{f_{1} + f_{61} + f_{62} + f_{63}}), α_{15}^{f_{64} + f_{65}}), α_{10}^{f_{66}}) \\ = R_{(1,16)}^{f_{2, eq}} {(t - T_{(1,16)}^{f_{2, eq}})}^{+} \end{matrix})$

(4)目标流重组缓存上界计算：

计算重组缓存区的公式如下：

$BufferSize = \max {r_{1} (T_{2} + b_{2} / R_{2} - T_{1}^{low}) + b_{1} + r_{1} T_{1}, r_{2} (T_{1} + b_{1} / R_{1} - T_{2}^{low}) + b_{2} + r_{2} T_{2}}$

${RB}_{1} = r_{1} (T_{2} + b_{2} / R_{2} - T_{1}^{low}) + b_{1} + r_{1} T_{1} = r_{1} (T_{(1,16)}^{f_{2, eq}} + b_{2} / R_{(1,16)}^{f_{2, eq}} - T_{1}^{low}) + b_{1} + r_{1} T_{1}$

${RB}_{2} = r_{2} (T_{1} + b_{1} / R_{1} - T_{2}^{low}) + b_{2} + r_{2} T_{2} = r_{2} (T_{(1,16)}^{f_{1, eq}} + b_{1} / R_{(1,16)}^{f_{1, eq}} - T_{2}^{low}) + b_{2} + r_{2} T_{2}$

BufferSize＝max{RB₁，RB₂}

对于4×4的网络， $T_{1}^{low} = 3 \times (2 \times 4 - 1) = 21, T_{2}^{low} = 3 \times (2 \times 4 - 1) = 21 .$ 把计算出的等参数带入到重组缓存区的计算公式中，得到路径组(119)的重组缓存上界为21.0235。

验证结果的正确性：

对比步骤4和5，说明本发明可以很好的预测重组缓存的最大最小值。在实际计算中，我们只需要计算预测的路径组对应的重组缓存大小，相比全遍历，可以节省遍历时间和算法复杂度。

如图7所示，横坐标表示4×4网络中40对无交叉路径组；纵坐标表示两组曲线的取值；正方形曲线代表40对无交叉路径组对应的冲突系数表(步骤4所得结果)，圆形曲线代表全遍历得到的40对无交叉路径组对应的重组缓存大小(步骤5所得结果)。步骤4从3个冲突系数值来预测一个重组缓存最小值，步骤5从40个冲突系数值来预测一个重组缓存最小值，计算效率提高了13.3倍，准确率达到33.3％；步骤4从8个冲突系数值来预测一个重组缓存最小值，步骤5从40 个冲突系数值来预测一个重组缓存最小值，计算效率提高了5倍，准确率达到12.5％。

本发明为了更清楚地描述预测过程，仅以4×4的片上网络实例，对于更大规模的网络，预测结果会更明显。另外，上例只列举了两条子业务流，不代表本发明只能处理目标业务流拆分为两条子流的网络，可以拓展到拆分为任意数量的子流的处理；示例中虽然仅以二维网格结构的NoC为例说明，不代表本发明只适用于该拓扑结构，可以适用于任意结构的片上网络。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于多路径路由的片上网络重组缓存的上界优化方法 [P] . 中国专利： CN103955584B . 2017.08.25
2. 基于多路径路由的片上网络重组缓存的上界优化方法 [P] . 中国专利： CN103955584A . 2014-07-30
3. Traffic loading optimization method for packet-based communications network with multi-path routing using adaption of distribution weightings of outgoing communications links dependent on traffic loadings [P] . 德国专利： DE102004003548B3 . 2005-06-30

机译：基于流量负载的传出通信链路分配权重自适应的多路径路由分组通信网络流量负载优化方法
4. Routing Flits in a Network-on-Chip Based on Operating States of Routers [P] . 美国专利： US2020153757A1 . 2020-05-14

机译：基于路由器工作状态的片上网络中的路由选择
5. SEAMLESS MOBILITY SCHEMES IN NAMED-DATA NETWORKING USING MULTI-PATH ROUTING AND CONTENT CACHING [P] . 欧洲知识产权局专利： EP3340681B1 . 2020-04-15

机译：使用多路径路由和内容缓存的命名数据网络中的无缝移动方案