2024年5月14日发(作者:)
L■!—j C 巾hin国a Int集e成电路 grated Circuit 设计— 隅 ’1
一
种3D Octagon
双环片上网络拓扑结构
王辉,王长山
(西安电子科技大学计算机学院,陕西西安71 0071)
摘要:随着片上网络IP核结点的增加,芯片面积受限的问题目益突出,利用3D拓扑,用体积换取芯片面
积是一种可行的方案,这种结构使各个结点的物理距离更近,从而充分地利用了空间资源,可以有效地
减少芯片面积。提出一种3D Octagon双环拓扑结构,在均衡负载模式和对称随机负载模式下分析了其
网络延迟和吞吐率。结果表明,3D Octagon双环是一种性能良好、可行性高的片上网络拓扑结构。
关键词:片上网络Octagon 3D拓扑路由算法
3D Octagon Double Ring Topology for the Network-on-chip
WANG Hui,WANG Chang—shan
(School of Computer Science&Technology,Xidian University,Shannxi,Xi’an,7 1 007 1)
Abstract:With the IP core of network—on—chip nodes increases,chip area is limited to issues become increasingly
prominent,the use of 3D topology,with the volume for the chip area is a feasible solution,this structure make the
physical distance of each node closer,and full use of space resources,can effectively reduce the chip area.Proposed a
3D Octagon Double Ring topology,In load balancing mode and symmetric mode of random load evaluated its network
latency and throughput.The results show that,3D Octagon Double Ring is a good performance,high feasibility of
network-on-chip topology.
Key words:network-on-chip Octagon 3D topology routing algorithm
随着片上系统(SoC)的集成度越来越高,传统
点是如何在芯片中分布和连接的。拓扑结构的选择
的总线结构已经不能高效地满足当前IP核之间通
对系统性能和芯片面积具有显著的影响。拓扑结构
信的需求。为了克服总线结构的不足,片上网络
(Network on Chip,NoC)作为一种新的解决途径被
提出。
的衡量标准通常是以理论上影响路由成本和性能为
基础的,除了要考虑普通网络中所关心的节点数量、
边的数量、网络维度、网络直径、平均距离、对分宽度
片上网络的拓扑结构体现了NoC中的通讯节
之外,还要考虑通信模式的嵌入屙l生,例如消息吞吐
h++n.Ih-^^^ ;m
L设计 . lI
量、传输延迟、功耗、芯片面积等因素。
当IP核结点增加时,传统的2D拓扑结构芯片
个Octagon,再把相应位置的节点连接起来,但这种
方法的致命弱点是布线复杂度太高。
为解决Octagon以上两种扩展方式的突 瓶
面积受限的问题日益突出,利用3D拓扑,用体积换
取芯片面积是一个可行的方案,这种结构使各个结
颈,结合3D拓扑结构的特点,提出了3D Octagon双
环结构,在3D Mesh基础上将垂直方向的对应节点
相互连接形成3D Octagon双环拓扑结构(如图2),
其中每层中的平面网络结构为Octagon双环结构
(如图3) 。
点的物理距离更近,从而充分地利用了空间资源,可
以有效减少芯片面积。同时,结合集成电路工艺方面
的先进技术,可以制成3D—Ic一3D—NoC的高集成
度系统,从而实现更高级的功能。尽管3D拓扑现在
还没有具体商用,但它必然是未来片上网络拓扑结
构的研究热点和发展方向I l。
\毒 : := 0
H—__1 一
——
一,,
\
¨
,_,一£ === .=1i ≥
1 3D Octagon双环
、
—・ > :=二 ; 一。
网络拓扑的基本结构
,\_\1一 墨 : =:二= 2 一_ I ; 卜— 一/
Ii ’
.
一 三 == —、
在NoC的研究过程中,人们在简单的环型总线
\、
结构的基础上提出了一个笼统的拓扑规范——
Spidergon,它是对环总线结构的一种改进,缩短了平
,, ≤ P/
图2 3D Octagon双环拓扑结构 图3 Octagon双环拓扑结构
均距离,并且使网络具有了一定的可扩展性。而
Octagon是Spidergon当N=8时的特例。这种结构的
2路由器结构
3D Octagon双环结构采用的路由器是在2D
最大特点就是网络距离短,任何两个结点之间通信
最多只需两步即可完成。运用在其上的分组形式和
路由算法均比较灵活,并且布线复杂度较交叉开关
NoC路由器的基础上发展而来的。在传统的2D NoC
中,一个典型的路由器包括5个端口:东、南、西、北
结构低很多。
Octagon有两种扩展方式(如图1)。其一是两
个Octagon通过一个中问节点连接的结构,但很显
然这种结构的中间节点将成为通信的瓶颈。另一种
和本地端口(连接路F}1器与本地处理单元的端口)。
在3D Octagon路由器中,新增了“上”和“下”两个
端口,用来连接纵向各层的节点。新增的端n同原
结构是把一个Octagon中的每一个节点都扩展成一
端口具有相同的微结构。每个端口都有输入通道和
输出通道。所有通道都能够从其他路由器或本地处
理单元(PE)接收或发送数据包。每个输入端口由
若干个虚通道组成,以避免网络中发生死锁。路由
器中间设计了一个多项转换开关,为了将输入通道
接收到的数据包传送到正确的输 通道[s-9]。
3基于最短路径的3D路由算法
(a) (b)
路由算法是影响片上网络通信效率的重要因
素。充分利用3D Octagon双环网络拓扑结构和节点
图1 Octagon的两种扩展结构
http://www.cicmag.com
,—■■—r———————————————————————————————————————————————————————一 .
【■!■j C_ 巾hin国a In集tegr成ated电Circ路uit
分布连接的特点,每个节点接收到消息后,由本节点
1一k1 ̄,计— 丌.-一———
(cur_routero一1)rood8),返回步骤step4;
决定是接收该消息还是计算路由将该消息发送到相
邻节点,采用基于最短路径的3D路由算法,具体步
Step9:若3 lout_router日一D。J≤6,则(cuLr(Jufe ,
cur
_
routero)=(cur_routern,(currouter +4)mod8),
骤如下:
输入:源节点( , ,S。),目的节点( , ,D )
输出:路由路径routpath
算法步骤: (cur_routern,cur
_
router。)
StepI:初始化当前路 由节点(cur
._
routerL。cur
_
routern
,
cur routero)=(S, ,S );路由路径routpath=
cur router;
Step2: ̄i]断cur-router,= ?若是则执行step4;否则
执行步骤step3:
Step3:判断cur__routerL>D,?若成立则OHr
_
routerL
=cur router ̄一1返回步骤2;否则cur_touterl
=cur-routerL+l返回步骤2;
Step4: ̄1]断cur-routern= ?若cur
_
routern=DR则执
行步骤step5;否则执行步骤step6;
Step5:检查cur router =D。?若是则算法终止,输出
路由路径routpath;否则,执行计算ls。一D l值,并执
行步骤step7:
Step6:判断cu-rrouterR> ?,若cur_routern> 则
执行(cur_routern,cur router。)=(cur
_
routern一1,
cur
routero),routpath=[routpath,cur_router],并返回
步骤step4;否则执行(cur._routern,cur
_
router。)=
(cur routerH+1,cur routero),routpath:【routpath,
cur
_
rout叫,并返回步骤step4;
Step7:若,贝0 0断O<lcur__router8一D。l42,贝0 0断
cur router。一D。>07,若是则(cur_muter ̄,cur_router )
=
(cur-routern,cur-routero—1),routpath=[routpath,
cur-rout卅返回步骤step4;否则(our routern,
cur routero):(cur_routerR,cur-router。4-1),
routpath=[routpath,cur_router]返回步骤step4;
Step8:若,贝0 0断6≤Icur._router 一D。I≤7,贝0 0断
cur
__
router —D。>07,若是则(cur-routern。
cur routero):(cur.routern,(cur
_
router +1)mod8),
routpath=[routpath,cur router]返回步骤step4;否则
(cur_routern, cur
_
router ) =(cur
_
routern.
http:I/www.cicmaQ.com
mu a =[fou a ,cur router]返回步骤step4;
4仿真分析
NoC拓扑结构设计的两个重要的性能参数是平
均通讯延迟和平均吞吐量。为了进一步研究3D
Octagon双环互连网络的性能,模拟和分析了3D
Octagon双环,3D Mesh和3D Toms结构,3D Octag0n
双环结构采用基于最短路径的路由算法,3D M h
和3D Toms结构采用XYZ路由机制。采用一条虚信
道,虫孔交换机制,链路速率为10kbps,仿真时,3D
Mesh和3D Toms结构规模为4 x4×4,3D 0ctagon
双环结构采用4层规模,这样保证了三种结构在对
比中的节点数均为64个 。
罢
寺
吾
蠹
吕
器
E
墨
主
njection Ra ̄e(flit/cycldnode
图4(a)均衡负载模式
Injection Rate(lfit/cycle/node
图4(b)随机对称负载模式
1L设计 ,几.。 巾国集成电路l…H
11 flits/node/cycle。
c宕Du[ l。 詈na 弓Ju』-
4 2 0
InjecUon Rate(lfiUcyclefnode)
图5(a)均衡负载模式
0 0o 0 02 0 04 n∞0 08 010 012 014 01G 018 0 20 0 22
Injection Rate(tlifcyddnode)
图5(b)随机对称负载模式
图4(a)为均衡负载模式下的延迟,从图中可
看 ,当注入率在0到0.12flits/node/cycle时,
三种结构的延迟均很低,其中,3D Toms的延迟为12
cycle,3D Mesh为l5 cycle。当注入率大于0.12 lfits/
node/cycle时,当注入率在0.16 lfits/node/cycle
时,3D Octagon双环结构的网络延迟开始增长,但增
长速度小于3D Mesh和3D Torus结构。
图4(b)为随机对称负载模式下的延迟,从图
中可看出,当注入率小于0.0476 lfits/node/cycle
时, 种结构的延迟均很低,当注入率大于0.625
lfits/node/cycle时,3D Toms的延迟开始增大,此
后,在相同注人率下,3D Octagon双环结构的延迟一
直低于另外两结构。
图5(a)为均衡负载模式下的吞吐,当注入率
小于0.15 lfits/node/cycle时,网络未发生拥塞,三
种结构在单位时间收到的数据包相同,当注入率大
于0.25 nits/node/cycle时,网络的饱和吞吐量为
图5(b)为随机负载模式下的吞吐,当注入率
大于0.059 flits/node/cycle时,3D Mesh吞吐量逐
渐趋于饱和,而3D Octagon双环结构在注入率大于
O.15 lfits/node/cycle时,才逐渐趋于饱和值,且吞
吐量均高于另两者。
5结论
本文提出了3D Octagon双环拓扑结构,在同等
网络规模及相关条件下将该结构与3D Mesh和3D
Toms结构进行了对比分析,主要从网络延迟和吞吐
率两个方面对该结构进行了性能评估,仿真结果表
明,3D Octagon双环拓扑结构具有较低的通信延迟
和较高的网络吞吐,是一种高效可行的3D拓扑结
构。四
参考文献
『1]A.Jantsch,et—a1.Networks on Chip.Hague:Kluwer
Academic Publishers.2003.
【2]Pavlidis V F,Friedman E G.3-D Topologies for
Netw0rks一0n—Chip[e1.IEEE Trans.Very large scale
integration(VLS1 07),Oct.2007:1081—1090.
[3】 Srinivamn Muralieta1.Synthesis of networks on
chips ofr 3D sys-tems oi”Ichips[c】.Proceedings of the
2009 Conference on Asia and South Pacific Design
Automation 242—247.
[4]Matsutani,Hiroki Koibuchi, Michihiro Amano,
Hideharu Tightly—Coupled Multi-Layer Topologies for
3一D NoCs.Parallel Processing.2007.ICPP 2007.
International Conference on,PP.75—76,Sept.2007
f51 Salminen E,Kulmala A,Hamalainen T D.On
Network-on-chip Comparison 【CJ//1 0th Euromicro
Conference on Digital System Design Architectures,
Methods and Tools.Lubeck:IEEE,2007:503—5 10.
[6]N.Eisley,L-S Peh.High-level power analysis ofr
(下转第65页)
h什n.,^^^^^^,r、ir、m盘n nm
发布者:admin,转转请注明出处:http://www.yc00.com/news/1715618545a2645800.html
评论列表(0条)