|
引言( _3 I1 k8 f% C! E1 `2 X6 o
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。: ], d6 ?8 c; x x! [9 N, o
) U; G9 m! v1 I+ L0 a! n! w
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。# H, T1 p3 n/ a8 [4 T0 d
' q. T( f) Y% I {1 t& V
& a- q% [! ?6 d- G9 j
背景
% _& z( c- k, \5 a* r光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:8 k% M, H& G: ?1 j6 f
激光器:光源,可以是片外或片上調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)波導(dǎo):在芯片上引導(dǎo)光光電探測器:將光信號(hào)轉(zhuǎn)換回電信號(hào)
& t* v" b- R1 Z( v2 k( x" m9 f* S$ B$ v( n/ A/ s% U
光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。5 I8 {% K9 n3 E4 ? t
) ~% @4 h8 b0 {/ T% w8 ?, d
為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:; D- U) L) L o& n- @. p; B
監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)預(yù)測未來活動(dòng)相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò), S1 V8 T6 ?) x$ `; X
1 _$ |* J" C- _& a' i* I6 e
讓我們看看為不同類型處理器提出的一些具體方案。
8 w, Q! D% q: L) Y! a
- e* G6 W O% b; q7 {多核CPU設(shè)計(jì)中的激光調(diào)制方案" K3 y9 U( n) t$ z" K3 ?1 b
Probe6 G3 V3 W& b! R' p
最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
5 x/ \4 w/ ?; c/ q1 R6 ]" C& M- J: q9 A2 a5 A: ^
Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動(dòng)。使用兩種類型的預(yù)測器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表 V- k; |: y4 z1 g8 U! h6 G
[/ol]
]2 z; m; X' a8 h1 _錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。% O7 W& m* H ]& b
4 N" t) D$ S$ L" g+ L
ColdBus
b% U* d2 `9 U) f5 Y2 uColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。+ Q/ k& V( Z/ R7 B6 V3 v
' [2 K' @+ F- A5 |, \1 y' h* F使用類似于分支預(yù)測器的基于PC的預(yù)測器來識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測器估計(jì)這些未命中何時(shí)發(fā)生。# \' C- p4 Q2 W: S9 B
9 J) B6 Q1 G4 X0 kColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。
& l) X$ R% Z x5 [# [& K" S- u& j5 B4 @% `9 h; @0 a# j9 W
PShaRe5 Y; T' X, B2 E. Q% ^
PShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器站點(diǎn)之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
* D: Z: T! Q' s) ?/ f) W3 i: `[/ol]
2 X/ V, o3 w/ R( t' d圖1顯示了整體架構(gòu):
% P$ P- [# x( L# X
- g$ P( z+ C" g3 ]. X5 K" ?/ R
v0i132opydn64034878813.png (157.24 KB, 下載次數(shù): 2)
下載附件
保存到相冊
v0i132opydn64034878813.png
2024-9-22 01:17 上傳
l" G4 O2 Y4 a* h2 O; m
圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。
) x8 D0 }5 [* J, o* l! A c5 c
1 A# d: F( M# T) d5 Y, M* _神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個(gè)性能計(jì)數(shù)器輸入,對每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測。
+ w7 t" e" M) T& c3 a: p; E/ Q
$ @. F/ q9 S Q) h' r. c2 a; O hBigBus
! _) S# ]- i1 {3 v1 M J對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
+ _ D, T) a/ x% R* i0 h$ I. w7 K$ D7 y; H9 V* t' S0 k$ e, U% W) ]
圖2說明了BigBus設(shè)計(jì):
: k& m% |8 R7 T W9 d' ]. t% `2 I" Z. Z$ P; P3 K
2lsssyofp4g64034878913.png (216.89 KB, 下載次數(shù): 4)
下載附件
保存到相冊
2lsssyofp4g64034878913.png
2024-9-22 01:17 上傳
8 ]8 k! P& g! J8 g- r% g: ]: W; Z, L圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。- j& P9 i7 p. N- s9 I1 |& ]1 n- X5 ~
5 I" U' o; X; r+ Y( h
BigBus使用兩階段預(yù)測過程:每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合& U d% c0 X/ R6 I% ~
[/ol]+ l" v9 j5 }8 ]* O. h1 L6 x
這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
6 K6 @0 A$ `" ~( ?/ w9 o* @: }' P7 ~- M5 j" ]1 X+ b4 f; }
+ f9 c! b8 B$ f/ W! }% P3 }多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
( e y+ \9 s9 }7 x, J( P& z對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。
! l3 J% v7 B( K8 [
7 J5 @. x2 @6 I8 q% I/ A7 b片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊(duì)列中的待處理事件5 f/ p2 I6 a" U% z3 V3 F$ r" ?$ w
[/ol]
7 ~! M. G$ n2 x功率請求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊(duì)列狀態(tài)結(jié)合。
0 R2 |9 }" R& z/ X$ {( ]# L! t2 \% ?/ `/ i$ q
GPU設(shè)計(jì)中的激光調(diào)制方案0 ^- V0 N( b: J# B" S$ O. u
由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
/ o. @% e) V9 t9 }" d3 O7 |. N' i8 _$ U9 o. o* Z3 y
圖3顯示了GPUOpt的整體架構(gòu):
; c- c" A# P, G2 A3 g5 I" Z. Q* W# R8 w9 ~! s
m5tbfrm3byw64034879013.png (198.05 KB, 下載次數(shù): 2)
下載附件
保存到相冊
m5tbfrm3byw64034879013.png
2024-9-22 01:17 上傳
" M5 K# V8 A6 c7 {- ?: u H/ U
圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
$ S7 }2 _( o2 u
: A1 j5 q! Z/ }GPUOpt對流式多處理器(SM)站點(diǎn)和最后級緩存(LLC)站點(diǎn)使用不同的預(yù)測機(jī)制:
& q. K6 g( Z" `4 [1. SM站點(diǎn)使用基于以下因素的受限預(yù)測器(Restr_Pred):. ]1 j( K4 \1 g9 S
接收的消息發(fā)送的消息等待時(shí)間$ j% F- J) b. \# R
. X) ~ V* w! [2 x
2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測器(Flex_Pred):( O* T! V: g( X3 w+ c
接收的消息發(fā)送的消息待處理事件* U% H- C, Y: |
0 I8 O) f1 C- z
激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
; m, h$ n; [- e2 k) O: I1 V" p3 a2 K2 h t Y4 h' w
2 q9 l7 ~9 H( |5 @
關(guān)鍵概念和趨勢3 M5 q7 ^2 ?$ ` L8 ~
雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:! ?1 `7 ^3 U. J$ F- ~9 j6 ~, O) M
9 @4 Y1 H0 S8 K3 z* T) M! w1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測和重新配置
+ F% p# R; _/ w" l6 c! Q2. 使用多個(gè)輸入指標(biāo):7 I" M; d1 h+ i; A v
網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件% O) M& l0 y# x. v7 c1 Q- s
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
" q6 ]: b3 z$ p9 s6 w4 \4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系7 X. }4 }! R; t, o( N
5. 對不同流量類型進(jìn)行單獨(dú)預(yù)測(如一致性與非一致性)
0 X* `. d; D1 T! K! f2 p/ N6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性- X# o; {: E, [. A
7. 盡可能重用未使用的光功率
}2 E' H/ r: k6 O) C3 I0 p9 [8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測參數(shù)3 ~" L4 d$ [" V' k0 y5 ^2 R
$ K6 E- E) J! v/ c圖4說明了有效激光調(diào)制可能帶來的功率節(jié)省:
1 a p/ E) ]- m7 G" g V! [% L$ k% Z& l' e9 r' ^# [2 q2 H
om02xkr3dhc64034879113.png (100.12 KB, 下載次數(shù): 3)
下載附件
保存到相冊
om02xkr3dhc64034879113.png
2024-9-22 01:17 上傳
* J# X5 M1 ^% v$ ^% s) a1 G2 U, r
圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
0 E! K; P' Y; ] u% h# L- ^+ d) E& X F2 b+ S% d/ |# P0 P. t
- z# O( ^# \5 I; M0 U未來方向
7 k/ z7 Y/ P h x% b9 C隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:$ V ~! X9 F$ j ?/ g1 @
用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識(shí)的集成在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對新興工作負(fù)載(如AI加速)的專門化
% M0 Y3 A! w% D$ t- J9 B' `9 B i% E
0 T# ~. B# r. [- U結(jié)論* O+ O1 o0 k6 J$ `8 A, E6 Y
有效的激光調(diào)制對實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計(jì)算系統(tǒng)解鎖新的能效水平。4 d q$ P$ z5 P5 @- z/ \! l
0 C2 T# n/ S& |
" n' q/ P9 X% @; E7 r4 P# H9 Y
參考文獻(xiàn)
: l$ G! [0 q7 n V- k, W[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.% ^8 q4 ~2 e1 P& z! x2 U
/ U; `: K8 w; W- END -
" e n1 ?' ~# c. \1 `+ w, U6 _6 J% ?$ E, S
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。+ @0 I& t! l; J. s
點(diǎn)擊左下角"閱讀原文"馬上申請
$ @" M5 q9 Q1 U: l0 S9 o0 e$ b! E: V3 a3 J) S
歡迎轉(zhuǎn)載: r" J, U0 b3 f% H% q
! [; c# y9 _ ]3 S9 `7 X轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!3 k# {9 z. d1 @. p, V7 q
7 ?# F2 P$ d+ U% g% i: N9 h
9 T+ g/ M$ s# H: Z' C/ B% J5 Q) A2 E* G/ @0 N3 J* @( q: w
tlesfwadvw464034879213.gif (16.04 KB, 下載次數(shù): 4)
下載附件
保存到相冊
tlesfwadvw464034879213.gif
2024-9-22 01:17 上傳
~8 h4 D% h3 S! s9 N8 F" V
; p5 u6 N( W% H4 a( y5 M6 f J/ u2 n關(guān)注我們
5 v6 I/ \! n( X
+ W j( G8 w: n9 {. o
" u/ ~5 w8 X; V) R, Y' `
0rzxntnecf364034879313.png (31.33 KB, 下載次數(shù): 1)
下載附件
保存到相冊
0rzxntnecf364034879313.png
2024-9-22 01:17 上傳
! [5 P+ B* T% W: P* w) M' a
| 0 q9 J! V9 E& ~9 c% }' X
wklhaednp3g64034879413.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wklhaednp3g64034879413.png
2024-9-22 01:17 上傳
- \& s7 z2 v- [; s8 K | / |" K+ o: [2 v7 R8 m* y
v05awecejyj64034879513.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
v05awecejyj64034879513.png
2024-9-22 01:17 上傳
7 g. j5 G+ O; O- c/ ?
| 9 j1 x8 [& o% @, k, o
5 g! g) T- I; r& _2 u) w
# O/ R) n) x8 Y* y
4 s. b! c9 m7 y; m4 h' H( n) R關(guān)于我們:' t% F4 P! C: y6 r6 x; H4 O3 A
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
' w8 q' ?! g) u) x+ v
8 e( [/ c9 c0 `0 Khttp://www.latitudeda.com/9 Z6 [3 Y; [/ D7 M
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|