|
引言
+ _7 K8 ^4 z* F. Z$ L隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
( O" Z' G7 c( Y& e
7 b0 y7 k: ]- c5 P- K- M, y本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。$ ~& o4 J" c) |+ V, Z4 P
9 l- {8 l/ C% A9 \2 b
, F/ C% _. f9 A8 a5 _$ l
背景! h0 e7 N* U7 J1 ~8 U+ W; e
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:" a2 V2 w: w3 | R3 ?
激光器:光源,可以是片外或片上調(diào)制器:將電信號轉(zhuǎn)換為光信號波導(dǎo):在芯片上引導(dǎo)光光電探測器:將光信號轉(zhuǎn)換回電信號
6 N& d* B& A. f9 `+ u0 _& h
3 | P7 g7 M* R# A光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
% E6 ^4 O# U+ c) R4 S, Z, N# g, ^/ J% s2 c& i. \7 o7 o; A
為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:
* M5 {" o* x( b8 ?( L" O6 c監(jiān)控網(wǎng)絡(luò)活動指標(biāo)預(yù)測未來活動相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)
! K! a# O' D7 s, X( |2 g8 ~$ _0 D; \4 B9 a; f
讓我們看看為不同類型處理器提出的一些具體方案。
5 @3 {( {' F! y/ c
6 X, R8 N: {6 a2 F多核CPU設(shè)計中的激光調(diào)制方案8 U. t! J7 @7 \. c8 Y
Probe
% |" _. G# o" e% ~# z4 j( f1 A最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
7 ^ R" }! d/ N) W' h- s" y6 r0 w9 k- C" T$ f/ g
Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
/ T4 U8 a' n* _# N- {. j: t/ L[/ol]
i( m# q# Z7 K1 `7 f錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。
" c& c/ Q* { E! D7 b! J
/ i, {- J) e" D8 [ f/ Q' \+ nColdBus0 w: y( V. `+ e
ColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
6 O J+ N+ m, r% M/ r4 D- x- E% V$ M+ I) @! n
使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。
' i$ o0 _- U5 ?- E( _& S! a) G
3 J/ r0 |0 V+ t, Y* @( AColdBus還引入了一個"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。
9 u4 ~$ {# C5 [0 m, C
+ c7 B& E) t6 R, ?PShaRe: a' [" j6 |' y6 |" d7 u3 A
PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器站點(diǎn)之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
" F' g- U4 _* e; A2 M/ u[/ol]
6 e U _+ Q* H; ^圖1顯示了整體架構(gòu):
: U4 U$ \& u! B5 q7 ]0 ]6 S0 F) A5 k8 N
cjhdyiznw5w64024513536.png (157.24 KB, 下載次數(shù): 2)
下載附件
保存到相冊
cjhdyiznw5w64024513536.png
2024-9-20 01:31 上傳
2 n( X% L8 c6 x
圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。( K3 i- W9 ^3 ?# O$ a
9 s' b5 `! `/ U- w, [- X( e) ]
神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點(diǎn)在下一個時期的活動進(jìn)行二元預(yù)測。1 F: W0 }! z1 W/ T* X: w2 T
9 x! p! x6 g5 }. d4 j' mBigBus9 d6 }4 e" a' u
對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。 s. ]3 L J# J2 j. e( A
7 {0 X. x; B" }- n% p2 n: f
圖2說明了BigBus設(shè)計:- E$ R& x) n9 z/ C B
1 w0 n$ r2 f% B1 l0 |* g( ^5 z. e1 q
hck0tgbp1b364024513636.png (216.89 KB, 下載次數(shù): 2)
下載附件
保存到相冊
hck0tgbp1b364024513636.png
2024-9-20 01:31 上傳
$ z ~5 F' Y. p9 r9 M) I1 J圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。1 r8 [, q. ]) Q7 n& a, z$ u
4 Q+ r6 ^4 M8 i. j5 E8 E9 k" A
BigBus使用兩階段預(yù)測過程:每個站點(diǎn)根據(jù)等待時間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合$ C2 }: u4 y2 _# K, @
[/ol]
0 }; R- D9 C+ u! g; y. h) g7 v; y2 a這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。2 m% L) E3 V* [& {+ Q
/ T- I+ W/ K9 h' N1 F, ^. I' x! T1 d" T7 f$ P) j( s
多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
" z8 i% q, c7 w1 m對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
+ q. R# `& j8 v: z4 n+ r5 |. A
' P) Y9 Y/ L R" X* e片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊列中的待處理事件
2 z) f. E. B7 p[/ol]
' `6 x' D# k9 f' g/ i$ w功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。
. G+ d. s, i }, N9 T# ^( w% f& |1 h
GPU設(shè)計中的激光調(diào)制方案& z1 P; U! z3 \+ e7 @$ A) H
由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。
" R) Z1 i' K# W
4 I9 T: f! n' k7 b; N圖3顯示了GPUOpt的整體架構(gòu):
, D5 X$ I) m' M! i |
# G7 Y) D- [! w0 l# @% g/ D
2r1e3lybmxf64024513736.png (198.05 KB, 下載次數(shù): 2)
下載附件
保存到相冊
2r1e3lybmxf64024513736.png
2024-9-20 01:31 上傳
0 Z/ D6 m9 {! @% A1 `1 }圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。, C$ h9 z4 D2 v# u
6 Y+ j/ |$ V4 `: D$ A7 ]; fGPUOpt對流式多處理器(SM)站點(diǎn)和最后級緩存(LLC)站點(diǎn)使用不同的預(yù)測機(jī)制:
( K. {% Q8 f7 s: q* B E: }1. SM站點(diǎn)使用基于以下因素的受限預(yù)測器(Restr_Pred):
0 f/ ^7 q7 l( ~& d3 {& j: @5 b接收的消息發(fā)送的消息等待時間5 i1 q3 b2 u! N( D: X
% R9 T$ P2 t$ E! v
2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測器(Flex_Pred):
8 m7 [, [7 d& @0 b接收的消息發(fā)送的消息待處理事件* x7 ~: \- \+ E8 M* C! r; g
1 [2 V6 k" g6 V% }0 f) y
激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。4 u0 ]1 i% }, P) T$ d5 `4 {
7 `7 Q/ A# O9 O. [' P6 Z; v7 h2 R/ i. z- K2 w0 I9 r
關(guān)鍵概念和趨勢/ ]9 e% F9 | ~2 k9 E
雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:
9 _% D4 c6 i" [0 E; `" ~# N g6 K! i% E
1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置
8 h, ?+ b& E5 a/ e5 j2. 使用多個輸入指標(biāo):
; n5 S6 v2 _3 ^網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件, m; F I! C3 }# k! H
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
2 X" x; X: l: e8 G2 c5 ]4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
/ H& L4 a" v2 q5. 對不同流量類型進(jìn)行單獨(dú)預(yù)測(如一致性與非一致性)7 @* q' D! m6 O, B0 L2 H
6. 分層設(shè)計以實(shí)現(xiàn)可擴(kuò)展性
_& }3 M0 ~8 U4 J# D G7. 盡可能重用未使用的光功率
2 C+ K3 b7 I# C# D; c% r2 a8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測參數(shù)2 x) D( T% E: ^- h- I: F$ @
% w3 j" F# _1 t6 j$ y/ g2 g
圖4說明了有效激光調(diào)制可能帶來的功率節(jié)省:
; X! O9 S3 ]$ Z9 B7 `# C
' C+ N6 x, u! G9 z; @3 o
opnnfadxepq64024513836.png (100.12 KB, 下載次數(shù): 2)
下載附件
保存到相冊
opnnfadxepq64024513836.png
2024-9-20 01:31 上傳
, M- C( E' P5 h U3 |圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。- z9 w' N: u% m# U- @
2 X1 c: _% r+ Y+ D; g( w5 E
5 i% z3 r$ Y, {( a% g1 A未來方向
( B: Y" ~$ x: @. ]( \' }隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
# K* Z$ p1 r' d6 e' o用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識的集成在運(yùn)行時調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對新興工作負(fù)載(如AI加速)的專門化
/ [ e, n. j7 U) u/ A* `* a# r0 r. i, n5 O/ k2 m
H7 J4 i% N1 S2 m
結(jié)論
P" @$ @" x! T' U有效的激光調(diào)制對實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。' P, t0 H7 i K' V2 i
( ~! `" b, [7 N2 V6 C7 n
5 G5 ]0 _3 j8 K$ o8 b5 r3 g, P1 P
參考文獻(xiàn)
' u/ r/ y) e" v9 V" @' A6 q9 D$ E[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.1 ?2 @- f5 O$ C Q4 y
7 v8 H/ Z# V2 }$ ]! a
- END -& d2 a# @: W" |- H! r/ K
f v& i6 V/ C
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
+ U8 w4 c% v) C; J& [0 U點(diǎn)擊左下角"閱讀原文"馬上申請* y8 R, Q. {* r/ p% B1 y1 i
! D& E2 a& U! Q7 P, l* {
歡迎轉(zhuǎn)載" m, }+ r! _$ g2 K9 m
0 j- Q* s" N- z/ @8 d" Y- S5 z) |
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
" K; R# C9 Z) y" R: q7 b# E5 c1 x: X/ o7 ]
5 {5 \1 }( V+ U, c7 N4 D6 E8 R8 d. p+ h: t( O( t9 x
pqequtkewc264024513936.gif (16.04 KB, 下載次數(shù): 2)
下載附件
保存到相冊
pqequtkewc264024513936.gif
2024-9-20 01:31 上傳
, G$ [2 o: W2 x+ ?
$ q# M6 o( v6 R; @
關(guān)注我們- ^* Y4 r7 |9 e, k
9 q% Z; {& L" O: }8 [- \3 I0 Y" }9 }3 x
f04h1q5oxrw64024514036.png (31.33 KB, 下載次數(shù): 2)
下載附件
保存到相冊
f04h1q5oxrw64024514036.png
2024-9-20 01:31 上傳
/ i) s' Q4 l- v; i- w5 P
| 6 v7 F H% [; J6 v5 v
ckxurcq3lg364024514137.png (82.79 KB, 下載次數(shù): 2)
下載附件
保存到相冊
ckxurcq3lg364024514137.png
2024-9-20 01:31 上傳
4 Q1 K2 L% ~- K0 w7 v
| : Q! B- y2 o7 e% o( A
rq40zwpyofx64024514237.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
rq40zwpyofx64024514237.png
2024-9-20 01:31 上傳
8 l9 B# _! E, _6 }4 O6 q |
3 n% C# M% Y; L
9 r- [ i9 {- a4 G, J) H8 @: S9 X& M8 E- I) y; S! c, ^
9 u B0 {8 U- i, L+ H: F- F5 q關(guān)于我們:
9 s) j, w$ D) J/ Z! X. R. l深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
# l' p, Y5 c+ Z- `% ^$ E6 M
; b% e# D" t7 R6 ehttp://www.latitudeda.com/2 Q* Z/ V$ f# ]& X( q# @# B" {
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|