電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 49|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

465

主題

465

帖子

3514

積分

四級會(huì)員

Rank: 4

積分
3514
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言( _3 I1 k8 f% C! E1 `2 X6 o
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。: ], d6 ?8 c; x  x! [9 N, o
) U; G9 m! v1 I+ L0 a! n! w
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。# H, T1 p3 n/ a8 [4 T0 d
' q. T( f) Y% I  {1 t& V
& a- q% [! ?6 d- G9 j
背景
% _& z( c- k, \5 a* r光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:8 k% M, H& G: ?1 j6 f
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測器:將光信號(hào)轉(zhuǎn)換回電信號(hào)
    & t* v" b- R1 Z( v2 k( x" m9 f
    * S$ B$ v( n/ A/ s% U
    光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。5 I8 {% K9 n3 E4 ?  t
    ) ~% @4 h8 b0 {/ T% w8 ?, d
    為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:; D- U) L) L  o& n- @. p; B
  • 監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)
  • 預(yù)測未來活動(dòng)
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò), S1 V8 T6 ?) x$ `; X
    1 _$ |* J" C- _& a' i* I6 e
    讓我們看看為不同類型處理器提出的一些具體方案。
    8 w, Q! D% q: L) Y! a
    - e* G6 W  O% b; q7 {多核CPU設(shè)計(jì)中的激光調(diào)制方案" K3 y9 U( n) t$ z" K3 ?1 b
    Probe6 G3 V3 W& b! R' p
    最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
    5 x/ \4 w/ ?; c/ q1 R6 ]" C& M- J: q9 A2 a5 A: ^
    Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動(dòng)。使用兩種類型的預(yù)測器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表  V- k; |: y4 z1 g8 U! h6 G
    [/ol]
      ]2 z; m; X' a8 h1 _錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。% O7 W& m* H  ]& b
    4 N" t) D$ S$ L" g+ L
    ColdBus
      b% U* d2 `9 U) f5 Y2 uColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。+ Q/ k& V( Z/ R7 B6 V3 v

    ' [2 K' @+ F- A5 |, \1 y' h* F使用類似于分支預(yù)測器的基于PC的預(yù)測器來識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測器估計(jì)這些未命中何時(shí)發(fā)生。# \' C- p4 Q2 W: S9 B

    9 J) B6 Q1 G4 X0 kColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。
    & l) X$ R% Z  x5 [# [& K" S- u& j5 B4 @% `9 h; @0 a# j9 W
    PShaRe5 Y; T' X, B2 E. Q% ^
    PShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
    * D: Z: T! Q' s) ?/ f) W3 i: `[/ol]
    2 X/ V, o3 w/ R( t' d圖1顯示了整體架構(gòu):
    % P$ P- [# x( L# X
    - g$ P( z+ C" g3 ]. X5 K" ?/ R   l" G4 O2 Y4 a* h2 O; m
    圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。
    ) x8 D0 }5 [* J, o* l! A  c5 c
    1 A# d: F( M# T) d5 Y, M* _神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個(gè)性能計(jì)數(shù)器輸入,對每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測。
    + w7 t" e" M) T& c3 a: p; E/ Q
    $ @. F/ q9 S  Q) h' r. c2 a; O  hBigBus
    ! _) S# ]- i1 {3 v1 M  J對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    + _  D, T) a/ x% R* i0 h$ I. w7 K$ D7 y; H9 V* t' S0 k$ e, U% W) ]
    圖2說明了BigBus設(shè)計(jì):
    : k& m% |8 R7 T  W9 d' ]. t% `2 I" Z. Z$ P; P3 K

    8 ]8 k! P& g! J8 g- r% g: ]: W; Z, L圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。- j& P9 i7 p. N- s9 I1 |& ]1 n- X5 ~
    5 I" U' o; X; r+ Y( h
    BigBus使用兩階段預(yù)測過程:
  • 每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合& U  d% c0 X/ R6 I% ~
    [/ol]+ l" v9 j5 }8 ]* O. h1 L6 x
    這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
    6 K6 @0 A$ `" ~( ?/ w9 o* @: }' P7 ~- M5 j" ]1 X+ b4 f; }

    + f9 c! b8 B$ f/ W! }% P3 }多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
    ( e  y+ \9 s9 }7 x, J( P& z對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。
    ! l3 J% v7 B( K8 [
    7 J5 @. x2 @6 I8 q% I/ A7 b片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊(duì)列中的待處理事件5 f/ p2 I6 a" U% z3 V3 F$ r" ?$ w
    [/ol]
    7 ~! M. G$ n2 x功率請求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊(duì)列狀態(tài)結(jié)合。
    0 R2 |9 }" R& z/ X$ {( ]# L! t2 \% ?/ `/ i$ q
    GPU設(shè)計(jì)中的激光調(diào)制方案0 ^- V0 N( b: J# B" S$ O. u
    由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
    / o. @% e) V9 t9 }" d3 O7 |. N' i8 _$ U9 o. o* Z3 y
    圖3顯示了GPUOpt的整體架構(gòu):
    ; c- c" A# P, G2 A3 g5 I" Z. Q* W# R8 w9 ~! s
    " M5 K# V8 A6 c7 {- ?: u  H/ U
    圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
    $ S7 }2 _( o2 u
    : A1 j5 q! Z/ }GPUOpt對流式多處理器(SM)站點(diǎn)和最后級緩存(LLC)站點(diǎn)使用不同的預(yù)測機(jī)制:
    & q. K6 g( Z" `4 [1. SM站點(diǎn)使用基于以下因素的受限預(yù)測器(Restr_Pred):. ]1 j( K4 \1 g9 S
  • 接收的消息
  • 發(fā)送的消息
  • 等待時(shí)間$ j% F- J) b. \# R
    . X) ~  V* w! [2 x
    2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測器(Flex_Pred):( O* T! V: g( X3 w+ c
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件* U% H- C, Y: |
    0 I8 O) f1 C- z
    激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
    ; m, h$ n; [- e2 k) O: I1 V" p3 a2 K2 h  t  Y4 h' w
    2 q9 l7 ~9 H( |5 @
    關(guān)鍵概念和趨勢3 M5 q7 ^2 ?$ `  L8 ~
    雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:! ?1 `7 ^3 U. J$ F- ~9 j6 ~, O) M

    9 @4 Y1 H0 S8 K3 z* T) M! w1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測和重新配置
    + F% p# R; _/ w" l6 c! Q2. 使用多個(gè)輸入指標(biāo):7 I" M; d1 h+ i; A  v
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件% O) M& l0 y# x. v7 c1 Q- s
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
    " q6 ]: b3 z$ p9 s6 w4 \4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系7 X. }4 }! R; t, o( N
    5. 對不同流量類型進(jìn)行單獨(dú)預(yù)測(如一致性與非一致性)
    0 X* `. d; D1 T! K! f2 p/ N6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性- X# o; {: E, [. A
    7. 盡可能重用未使用的光功率
      }2 E' H/ r: k6 O) C3 I0 p9 [8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測參數(shù)3 ~" L4 d$ [" V' k0 y5 ^2 R

    $ K6 E- E) J! v/ c圖4說明了有效激光調(diào)制可能帶來的功率節(jié)省:
    1 a  p/ E) ]- m7 G" g  V! [% L$ k% Z& l' e9 r' ^# [2 q2 H
    * J# X5 M1 ^% v$ ^% s) a1 G2 U, r
    圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
    0 E! K; P' Y; ]  u% h# L- ^+ d) E& X  F2 b+ S% d/ |# P0 P. t

    - z# O( ^# \5 I; M0 U未來方向
    7 k/ z7 Y/ P  h  x% b9 C隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:$ V  ~! X9 F$ j  ?/ g1 @
  • 用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識(shí)的集成
  • 在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對新興工作負(fù)載(如AI加速)的專門化
    % M0 Y3 A! w% D$ t- J
    9 B' `9 B  i% E

    0 T# ~. B# r. [- U結(jié)論* O+ O1 o0 k6 J$ `8 A, E6 Y
    有效的激光調(diào)制對實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計(jì)算系統(tǒng)解鎖新的能效水平。4 d  q$ P$ z5 P5 @- z/ \! l
    0 C2 T# n/ S& |
    " n' q/ P9 X% @; E7 r4 P# H9 Y
    參考文獻(xiàn)
    : l$ G! [0 q7 n  V- k, W[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.% ^8 q4 ~2 e1 P& z! x2 U

    / U; `: K8 w; W- END -
    " e  n1 ?' ~# c. \1 `+ w, U6 _6 J% ?$ E, S
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。+ @0 I& t! l; J. s
    點(diǎn)擊左下角"閱讀原文"馬上申請
    $ @" M5 q9 Q1 U: l0 S9 o0 e$ b! E: V3 a3 J) S
    歡迎轉(zhuǎn)載: r" J, U0 b3 f% H% q

    ! [; c# y9 _  ]3 S9 `7 X轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!3 k# {9 z. d1 @. p, V7 q

    7 ?# F2 P$ d+ U% g% i: N9 h
    9 T+ g/ M$ s# H: Z
    ' C/ B% J5 Q) A2 E* G/ @0 N3 J* @( q: w

      ~8 h4 D% h3 S! s9 N8 F" V
    ; p5 u6 N( W% H4 a( y5 M6 f  J/ u2 n關(guān)注我們
    5 v6 I/ \! n( X
    + W  j( G8 w: n9 {. o

    " u/ ~5 w8 X; V) R, Y' ` ! [5 P+ B* T% W: P* w) M' a
    0 q9 J! V9 E& ~9 c% }' X

    - \& s7 z2 v- [; s8 K
    / |" K+ o: [2 v7 R8 m* y
    7 g. j5 G+ O; O- c/ ?
                          9 j1 x8 [& o% @, k, o
    5 g! g) T- I; r& _2 u) w

    # O/ R) n) x8 Y* y
    4 s. b! c9 m7 y; m4 h' H( n) R關(guān)于我們:' t% F4 P! C: y6 r6 x; H4 O3 A
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    ' w8 q' ?! g) u) x+ v
    8 e( [/ c9 c0 `0 Khttp://www.latitudeda.com/9 Z6 [3 Y; [/ D7 M
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表