電子產業(yè)一站式賦能平臺

PCB聯(lián)盟網

搜索
查看: 53|回復: 0
收起左側

光學片上網絡的激光調制方案

[復制鏈接]

465

主題

465

帖子

3514

積分

四級會員

Rank: 4

積分
3514
跳轉到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言; t( c9 P1 r8 d  H$ X: r
隨著硅晶體管縮放接近極限,研究人員正在探索新技術以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學網絡(也稱為光學片上網絡或光學NoC)來替代傳統(tǒng)的電氣互連。與電氣網絡相比,光學NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學NoC的功耗帶來了新的挑戰(zhàn)[1]。
8 \4 }+ O( p) O
* j+ p2 m3 K0 F0 E# `, x6 H本文將探討用于最小化光學NoC靜態(tài)功耗的激光調制方案。我們將介紹基于網絡活動動態(tài)調制激光功率的關鍵概念、架構和預測技術。
! o- J/ b6 m+ l* H% G6 z; z2 t0 m4 R; |: I, w. \

+ m  Z& c1 ?' i% A+ q背景
: P/ K$ N5 E. ~$ u8 S& ]! [( p( r光學NoC使用光來傳輸芯片上組件之間的數(shù)據;緲嫿K包括:
) F1 s1 M- [5 d. Y! k' v
  • 激光器:光源,可以是片外或片上
  • 調制器:將電信號轉換為光信號
  • 波導:在芯片上引導光
  • 光電探測器:將光信號轉換回電信號
    9 A$ v$ J- ^' ?. [9 l/ k
    - e- ~& H1 Y+ c$ O) j
    光傳輸本身非常高效,但產生光的激光器消耗大量功率。一個關鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據時也是如此。這種靜態(tài)功耗可能占光學NoC總功耗的80-90%。; n: C4 G# {7 `+ v  G6 I6 [

    " T; r. M  f0 L為解決這個問題,研究人員開發(fā)了激光調制方案,旨在根據預測的網絡活動動態(tài)調整激光功率。一般方法包括:3 q: E( M# N6 L9 l" K& x) U
  • 監(jiān)控網絡活動指標
  • 預測未來活動
  • 相應調整激光功率
  • 重新配置網絡
    1 N$ t1 l7 }  T% H1 O. @( o2 f

    0 [  o7 t; G* B$ T讓我們看看為不同類型處理器提出的一些具體方案。
    7 ?' A* ~% R  \, M2 O6 ]9 p' l) @' `* _% S4 k& O& [1 q) L: n
    多核CPU設計中的激光調制方案
    # f' @5 H& t* @5 F! hProbe
    0 V- X: m; a& N3 r) y9 K( @最早提出的激光調制方案之一是Probe。使用64核架構,核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。7 \- a3 b7 p9 B2 W$ u% i

      C( g6 f/ r, h- ~) N7 FProbe根據鏈路利用率和緩沖區(qū)利用率指標預測未來活動。使用兩種類型的預測器:
  • 用于低流量變化:過去和當前利用率的加權平均
  • 用于高變化:由利用率水平索引的模式歷史表0 S+ D* B- Z. U" N* B
    [/ol]
    + j% A7 Y. @% I錦標賽預測器根據最近的準確性在兩者之間選擇。
    5 i1 t5 `7 j. O3 b  C$ g
    9 c! V" \# m/ j( t' `$ rColdBus6 Y* N* n: p- `1 `3 |
    ColdBus采用不同的方法,基于L1緩存未命中預測活動。關鍵洞察是在共享內存系統(tǒng)中,大部分網絡流量來自L1未命中。- E' v; _- e( |9 d2 J2 v
    . S9 T! T7 M4 f) |( x7 T- Q9 A% f
    使用類似于分支預測器的基于PC的預測器來識別可能導致未命中的指令。然后,一個時期預測器估計這些未命中何時發(fā)生。  B! w0 ~3 C- n
    $ u0 F; j/ V8 V9 \5 r
    ColdBus還引入了一個"額外波導",為需要的站點提供應急功率。8 `; m# U2 f0 d, _0 h2 N- z4 D/ M
    9 A! n+ r# V% g2 x9 a
    PShaRe
    % e5 O3 h5 u; s  c5 tPShaRe在之前工作的基礎上有幾個關鍵創(chuàng)新:
  • 一致性和非一致性流量的獨立網絡
  • 基于神經網絡的非線性預測器
  • 站點之間的功率共享
  • 重用浪費的光功率進行熱調諧
    ; a+ w$ T# H" q: r! m; V, b% V) N$ V3 w[/ol]
    5 l& R. E; g$ ?9 {5 V' o圖1顯示了整體架構:
    ; _' R3 v+ }0 S( O$ r, L
    / W; G, W( z% s1 V# U' E - \4 k9 ^0 Y+ K/ s8 [& J2 p
    圖1:PShaRe架構,顯示連接光學站點的功率和數(shù)據波導。
    5 X5 S  \7 }6 \
    5 V% Z6 o: N" r9 O# A* A神經網絡預測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進行二元預測。
    # X* h6 X4 I' J( a7 W7 l% k' A; r' T9 X: m; m2 V' X/ |% K+ N
    BigBus
    4 A1 y7 F9 k2 F: i  |/ Q對于非常大的核心數(shù)(500+),需要像BigBus這樣的設計。BigBus使用分層架構,將塊簇組成更大的單元。
    ! H( _# f. ]8 m) J9 u3 q1 D8 i, T# d9 _. S4 i
    圖2說明了BigBus設計:& i8 @' b( ^4 T9 q. q6 P
    # Y0 f5 o/ T/ ~$ W7 z& g$ G1 X

    # s! D8 ^3 H0 @  V9 I" D圖2:BigBus架構,顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
    8 Y$ @& @' q* G; C0 b) C' ~7 P' a8 k1 H7 K6 M; ^2 v( ^
    BigBus使用兩階段預測過程:
  • 每個站點根據等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當前預測與歷史數(shù)據結合
    % ]) P7 [' S+ A+ @3 h[/ol]
    . k% Y" c, B/ C& }這允許在當前條件的響應性和穩(wěn)定性之間取得平衡。% `9 T3 W4 V9 y( d1 H+ @% d# ?- n& m, b0 ]

    & j' Z9 T3 p! I
    " b  n& G) i  x( e* s. P8 N# x
    多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調制方案
    / e7 k2 d  H2 _9 s對于像服務器這樣的多芯片系統(tǒng),像Nuplet這樣的設計將光網絡擴展到插槽之間。Nuplet同時使用片內和片間光網絡。" l5 ~& F4 F7 l  y9 G1 b
    , z3 J8 ~  S! c
    片間預測機制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學站(ICOS)的消息
  • ICOS隊列中的待處理事件: I4 r+ t4 G' Y% M4 a. d# c
    [/ol]
    ( d! E$ c7 F: c0 |) k3 d, o; T功率請求表(PRT)存儲歷史令牌計數(shù)。預測將PRT值與當前流量趨勢和隊列狀態(tài)結合。+ V0 h' v# X7 o- `& W  I% T

    + g9 p6 `$ D3 R* B  Y# mGPU設計中的激光調制方案2 {) Z0 C8 r) X: N2 |  L
    由于GPU側重于內存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設計將光學NoC適配于GPU架構。( X! D5 w+ J! i9 L
    6 F, G8 u# ^) n8 @0 n4 m
    圖3顯示了GPUOpt的整體架構:
    4 L- r* h  a  F* L+ x1 S+ x; B  p; K/ P2 ~9 ^0 _
    & N- F! M' C2 U& I- L- Z/ E$ O' J
    圖3:GPU光學NoC的架構,顯示由光網絡連接的SM和LLC集群。
    / h2 H6 \2 ?. V8 Y' v6 j5 G3 A$ [' ]& F* u/ a# \
    GPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預測機制:8 i( ^8 v6 t3 V% H9 s% t( q- r
    1. SM站點使用基于以下因素的受限預測器(Restr_Pred):. R# h" E! E: p& R% d$ B: g* r+ K
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間
    0 c7 D4 V, q5 C

    + T" a0 k1 o3 U0 [! l2. LLC站點使用考慮以下因素的靈活預測器(Flex_Pred):. K! [8 D& j  o7 o8 s. ^
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    ' g* ~' l' Q" W" U' @4 r

    4 Q+ |8 _1 f6 _7 k9 [激光控制器將這些預測結合起來,確定整體功率需求。
    * y1 j5 V9 I. X: T
      j3 N/ @( d5 t& ^
    " E$ G' f. v' j5 Z3 X9 \
    關鍵概念和趨勢9 ^6 e$ }& S9 b$ o: ]3 z6 Z" W
    雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
      v" M2 n4 K( g0 k" Y) R( K- ?& t& J/ v. Y9 b
    1.將時間劃分為固定時期進行預測和重新配置
    ( M3 i) @, V' A2. 使用多個輸入指標:7 H" ^3 u$ @& W" o  q$ ]
  • 網絡利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件0 D" ^7 T# N2 G
    3. 將當前指標與歷史數(shù)據結合
    * z  f& |$ V+ ]9 [# A) U4. 使用非線性預測函數(shù)(如神經網絡)捕捉復雜關系7 I) C# J+ M2 i4 _: z$ x: q
    5. 對不同流量類型進行單獨預測(如一致性與非一致性)
    ) \4 O& M! `: Y6. 分層設計以實現(xiàn)可擴展性
    ; d+ Y3 g1 b; {% J" @7. 盡可能重用未使用的光功率
    ) `. e! n3 W, C! j  u- ~3 q$ V' U8. 為特定架構經驗性地調整預測參數(shù)
    6 c% f! O: {! y" V- X' Y' M) y
    6 S% }* o7 s* v  L( c! ?/ P* l圖4說明了有效激光調制可能帶來的功率節(jié)。
    , [! a5 x4 Q6 v2 q. E* Q, w* q$ w
    : j+ z. ]& U# d. o 4 w8 U1 L0 v; y/ T1 x' n
    圖4:ideal、Probe和ColdBus方案在各種基準測試中的相對激光功耗。
    4 y/ l* ~2 @! M8 W+ ~1 J: s% w% D% s: n. {9 c" H+ ]6 y

    ( H9 f* ~1 N5 w1 z! L+ }未來方向
    9 w6 W- Q. b0 x" o' {0 @9 t隨著光學NoC從研究轉向實際實施,可以期待這些技術的進一步完善。方向包括:* y- e4 U$ V' B" ~  C
  • 用于更準確預測的機器學習技術
  • 與應用層知識的集成
  • 在運行時調整參數(shù)的自適應方案
  • 考慮電氣和光網絡的整體優(yōu)化
  • 針對新興工作負載(如AI加速)的專門化1 M* I! ~; \4 t2 a5 B; P$ |- D
    3 E& q/ I) ]) f9 |( g% F

    % S% t9 z8 ]2 E2 L結論" U( @  z3 x9 Q% s# }
    有效的激光調制對實現(xiàn)光學片上網絡的潛在優(yōu)勢非常重要。通過準確預測網絡活動并相應調整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構繼續(xù)發(fā)展,激光調制方案需要適應新的設計約束和流量模式。該領域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。& p  I' F  t5 u- L( R# r- _

    7 ?  }4 s2 y( G7 S& b& w7 r
    4 y+ W3 b9 J* b: a9 P6 T7 q/ ^4 |
    參考文獻0 i& n4 K) }7 ?( w9 R2 d
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.0 k8 B  \' {# o: |- p

    % v0 a4 n. \; f9 Z5 T- END -# t3 [/ _  f# |- [  h3 W

    " o' H  t" j% b4 v* s+ O& L( `( O0 B軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
    1 M, I) i+ C- [0 p& x7 R4 \點擊左下角"閱讀原文"馬上申請) [- @/ l% j7 m5 ?, p* t" F
    2 @4 R" I1 a9 _3 Z* o9 {+ R
    歡迎轉載
    ' p4 ]5 ~, t& s# e" l# [% i: ^* D3 o( Z; e3 k
    轉載請注明出處,請勿修改內容和刪除作者信息!/ Y( B3 ?) w3 f" M5 X
    , y: X% H  R3 q+ ~& Q% N. l/ W
    ( ~' B5 t0 R/ r. h+ ]& g' \$ l

      O; G3 D- K6 [8 X! b  o
    & I& _" J8 e# L5 A) ]# z# U7 G3 f3 M9 E  k
    關注我們
    : I: H7 [) P; O" S$ k: v  @5 R
    % E9 \6 U! ]- c' c7 F

    0 n% Q. |# t# b# z! |3 @) w
    + M6 C1 O) S  U% w

    & y. a1 l" R) h 3 s5 t% H! I* r% e; r0 ]
    # ~5 Q- ?8 Z, i" s" a& Q

    5 ^0 C# C' |* h( @6 `
                          6 r: ?. O+ W& U6 U
    5 K* T4 e4 ?: T/ m$ Y: G

    ! h/ I+ h2 b2 I# X# W% a# k+ v2 A9 D
    關于我們:
    : t* r* W: g7 @3 n- l4 ~! O深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
    * }+ D$ ]. ^8 h3 T' q1 S+ l5 D' t7 l, y* k3 [
    http://www.latitudeda.com/, n" ~/ g1 X: t# v; d, z  `  Q
    (點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表