電子產業(yè)一站式賦能平臺

PCB聯(lián)盟網

搜索
查看: 43|回復: 0
收起左側

光學片上網絡的激光調制方案

[復制鏈接]

465

主題

465

帖子

3514

積分

四級會員

Rank: 4

積分
3514
跳轉到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
: o) q' C5 I3 H! F$ B+ _- |" b% G隨著硅晶體管縮放接近極限,研究人員正在探索新技術以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學網絡(也稱為光學片上網絡或光學NoC)來替代傳統(tǒng)的電氣互連。與電氣網絡相比,光學NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學NoC的功耗帶來了新的挑戰(zhàn)[1]。
) H( a  d% G  c& j. [' o' ?$ n' |5 }1 k4 z4 t' @# I4 D
本文將探討用于最小化光學NoC靜態(tài)功耗的激光調制方案。我們將介紹基于網絡活動動態(tài)調制激光功率的關鍵概念、架構和預測技術。
! h! e/ s+ @; |+ w+ F
# s$ R8 }; O9 R, Z
7 l8 X" b! R2 l5 k
背景
3 E2 u+ ^* B% R* c光學NoC使用光來傳輸芯片上組件之間的數(shù)據(jù)。基本構建模塊包括:
7 E! s+ t8 _5 Y$ ]" ]1 t8 E
  • 激光器:光源,可以是片外或片上
  • 調制器:將電信號轉換為光信號
  • 波導:在芯片上引導光
  • 光電探測器:將光信號轉換回電信號
    4 ^& S) K1 u. ~) z

    0 t% n3 n# s6 r- _光傳輸本身非常高效,但產生光的激光器消耗大量功率。一個關鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學NoC總功耗的80-90%。
    , K: e2 N5 g1 H3 `9 ]! O9 O: l* k: k- j+ O. j
    為解決這個問題,研究人員開發(fā)了激光調制方案,旨在根據(jù)預測的網絡活動動態(tài)調整激光功率。一般方法包括:; U$ W2 i& x  K
  • 監(jiān)控網絡活動指標
  • 預測未來活動
  • 相應調整激光功率
  • 重新配置網絡9 T0 Z" T+ j5 G8 O; f) j: t( E
    ! }9 z0 _0 Z0 N4 b6 R
    讓我們看看為不同類型處理器提出的一些具體方案。
    2 j& l9 \# r& ~$ @" H1 _& o% \3 ?2 u+ j
    多核CPU設計中的激光調制方案
    0 Z! d/ x. |' j2 aProbe
    ! k9 I! k0 x: F5 u' x- e. s( |最早提出的激光調制方案之一是Probe。使用64核架構,核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。% U7 H) C2 {2 z* B: ?) B7 }
    4 o5 }8 D8 q4 ]; ~& e
    Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標預測未來活動。使用兩種類型的預測器:
  • 用于低流量變化:過去和當前利用率的加權平均
  • 用于高變化:由利用率水平索引的模式歷史表
    ) P5 Z, }# \9 G$ G# A; H[/ol]
    0 }0 k. A7 {* ^錦標賽預測器根據(jù)最近的準確性在兩者之間選擇。
    3 N  P0 Y' x6 n3 A
    0 O# H! H: \+ W- e9 K* @2 gColdBus
    7 n2 e1 Q/ M1 m4 nColdBus采用不同的方法,基于L1緩存未命中預測活動。關鍵洞察是在共享內存系統(tǒng)中,大部分網絡流量來自L1未命中。: D9 r: ~6 ?/ [. Q1 r
    8 `3 U6 b$ A5 G6 O' `1 S
    使用類似于分支預測器的基于PC的預測器來識別可能導致未命中的指令。然后,一個時期預測器估計這些未命中何時發(fā)生。
    / v5 e  [1 \% T1 t/ {5 ^& ]4 C0 n" K7 n5 r3 O- x) X6 L+ o1 ]
    ColdBus還引入了一個"額外波導",為需要的站點提供應急功率。: V2 `* c; G) `* G: m; U) e4 Q
    $ I; ?( ?; R7 }2 k9 v$ @3 \9 A
    PShaRe5 O& }) h( O5 d; E
    PShaRe在之前工作的基礎上有幾個關鍵創(chuàng)新:
  • 一致性和非一致性流量的獨立網絡
  • 基于神經網絡的非線性預測器
  • 站點之間的功率共享
  • 重用浪費的光功率進行熱調諧
    - Z6 p8 M# V8 o2 I[/ol]
    - _8 }- \8 E3 r6 s- }圖1顯示了整體架構:5 t( z# Z8 y1 ?3 d

    . _8 F, T& N0 _( p+ @% Y
    6 F6 g) H/ V+ f( u圖1:PShaRe架構,顯示連接光學站點的功率和數(shù)據(jù)波導。+ h4 c: j; ]# O+ R/ I# D

    / P& a1 ]6 i5 w+ {神經網絡預測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進行二元預測。
    4 z5 A2 G+ q9 G$ S# g; w$ L5 N
    5 x8 t9 P8 x* ~% U) C  s$ pBigBus
    * k4 G' f. R) c0 U對于非常大的核心數(shù)(500+),需要像BigBus這樣的設計。BigBus使用分層架構,將塊簇組成更大的單元。; n( x3 L, x- A5 n7 l& X$ K/ e& I: k

    . l/ x. g9 X4 P圖2說明了BigBus設計:
    4 C6 P8 K3 N  z" Q) ^$ k& c- X0 ?  k- u8 B1 i0 U4 c) {% i

    4 J( f' F8 z% U5 ^! Y( C圖2:BigBus架構,顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。. j8 D3 M+ f, x( L) G) ~
    , D2 [) ?2 D/ X/ M& c' d# @" I* q! o
    BigBus使用兩階段預測過程:
  • 每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當前預測與歷史數(shù)據(jù)結合
    ! F: g. P  Z$ j, d% ?& ]4 f[/ol]. s2 A  @; n! m, R+ E( y
    這允許在當前條件的響應性和穩(wěn)定性之間取得平衡。5 u: z: n( ^& U9 B' O, P+ _& A

    4 g  ?( }; }, q. F5 U: u$ j

    + C( L3 C  t( ]1 c5 G4 Q+ B多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調制方案6 m% E: N5 b  i4 V5 B/ M* ~
    對于像服務器這樣的多芯片系統(tǒng),像Nuplet這樣的設計將光網絡擴展到插槽之間。Nuplet同時使用片內和片間光網絡。/ Y2 \7 i% Q0 s0 T

    * g- z+ U8 a: V* J+ t3 @! F) Z$ H1 w$ h片間預測機制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學站(ICOS)的消息
  • ICOS隊列中的待處理事件
    & A5 R, F$ p/ v7 u$ D# @$ ?. S[/ol]8 S! h8 s2 I4 U  N
    功率請求表(PRT)存儲歷史令牌計數(shù)。預測將PRT值與當前流量趨勢和隊列狀態(tài)結合。- K; J9 E! a% \  B, k1 j

    . l3 r8 k8 n* P7 D) UGPU設計中的激光調制方案
    , o, U% ]% k6 g7 i; F5 f由于GPU側重于內存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設計將光學NoC適配于GPU架構。! s# l2 ]5 B% Y( D" [
    # n9 q- S6 B0 q' ^1 c' U
    圖3顯示了GPUOpt的整體架構:; l" U! G8 a- b) O1 A

    $ e7 x  d0 o  Z 0 C: e, c$ o$ f4 j/ n, w! U; x
    圖3:GPU光學NoC的架構,顯示由光網絡連接的SM和LLC集群。; W6 ^3 G* ^/ X' h, z$ Y3 v
    9 P! q1 M$ K# Y0 R% l+ E
    GPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預測機制:
    ! C8 G5 y3 b  f  C& T' E1. SM站點使用基于以下因素的受限預測器(Restr_Pred):
    3 l7 r6 U7 o5 D6 @/ g2 k
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間9 j. Y/ _4 b& Z' l
    5 u( F. z3 P& u
    2. LLC站點使用考慮以下因素的靈活預測器(Flex_Pred):! L' X' \, H4 v: j
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    9 v$ U6 c3 v3 @  m% v$ w$ n; {% B
    5 _" w0 H9 R" I( e  H4 i' s3 U
    激光控制器將這些預測結合起來,確定整體功率需求。
    9 Q7 n$ [5 M8 i0 I
    ) m( C! `, I: y4 Y2 x

    ! v2 v3 J3 {" Y, _. Y2 G關鍵概念和趨勢! u; `/ b1 e) Y! i
    雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
    & G. b" i* \! g& A) G4 i) y0 C3 P/ ]. X$ u7 T
    1.將時間劃分為固定時期進行預測和重新配置5 V# f6 q& ]% D$ G. O2 T* q& c9 P
    2. 使用多個輸入指標:
    / y1 W! J6 i( @
  • 網絡利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件
    " }# V, F* I' j- q; i# ^/ _2 Q! E4 L
    3. 將當前指標與歷史數(shù)據(jù)結合
    3 r8 z; |# q% J) }4. 使用非線性預測函數(shù)(如神經網絡)捕捉復雜關系
    3 Q2 |; e) X9 v! P9 r: p5. 對不同流量類型進行單獨預測(如一致性與非一致性)7 H4 Y+ D* ]/ m& G5 ^
    6. 分層設計以實現(xiàn)可擴展性0 Z, s; G, I# j! B2 _, a) z' O
    7. 盡可能重用未使用的光功率
    2 K: b/ T0 m4 T* r6 F9 m/ Y+ \8. 為特定架構經驗性地調整預測參數(shù)
    ' T# m, |& n: u5 k' H. x$ R: d- z- E+ X- W1 A, h; B
    圖4說明了有效激光調制可能帶來的功率節(jié)。6 ^) C6 b! i. z5 D: C6 K
    8 M6 }9 V* M/ w% U0 a0 V2 T
    8 Y0 v# H* d, j' O! K# I
    圖4:ideal、Probe和ColdBus方案在各種基準測試中的相對激光功耗。: i) ?0 t9 N( v

    . d! k, w4 ]4 M( n6 M& [7 G
    0 d. P2 R9 |! q3 G- \
    未來方向
    # t2 X, _6 e2 _/ ^' o隨著光學NoC從研究轉向實際實施,可以期待這些技術的進一步完善。方向包括:
      H; O& Z) ~! V9 x  B
  • 用于更準確預測的機器學習技術
  • 與應用層知識的集成
  • 在運行時調整參數(shù)的自適應方案
  • 考慮電氣和光網絡的整體優(yōu)化
  • 針對新興工作負載(如AI加速)的專門化+ S5 R# X  Y9 D: x. v' q2 n) B

    ; `" l0 y; ?8 B6 o- P& e1 h# y
    - I2 d1 L! {4 b- q. U
    結論
    . V5 a. G/ K5 \, y- |有效的激光調制對實現(xiàn)光學片上網絡的潛在優(yōu)勢非常重要。通過準確預測網絡活動并相應調整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構繼續(xù)發(fā)展,激光調制方案需要適應新的設計約束和流量模式。該領域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
    ( M0 g4 a1 E0 E& m. i# c- M% Q  S' l. G& O7 Z
    : r1 F3 y) y. m, a
    參考文獻  O5 A9 I. x3 M
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
      U. p  j) {) K) e  \9 M7 D  t1 }0 G3 U" I0 Y% ]  i% \. z) H
    - END -9 l+ {# }$ S" v4 i0 p9 v% r

    + G# I8 [" |$ c軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。4 r, T# x5 h$ }; d
    點擊左下角"閱讀原文"馬上申請# l3 k! M0 o6 n1 p2 c5 }% R5 I

    ( Y* a; e% ]7 c. M歡迎轉載
    ) O! r) K& N3 i" g) z7 T& x
    ) u  d& a( s, Y) ~# y1 V" H轉載請注明出處,請勿修改內容和刪除作者信息!( k" x$ J9 f6 I

    7 }9 w9 f7 \; _# Y; H6 [6 |5 I: T& w

    6 R* ~9 _$ e2 D' h$ ^3 D : ]: ?3 n2 u  u( e( ]
    / O& ^+ K6 Y) C0 U8 A& D
    關注我們
    3 M0 y9 W3 y8 |4 M) S+ J5 l0 ?' Q/ o, \- A% a' R4 ~9 o: v" ?# w% w
    * y  w. X( [$ w  Z' \: J" S: r3 V

    3 H$ y: a8 q2 _6 Z( T1 P6 J
    $ u; }: ?# w, [4 Y  i1 z7 p
    $ X9 J8 H  }' l. z2 O

    , x( c: P3 u+ H6 C- K5 g5 I7 I8 q
    8 d3 r0 Z- a& R' T
                         
    " H# R% T  l( Y0 Q
    7 J2 F; x5 k. H( Y0 H

    ; s. R5 J! Q/ m6 D
    ' i9 L4 a! a7 E5 G. c: N9 A/ R關于我們:( v) L/ @9 R* @3 X# u' w2 b) @
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
    ' Z& N; n3 R% E/ G6 P" o: g( I* I5 q. @; A7 @  k' X# D+ j  y5 ^
    http://www.latitudeda.com/: R& |6 D3 h7 m- n2 {
    (點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表