電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 50|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

465

主題

465

帖子

3514

積分

四級會員

Rank: 4

積分
3514
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
& w% g8 f2 _3 [: T2 A隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
# U. W2 O. B8 L3 x
& W# J+ Y+ z; A% m, Q本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。7 z$ Q5 h0 l/ F6 P' h  j9 Z

: M) o8 R# ^2 G- t. I. z3 Z

, u! @2 d8 P, @* J背景8 q9 e: ^6 u& {$ {! N9 {) M
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù)。基本構(gòu)建模塊包括:$ o) T* N/ w8 Z7 b
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號轉(zhuǎn)換為光信號
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測器:將光信號轉(zhuǎn)換回電信號
      \4 U3 S. W, d9 P* L9 y3 T

    . Q3 X# n: D% s& ~2 r6 T光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
    & g6 f) J; c  {: q' p3 L
    2 `1 \" W/ ?5 l7 E- ^7 t) O6 f為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:
    % ~1 ?* l5 o5 ^% k2 Y' n3 v
  • 監(jiān)控網(wǎng)絡(luò)活動指標
  • 預(yù)測未來活動
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)
    ! y9 {6 C! s4 e: w+ G, A
    - F7 Y6 X* S/ k; C
    讓我們看看為不同類型處理器提出的一些具體方案。" \* h9 h8 B% l! x

    % Q3 D: W* n& I$ T多核CPU設(shè)計中的激光調(diào)制方案
    ( d$ t/ Z; q8 o9 ~Probe
    ! i- ^' I0 x3 z/ e! L5 g' g8 b最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
    + x4 P7 Z7 }6 J' R
    . x7 I4 B7 I- K9 c2 `5 vProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標預(yù)測未來活動。使用兩種類型的預(yù)測器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表
    2 K) Q: n. r$ L5 n[/ol]* q7 ?1 [* G% f6 q+ D% `3 Q
    錦標賽預(yù)測器根據(jù)最近的準確性在兩者之間選擇。
    ; U7 o( U& \! |: p' P7 R- I
    0 U& I9 }2 u6 H7 s5 aColdBus; l& v7 P& t% {8 w9 g4 E
    ColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。# E# l  c+ E( ~% T# b( h
    6 T0 R$ Q; B% ^7 N" Z
    使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。
    9 ~' H) N! ]6 _- J  a% X% R
    # J0 `6 s9 w& i& uColdBus還引入了一個"額外波導(dǎo)",為需要的站點提供應(yīng)急功率。
    5 \2 E2 P, R$ D& E$ ^( E& R
    . y( h; v2 s1 V& h4 _6 F: MPShaRe' D" g  t, j+ r. Q2 N: w, v
    PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器
  • 站點之間的功率共享
  • 重用浪費的光功率進行熱調(diào)諧$ D- T4 F9 u: G  b& J- n
    [/ol]
    % N0 T' I) I8 m8 e5 I: X/ Y& _圖1顯示了整體架構(gòu):
    * @* g8 W8 ?8 m3 a7 Y8 K  P
    & g; \; l7 o+ L9 d
    ! G1 {1 Z1 j) o" i圖1:PShaRe架構(gòu),顯示連接光學(xué)站點的功率和數(shù)據(jù)波導(dǎo)。
    $ `' ~0 `5 ]" P6 z9 u3 z
    ' A  r' t' G" L2 V神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進行二元預(yù)測。
    ) `2 S* s6 t# E; [) O  ]
    - K( Q' B/ W/ M8 _, a3 i. u4 MBigBus4 F- l, H5 X. V; I  [" t2 v
    對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    5 B- v5 i, e1 M( _" f$ Y
    / N1 M" ?1 ^; J圖2說明了BigBus設(shè)計:4 x. h1 o( b1 g  S
    3 ^  o9 g  r# X

    . y2 X- Q! Z& p4 W1 h圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。/ I1 R0 F7 V; D7 }" u" y( r2 j$ H
    $ J) Z, C& C/ I! I) H/ b  W
    BigBus使用兩階段預(yù)測過程:
  • 每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合' p7 @2 S' h! E8 X: _
    [/ol]2 _! O. c, R3 q1 y  G. _5 {/ Z$ P
    這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
    / D  e* E' S; [: @. M. i* E! k1 Z9 U+ Y6 l

    2 Z" R8 s$ u4 A3 C5 g3 H多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
    7 Q: t% v0 t, Z# m對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
    & o# i7 ?' f* M# ~9 v2 P6 ~& c  }' r
    7 R+ x* o# `: h3 W8 l0 O7 W3 w片間預(yù)測機制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊列中的待處理事件
    , E: n9 \0 d. v, B8 g& S[/ol]- L% G/ `1 T- ?0 u0 }
    功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。
    " h  K. C( h4 C0 h' b* g8 d
    . t% e$ l1 T4 l* p. V3 _GPU設(shè)計中的激光調(diào)制方案
    & U* V: _- T$ \" P' R; Z. N由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。. C8 U8 d+ F6 G+ B& o1 x0 G

    $ t, }+ R% n- t$ Q4 e$ a! m圖3顯示了GPUOpt的整體架構(gòu):
      e' [* R; J& k4 ~& E
    1 d/ U2 C/ I0 E( z/ _# m* S , l8 a' a( M) h5 w6 j1 a. y3 H
    圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
    $ K0 y; O6 K1 j2 E+ c" K1 \' w
    $ m1 S' v+ X9 |% ?! Y$ gGPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預(yù)測機制:) d/ z; T% O. c. f: L$ c4 G" B" }7 p
    1. SM站點使用基于以下因素的受限預(yù)測器(Restr_Pred):' [) B5 I5 C: a1 n. Z. G( F
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間- b7 C! M) S/ S7 u) C0 J8 j
    8 _% W1 M5 k! o
    2. LLC站點使用考慮以下因素的靈活預(yù)測器(Flex_Pred):
    # ~& ~# X/ o" T% b7 I5 J% _4 J
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    2 Z' q/ B( ~' p6 e7 [" V

    $ V- M) A. p* s激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。+ ?2 l& D" [: a9 J, o
    - ]8 C+ N! t' ?4 y# O2 E2 z! q. g
    . ~' ?! Z1 Z' O
    關(guān)鍵概念和趨勢
    - V* y  L3 ~! C4 P6 ^! `# Y1 s雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
    7 a  X9 g) l$ |8 i4 p8 R* o7 S" f1 `- g) \
    1.將時間劃分為固定時期進行預(yù)測和重新配置
    & n2 N  P3 a; |2 Y, H2. 使用多個輸入指標:% e/ V! }. ]; e9 L
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件
    ' y  s( j% f% n* Y
    3. 將當(dāng)前指標與歷史數(shù)據(jù)結(jié)合) f* d& T% |! K0 t+ X
    4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
    , ^+ f( ?0 r% O; r7 N4 D4 y5. 對不同流量類型進行單獨預(yù)測(如一致性與非一致性)
    . `- E$ X; {- D6. 分層設(shè)計以實現(xiàn)可擴展性
    : U3 \5 t1 f. S$ p4 l7 X. x7. 盡可能重用未使用的光功率
    ; x/ U* a) ]( s0 i8. 為特定架構(gòu)經(jīng)驗性地調(diào)整預(yù)測參數(shù)
    ' B2 O, i% Z! Z8 l/ ~' U
    % q1 H+ k; O% ^) t& ]& y) s* z圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。
    : H$ b8 X0 G6 I2 I! j' s( I' U1 b# X+ g. J0 [1 g# R: f) Y' S
    # q7 B( I+ E0 o. P( `1 f  O1 R- h# J
    圖4:ideal、Probe和ColdBus方案在各種基準測試中的相對激光功耗。
    2 N* ^3 Z7 H) Z* C" k3 Z3 v  x4 h  o6 R) n5 o: q$ j1 R

    $ O# N" j* ?- ^未來方向" n- S, E: K, O0 e7 y
    隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實施,可以期待這些技術(shù)的進一步完善。方向包括:( M9 q8 p( Z) c$ T$ S
  • 用于更準確預(yù)測的機器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識的集成
  • 在運行時調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對新興工作負載(如AI加速)的專門化
    4 l- i) G. ^1 L9 e
    5 T# W8 L/ \- f0 a$ W
    - `/ @1 ]2 ~2 w3 M
    結(jié)論
    ) P* @( o5 R  S: l" k! v6 i有效的激光調(diào)制對實現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
    3 d3 Q1 @/ _2 I+ h1 {* x, C  K, t, U& o  y7 e

    ; G9 I% A9 s9 N& O# d( z參考文獻
    # y0 \: h9 x% r3 _. \. Y. ~5 R* v[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.$ Z+ B! |% n# z$ S
    9 Y* T. q$ f3 B6 g, O( k. {
    - END -
    4 c; M3 B* Z9 p. l' d0 H
    2 M- F+ M9 v- z: Q, C* Z2 Z軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。7 R2 _9 H& i! K" V- X: ]
    點擊左下角"閱讀原文"馬上申請
    & X: u' J9 X: u6 z$ f8 N# t, U$ R. I& L0 h4 U
    歡迎轉(zhuǎn)載8 U- `; i' K! s+ ~) z6 r- U7 ^  t

    ( O* p: w2 g# X1 E" u轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!* B2 k1 ^! \* V) T' [0 J+ n) N

    2 I+ o7 Y$ g+ `/ g1 o
    0 F4 D/ {6 T( X* w
    , U* F: `7 W( V: J( {

    # h5 T7 V9 }4 |+ E, `+ W2 ~; @0 N, `" ]  X
    : h, e/ r& z. W2 I/ `關(guān)注我們
    8 o" g, a( N3 A
    3 f5 Q9 A, m! @
    6 s/ G( V- n1 k' A8 v

    / L8 t3 i1 \" Y; v( ?. ?

    % j. ~! B$ P' ]3 u
    + J, E9 H3 K) z2 Q- I7 l

      Z# R  v+ m, f 1 o, W8 |- T! X2 S3 t" k# F$ s3 B
                         
    , t+ V6 q* a2 S
    $ v7 Z4 V; C" `* L# o0 o4 L
    / w. w6 m( z4 i2 ]

    ! ~3 u2 Z  Q1 G6 Z# C關(guān)于我們:% s7 u! `8 w; R! U6 Y* M/ [
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。& \# {) M6 _; h$ r7 l
    4 I5 G5 k% \1 o* j7 I
    http://www.latitudeda.com/4 x  W* z( b4 G9 ^
    (點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表