電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 41|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

465

主題

465

帖子

3514

積分

四級會員

Rank: 4

積分
3514
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序?yàn)g覽 |閱讀模式
引言
+ _7 K8 ^4 z* F. Z$ L隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
( O" Z' G7 c( Y& e
7 b0 y7 k: ]- c5 P- K- M, y本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。$ ~& o4 J" c) |+ V, Z4 P
9 l- {8 l/ C% A9 \2 b
, F/ C% _. f9 A8 a5 _$ l
背景! h0 e7 N* U7 J1 ~8 U+ W; e
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:" a2 V2 w: w3 |  R3 ?
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號轉(zhuǎn)換為光信號
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測器:將光信號轉(zhuǎn)換回電信號
    6 N& d* B& A. f9 `+ u0 _& h

    3 |  P7 g7 M* R# A光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
    % E6 ^4 O# U+ c) R4 S, Z, N# g, ^/ J% s2 c& i. \7 o7 o; A
    為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:
    * M5 {" o* x( b8 ?( L" O6 c
  • 監(jiān)控網(wǎng)絡(luò)活動指標(biāo)
  • 預(yù)測未來活動
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)
    ! K! a# O' D7 s, X( |2 g8 ~
    $ _0 D; \4 B9 a; f
    讓我們看看為不同類型處理器提出的一些具體方案。
    5 @3 {( {' F! y/ c
    6 X, R8 N: {6 a2 F多核CPU設(shè)計中的激光調(diào)制方案8 U. t! J7 @7 \. c8 Y
    Probe
    % |" _. G# o" e% ~# z4 j( f1 A最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
    7 ^  R" }! d/ N) W' h- s" y6 r0 w9 k- C" T$ f/ g
    Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表
    / T4 U8 a' n* _# N- {. j: t/ L[/ol]
      i( m# q# Z7 K1 `7 f錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。
    " c& c/ Q* {  E! D7 b! J
    / i, {- J) e" D8 [  f/ Q' \+ nColdBus0 w: y( V. `+ e
    ColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
    6 O  J+ N+ m, r% M/ r4 D- x- E% V$ M+ I) @! n
    使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。
    ' i$ o0 _- U5 ?- E( _& S! a) G
    3 J/ r0 |0 V+ t, Y* @( AColdBus還引入了一個"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。
    9 u4 ~$ {# C5 [0 m, C
    + c7 B& E) t6 R, ?PShaRe: a' [" j6 |' y6 |" d7 u3 A
    PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
    " F' g- U4 _* e; A2 M/ u[/ol]
    6 e  U  _+ Q* H; ^圖1顯示了整體架構(gòu):
    : U4 U$ \& u! B5 q7 ]0 ]6 S0 F) A5 k8 N
    2 n( X% L8 c6 x
    圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。( K3 i- W9 ^3 ?# O$ a
    9 s' b5 `! `/ U- w, [- X( e) ]
    神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點(diǎn)在下一個時期的活動進(jìn)行二元預(yù)測。1 F: W0 }! z1 W/ T* X: w2 T

    9 x! p! x6 g5 }. d4 j' mBigBus9 d6 }4 e" a' u
    對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。  s. ]3 L  J# J2 j. e( A
    7 {0 X. x; B" }- n% p2 n: f
    圖2說明了BigBus設(shè)計:- E$ R& x) n9 z/ C  B
    1 w0 n$ r2 f% B1 l0 |* g( ^5 z. e1 q

    $ z  ~5 F' Y. p9 r9 M) I1 J圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。1 r8 [, q. ]) Q7 n& a, z$ u
    4 Q+ r6 ^4 M8 i. j5 E8 E9 k" A
    BigBus使用兩階段預(yù)測過程:
  • 每個站點(diǎn)根據(jù)等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合$ C2 }: u4 y2 _# K, @
    [/ol]
    0 }; R- D9 C+ u! g; y. h) g7 v; y2 a這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。2 m% L) E3 V* [& {+ Q

    / T- I+ W/ K9 h' N1 F, ^
    . I' x! T1 d" T7 f$ P) j( s
    多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
    " z8 i% q, c7 w1 m對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
    + q. R# `& j8 v: z4 n+ r5 |. A
    ' P) Y9 Y/ L  R" X* e片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊列中的待處理事件
    2 z) f. E. B7 p[/ol]
    ' `6 x' D# k9 f' g/ i$ w功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。
    . G+ d. s, i  }, N9 T# ^( w% f& |1 h
    GPU設(shè)計中的激光調(diào)制方案& z1 P; U! z3 \+ e7 @$ A) H
    由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。
    " R) Z1 i' K# W
    4 I9 T: f! n' k7 b; N圖3顯示了GPUOpt的整體架構(gòu):
    , D5 X$ I) m' M! i  |
    # G7 Y) D- [! w0 l# @% g/ D
    0 Z/ D6 m9 {! @% A1 `1 }圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。, C$ h9 z4 D2 v# u

    6 Y+ j/ |$ V4 `: D$ A7 ]; fGPUOpt對流式多處理器(SM)站點(diǎn)和最后級緩存(LLC)站點(diǎn)使用不同的預(yù)測機(jī)制:
    ( K. {% Q8 f7 s: q* B  E: }1. SM站點(diǎn)使用基于以下因素的受限預(yù)測器(Restr_Pred):
    0 f/ ^7 q7 l( ~& d3 {& j: @5 b
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間5 i1 q3 b2 u! N( D: X
    % R9 T$ P2 t$ E! v
    2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測器(Flex_Pred):
    8 m7 [, [7 d& @0 b
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件* x7 ~: \- \+ E8 M* C! r; g
    1 [2 V6 k" g6 V% }0 f) y
    激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。4 u0 ]1 i% }, P) T$ d5 `4 {

    7 `7 Q/ A# O9 O. [' P6 Z; v7 h
    2 R/ i. z- K2 w0 I9 r
    關(guān)鍵概念和趨勢/ ]9 e% F9 |  ~2 k9 E
    雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:
    9 _% D4 c6 i" [0 E; `" ~# N  g6 K! i% E
    1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置
    8 h, ?+ b& E5 a/ e5 j2. 使用多個輸入指標(biāo):
    ; n5 S6 v2 _3 ^
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件, m; F  I! C3 }# k! H
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
    2 X" x; X: l: e8 G2 c5 ]4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
    / H& L4 a" v2 q5. 對不同流量類型進(jìn)行單獨(dú)預(yù)測(如一致性與非一致性)7 @* q' D! m6 O, B0 L2 H
    6. 分層設(shè)計以實(shí)現(xiàn)可擴(kuò)展性
      _& }3 M0 ~8 U4 J# D  G7. 盡可能重用未使用的光功率
    2 C+ K3 b7 I# C# D; c% r2 a8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測參數(shù)2 x) D( T% E: ^- h- I: F$ @
    % w3 j" F# _1 t6 j$ y/ g2 g
    圖4說明了有效激光調(diào)制可能帶來的功率節(jié)省:
    ; X! O9 S3 ]$ Z9 B7 `# C
    ' C+ N6 x, u! G9 z; @3 o
    , M- C( E' P5 h  U3 |圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。- z9 w' N: u% m# U- @

    2 X1 c: _% r+ Y+ D; g( w5 E

    5 i% z3 r$ Y, {( a% g1 A未來方向
    ( B: Y" ~$ x: @. ]( \' }隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
    # K* Z$ p1 r' d6 e' o
  • 用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識的集成
  • 在運(yùn)行時調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對新興工作負(fù)載(如AI加速)的專門化
    / [  e, n. j7 U) u/ A* `
    * a# r0 r. i, n5 O/ k2 m
      H7 J4 i% N1 S2 m
    結(jié)論
      P" @$ @" x! T' U有效的激光調(diào)制對實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。' P, t0 H7 i  K' V2 i
    ( ~! `" b, [7 N2 V6 C7 n
    5 G5 ]0 _3 j8 K$ o8 b5 r3 g, P1 P
    參考文獻(xiàn)
    ' u/ r/ y) e" v9 V" @' A6 q9 D$ E[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.1 ?2 @- f5 O$ C  Q4 y
    7 v8 H/ Z# V2 }$ ]! a
    - END -& d2 a# @: W" |- H! r/ K
      f  v& i6 V/ C
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    + U8 w4 c% v) C; J& [0 U點(diǎn)擊左下角"閱讀原文"馬上申請* y8 R, Q. {* r/ p% B1 y1 i
    ! D& E2 a& U! Q7 P, l* {
    歡迎轉(zhuǎn)載" m, }+ r! _$ g2 K9 m
    0 j- Q* s" N- z/ @8 d" Y- S5 z) |
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
    " K; R# C9 Z) y" R: q7 b# E5 c1 x: X/ o7 ]

    5 {5 \1 }( V+ U, c7 N4 D6 E8 R
    8 d. p+ h: t( O( t9 x
    , G$ [2 o: W2 x+ ?
    $ q# M6 o( v6 R; @
    關(guān)注我們- ^* Y4 r7 |9 e, k

    9 q% Z; {& L" O: }8 [
    - \3 I0 Y" }9 }3 x
    / i) s' Q4 l- v; i- w5 P
    6 v7 F  H% [; J6 v5 v
    4 Q1 K2 L% ~- K0 w7 v
    : Q! B- y2 o7 e% o( A

    8 l9 B# _! E, _6 }4 O6 q
                         
    3 n% C# M% Y; L
    9 r- [  i9 {- a4 G, J) H8 @
    : S9 X& M8 E- I) y; S! c, ^

    9 u  B0 {8 U- i, L+ H: F- F5 q關(guān)于我們:
    9 s) j, w$ D) J/ Z! X. R. l深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    # l' p, Y5 c+ Z- `% ^$ E6 M
    ; b% e# D" t7 R6 ehttp://www.latitudeda.com/2 Q* Z/ V$ f# ]& X( q# @# B" {
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表