電子產業(yè)一站式賦能平臺

PCB聯盟網

搜索
查看: 22|回復: 0
收起左側

基于可編程馬赫-曾德干涉儀的高性能光計算處理器

[復制鏈接]

493

主題

493

帖子

3686

積分

四級會員

Rank: 4

積分
3686
跳轉到指定樓層
樓主
發(fā)表于 昨天 08:00 | 只看該作者 |只看大圖 回帖獎勵 |正序瀏覽 |閱讀模式
引言
9 z, N- q' G$ i0 F4 U2 Q! d基于可編程馬赫-曾德干涉儀(MZI)網格實現的光神經網絡(ONN)已成為加速機器學習計算的方法。本文概述了基于MZI的光處理器,重點介紹了兩種關鍵架構 - Reck網格和Diamond網格,并分析了實現ONN的性能。6 z+ }7 `+ v; F
/ I* j1 z' i  J" w
MZI光處理器基礎
; s( f, A+ |% C) n. d- Q/ w6 _1 n6 \光處理器的基本構建模塊是2x2可重構MZI,如圖11所示。由兩個3-dB耦合器組成,帶有可調相移器θ和φ,用于控制功率分配比和兩個輸出之間的相對相位。
5 d# b% Q: M' n/ ?1 l7 n; S
+ [- {( n" ~# [* s8 _# d* K圖1:具有可調相移器θ和φ的2x2可重構MZI示意圖。: e; C/ t# h; y/ \7 ^3 s. ?
/ A1 K; s* G. J0 \- s( O+ c
單個MZI的單一轉移矩陣由下式給出:
. q  H' D1 H  t, K" S7 _/ X 3 u/ k2 u; c0 z* c6 i

$ p" ?; F( d# l通過在網格中級聯多個MZI,可以實現更大的單一變換。圖2所示的4x4處理器的Reck網格是一種三角形排列,可使用6個MZI實現任何4x4單一矩陣。
, C% v& a$ E6 t4 O0 X- j0 Q, L
  h2 A1 {1 y: }+ Y9 y# R) L
% E8 F& i1 `, A圖2:由6個MZI組成的4x4 Reck網格光處理器示意圖。
* e2 R4 j1 l- y& ~9 r, P% w# o; Z" \1 u
完整4x4 Reck處理器的單一矩陣由各個MZI矩陣的乘積給出:
5 P) d% @3 n+ |' W" E! z* M
0 @3 \4 w- J" M/ X
8 C0 X+ F5 w4 y/ g, e光處理器編程1 X3 E' b; |5 ^
要對光處理器進行編程以實現所需的單一變換,必須確定每個MZI所需的相移。這是通過分解過程完成的,該過程將目標矩陣依次乘以逆MZI矩陣:
6 y; c, P5 f' Q' j! U/ C" [* q' E
( T4 Y( O. b( m7 _
9 |/ M6 Q' G7 u4 E+ `& ^通過在每個步驟中將非對角元素設置為零,可以提取所需的相移。圖3顯示了4x4 Reck網格在此分解過程中考慮MZI的順序。: r" M; [( B$ m0 S# ^, x

0 c/ N& h% W. Q. G) f4 N  T4 P' B! n9 K圖3:4x4 Reck網格中用于編程的MZI分解順序。
# P3 l1 ?9 X) G; i2 n/ P3 r( W( i0 p2 W( P8 A! F
光神經網絡
; ?; v8 u: q% \1 v* g. l0 X/ {ONN利用這些可編程光處理器來實現神經網絡層中的線性變換。圖4顯示了單層ONN的結構。' w0 {8 l( z) E4 k
& {0 w# K7 M0 d/ l+ N0 }& h% Q
圖4:光學實現的單層神經網絡示意圖。
* N3 e/ Y& k( x* |4 W
' a3 n2 A! B1 u& E) D光處理器實現權重矩陣W,而非線性激活函數通常以電子方式應用。對于分類任務,網絡接受多維輸入I0并為每個類別產生輸出概率。0 S: U5 G. h1 I- m7 ]9 L: S

5 J% n* p! W& p0 q; S6 }( X" R網絡使用反向傳播進行訓練,通過最小化均方誤差等損失函數來優(yōu)化權重矩陣:" i% M! k4 _: W# a- S# G7 p
. w1 s6 G1 w+ l, r0 z5 e3 A

( d# a8 D) P% _) I' [8 z圖5顯示了4類數據集示例和4x4 ONN的訓練過程。, X' e: O- O- }0 n
. \! a' g4 g3 G! T8 ]& d. F
圖5:(a)4類高斯數據集和(b)顯示4x4 ONN的損失和準確度與訓練周期的關系的訓練過程。2 `, r' W1 T6 ?7 u: d2 Z+ m& i& ?

: g5 o7 J! n; `; O% qDiamond網格架構! N" |! p5 s' R
Reck網格可以實現任何單一矩陣,但對制造誤差和光損耗很敏感。為解決這個問題,提出了一種替代的Diamond網格架構,如圖6所示的4x4處理器。
* b6 p& \5 X  P/ ^8 m3 x! H# w
, w4 T6 T# \$ z4 P+ B圖6:具有9個MZI的4x4 Diamond網格光處理器示意圖。1 i' r9 Z& r! L% U/ C8 H4 G  y* x% c
8 s' S1 ^  A$ q$ D. k
與相同大小的Reck網格相比,Diamond網格使用額外的N(N-1)(N-2)/2個MZI。這提供了幾個優(yōu)點:
  • 更對稱的拓撲結構,具有平衡的光路
  • 能夠將不需要的光重定向到額外的輸出
  • 優(yōu)化權重矩陣的額外自由度9 X3 a, w; Y$ R# M3 `3 O
    [/ol]
    + X# C' @" U$ T2 ?6 q4x4 Diamond處理器的單一矩陣由下式給出:! b# g& z1 A; S% y" I/ R) Z

    ; a' m7 n* B* K9 l: |- ?1 ?9 W1 Y/ O+ q  b" h8 _/ f
    可以使用與Reck網格類似的分解過程對其進行編程,遵循圖7所示的順序。
    0 {7 @% ~/ d) e% R# k' |* { 0 |- d- }' ]) w9 V
    圖7:4x4 Diamond網格中用于編程的MZI分解順序。
    ' i1 K$ V. g0 |- K9 i) ]( a. M+ L8 r, |  ~$ L# [
    性能比較, b: W; h; T( E
    為比較Reck和Diamond架構,分析了各種大小的單層ONN的實現性能。圖8顯示了4x4處理器的分類準確度與相位誤差的關系。* k) Q, c* }+ ~/ w. m- l) F

    ; ^5 k+ ?9 e# B4 S, i* D圖8:4x4 Reck和Diamond ONN的分類準確度與相位誤差的關系,每個MZI的損耗為(a)0 dB和(b)1 dB。
    , i* v* e' s$ k( n% d  A; P0 I( j; `: M+ b) j
    Diamond網格對相位誤差表現出更好的魯棒性,尤其是在存在光損耗的情況下。這種優(yōu)勢在更大的網絡規(guī)模中變得更加明顯。% H5 v9 d  Z0 t4 [

    9 C( F4 m' f7 P0 d. w- ^圖9比較了不同大小處理器(最大64x64)的準確度與相位誤差的關系。
    ! J: |* r  O( h) V% q  l4 H% j- `1 n
    3 `! P* P5 ~8 k% y- ^1 O, p圖9:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準確度與相位誤差的關系。
    6 D5 E) w% r- }6 z0 S2 Z( n& F8 _. k) b1 C" M
    對于較大的網絡,高精度區(qū)域縮小,但Diamond網格在所有尺寸上都保持更好的性能。
    4 O; h0 a0 G$ F) K  t1 u
    $ v! j- m1 Q* F圖10將此分析擴展到包括每個MZI的光損耗影響。
    5 u6 X4 V% _, h+ W$ H. ?% o$ S$ s
    8 G5 w, G3 `$ ~7 A, A' \7 r' M圖10:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準確度與損耗和相位誤差的關系。
    7 l7 k6 }3 O- X, e9 ^! |6 y: V* M8 T# {' J8 x2 K& c
    再次,Diamond網格在所有網絡規(guī)模上表現出更優(yōu)的魯棒性。
    2 l6 A, H& Q7 t9 h: q+ b+ a3 q$ k8 i/ ~. [5 p" ^. p7 p
    最后,圖11總結了不同網絡規(guī)模的兩個關鍵性能指標 - 性能指標(>75%準確度的區(qū)域)和訓練期間達到的最終損失值。
    ; `# V8 T7 a5 I+ Z* y9 A4 m% n, a
    8 n( l. ~% j: B9 y' s+ ^0 e圖11:不同大小的Reck和Diamond ONN的(a)性能指標和(b)最終損失值比較。9 }9 \0 @6 \' _) F4 A$ K
    * ^3 O; J0 e, E
    Diamond網格在這兩個指標上始終優(yōu)于Reck網格,優(yōu)勢隨網絡規(guī)模增大而增加。7 K% o0 l8 O) N2 _

    + I4 {' z2 v7 i3 }; j" X結論
    2 C8 h) `" Z: g. H4 s! M基于可編程MZI的光處理器為實現ONN和加速機器學習計算提供了有前途的平臺。Reck網格提供了可實現任何單一變換的緊湊設計,但Diamond網格提高了對制造誤差和光損耗的魯棒性。這使Diamond架構更適合實際的大規(guī)模ONN。硅基光電子制造和架構設計的持續(xù)進步可能會進一步提高這些光處理器的性能,有望實現新一類超快速、節(jié)能的機器學習加速器。
    ' `  \2 w+ x: k6 [6 ]0 i
    3 a3 E$ ^/ i4 E% g% {* l& [8 ^0 V參考文獻" B) H6 ]1 U: y* s
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.5 v6 g+ F9 X7 ~, x+ T/ N7 Y2 Q
    END9 _4 w' ?; [- e  u" c

    ; W) J1 B- V  [# p* H
    : J+ I/ q1 @* W3 I2 S9 P4 Y' J軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。2 R: v( Y: ?4 A# M4 j- |
    點擊左下角"閱讀原文"馬上申請
    ( f' o$ g8 ?/ b8 t/ L: e
    ' M8 M' S2 h2 Y' l: Q6 ?1 ^. I8 p歡迎轉載
    - Z. S& x+ [7 a; r2 Q: k$ \0 @7 J8 }, u+ v, Q" U) f: P
    轉載請注明出處,請勿修改內容和刪除作者信息!
    - N7 m. g* y0 [% |& g
    % I: e. J. U  `* V
    5 _" `& J# D  Q- N9 y; l8 U/ r3 @4 C
    6 i8 z6 E' b/ M
    8 e) _6 E/ {: W1 \. u' r

    8 [0 J2 V- i+ X* O% U+ t關注我們
    # F- T/ b, w% L9 ?! ~% D% N# T( `6 N* |0 K% v

    / t8 S6 x: R7 L+ o5 E, M
    , w2 `, Y, I# K5 Z- L# h" ~
    ' L, r1 _2 K6 b

    9 P% K  c+ j% X) }# F
    * z$ z7 m" b9 K2 K

    * |+ }8 |' U% d! P
                          3 N0 D( P! S& v6 l! }/ E

    . J; E9 m3 k( H& P- }
    , n4 c8 y5 w# u2 W: r! E

    , Z3 U8 R$ e# K$ ]! Y關于我們:) {, g/ ]2 y) @- o4 Y4 b
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
    5 i" O) D4 e- k# y! j( f/ @  z/ O: y7 A
    http://www.latitudeda.com/
    8 K8 D0 p% l4 I1 r/ A(點擊上方名片關注我們,發(fā)現更多精彩內容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯系客服 關注微信 下載APP 返回頂部 返回列表