|
引言8 ^/ l; e/ a8 b! A) y6 M
基于可編程馬赫-曾德干涉儀(MZI)網(wǎng)格實(shí)現(xiàn)的光神經(jīng)網(wǎng)絡(luò)(ONN)已成為加速機(jī)器學(xué)習(xí)計(jì)算的方法。本文概述了基于MZI的光處理器,重點(diǎn)介紹了兩種關(guān)鍵架構(gòu) - Reck網(wǎng)格和Diamond網(wǎng)格,并分析了實(shí)現(xiàn)ONN的性能。
/ [3 s* F0 ?3 q% [" [
/ e9 B: I0 s$ X2 J& d' SMZI光處理器基礎(chǔ)
" U c& r4 d2 a1 F/ S) @# m光處理器的基本構(gòu)建模塊是2x2可重構(gòu)MZI,如圖11所示。由兩個(gè)3-dB耦合器組成,帶有可調(diào)相移器θ和φ,用于控制功率分配比和兩個(gè)輸出之間的相對(duì)相位。+ e- c3 {; g/ `6 B8 y; u
oopqxrhyxww64076734929.png (420.64 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
oopqxrhyxww64076734929.png
2 小時(shí)前 上傳
8 c: q$ C5 L- {" ?( \% Q7 a; [1 j圖1:具有可調(diào)相移器θ和φ的2x2可重構(gòu)MZI示意圖。$ s5 n/ _; d4 e! g' S) s
5 z6 u6 n) }, E* j' G$ Z% ?
單個(gè)MZI的單一轉(zhuǎn)移矩陣由下式給出:" b7 |& D5 E. E- @, y/ E
3potgicok5u64076735029.png (106.42 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
3potgicok5u64076735029.png
2 小時(shí)前 上傳
1 R4 U) Y4 I* e7 d- z
+ G$ ?/ z' @; l& R/ k; d通過在網(wǎng)格中級(jí)聯(lián)多個(gè)MZI,可以實(shí)現(xiàn)更大的單一變換。圖2所示的4x4處理器的Reck網(wǎng)格是一種三角形排列,可使用6個(gè)MZI實(shí)現(xiàn)任何4x4單一矩陣。
* L' g" F. U# U/ D' B' y
5 F. J+ o: ` W. I z1 m) C
bbtbhgtws5d64076735129.png (84.74 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
bbtbhgtws5d64076735129.png
2 小時(shí)前 上傳
- d9 u! ?' }/ C6 z5 L/ I圖2:由6個(gè)MZI組成的4x4 Reck網(wǎng)格光處理器示意圖。8 ]5 A7 N3 H) ~4 P7 D( c; ]6 M' |$ v
+ P, C& s- u2 J, Z" `( ^6 N完整4x4 Reck處理器的單一矩陣由各個(gè)MZI矩陣的乘積給出:
! ?, s5 B7 ?6 M
v5gyerqtnfy64076735230.png (38.98 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
v5gyerqtnfy64076735230.png
2 小時(shí)前 上傳
/ ?8 g9 U/ \$ [. x/ Z# N7 j
9 a D( w9 b( I
光處理器編程
" k; J3 s$ b5 \2 p- h2 L. W# U要對(duì)光處理器進(jìn)行編程以實(shí)現(xiàn)所需的單一變換,必須確定每個(gè)MZI所需的相移。這是通過分解過程完成的,該過程將目標(biāo)矩陣依次乘以逆MZI矩陣:
* T9 I' @5 N9 \
i2d2rtbjzyu64076735330.png (40.11 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
i2d2rtbjzyu64076735330.png
2 小時(shí)前 上傳
, f8 g7 i g' t$ F
7 l# M) Z: a' {) B- @
通過在每個(gè)步驟中將非對(duì)角元素設(shè)置為零,可以提取所需的相移。圖3顯示了4x4 Reck網(wǎng)格在此分解過程中考慮MZI的順序。
4 |9 U' @0 R" D
x5rbbssmxsr64076735430.png (146.39 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
x5rbbssmxsr64076735430.png
2 小時(shí)前 上傳
; T% @8 q; A% { W7 i M9 Y9 }3 E/ e圖3:4x4 Reck網(wǎng)格中用于編程的MZI分解順序。* x5 w# B9 n; Z+ E& g) t
+ B$ ^: k8 I. e# t& @& _. k) B
光神經(jīng)網(wǎng)絡(luò)
. c: |. _0 l( E: C9 T/ _+ E# x, z1 fONN利用這些可編程光處理器來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)層中的線性變換。圖4顯示了單層ONN的結(jié)構(gòu)。* W. q6 h w- o$ j2 e# T2 U
1ioqdxfr24i64076735530.png (222.16 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
1ioqdxfr24i64076735530.png
2 小時(shí)前 上傳
$ ?. s/ ^ c# Z" r4 h" D
圖4:光學(xué)實(shí)現(xiàn)的單層神經(jīng)網(wǎng)絡(luò)示意圖。' N4 n, t: h1 F" z
% ~/ U! `9 }! h5 I( i光處理器實(shí)現(xiàn)權(quán)重矩陣W,而非線性激活函數(shù)通常以電子方式應(yīng)用。對(duì)于分類任務(wù),網(wǎng)絡(luò)接受多維輸入I0并為每個(gè)類別產(chǎn)生輸出概率。
. X- J+ @+ E. R
& a: u# Y8 z/ Q6 ]$ ^' v網(wǎng)絡(luò)使用反向傳播進(jìn)行訓(xùn)練,通過最小化均方誤差等損失函數(shù)來優(yōu)化權(quán)重矩陣:
! R# A: n6 X- }) V% ?/ k
0jkfbzbd0vd64076735630.png (25.62 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
0jkfbzbd0vd64076735630.png
2 小時(shí)前 上傳
: I# p$ W' a/ m4 ]% ?* q
% X- Q4 y+ P, i9 q圖5顯示了4類數(shù)據(jù)集示例和4x4 ONN的訓(xùn)練過程。
3 Z( e4 G6 m# ?! h
v1o45em4svh64076735730.png (253.27 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
v1o45em4svh64076735730.png
2 小時(shí)前 上傳
+ k' f& o- g& X; ~' q! [圖5:(a)4類高斯數(shù)據(jù)集和(b)顯示4x4 ONN的損失和準(zhǔn)確度與訓(xùn)練周期的關(guān)系的訓(xùn)練過程。# _& @, n; p: a Z
$ ^; B- T( r6 q$ S
Diamond網(wǎng)格架構(gòu)
7 }$ x$ m1 b! m; A% xReck網(wǎng)格可以實(shí)現(xiàn)任何單一矩陣,但對(duì)制造誤差和光損耗很敏感。為解決這個(gè)問題,提出了一種替代的Diamond網(wǎng)格架構(gòu),如圖6所示的4x4處理器。& m w0 ?4 n' {/ z1 k; Z1 R, ]: L
1qdmqy20vq364076735831.png (496.17 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
1qdmqy20vq364076735831.png
2 小時(shí)前 上傳
1 {1 J7 F" e7 p' `6 w) f- z圖6:具有9個(gè)MZI的4x4 Diamond網(wǎng)格光處理器示意圖。
( @4 k$ v2 w/ Q; M- `9 V( v |/ ^7 {. e/ ?4 b* e) \/ L
與相同大小的Reck網(wǎng)格相比,Diamond網(wǎng)格使用額外的N(N-1)(N-2)/2個(gè)MZI。這提供了幾個(gè)優(yōu)點(diǎn):更對(duì)稱的拓?fù)浣Y(jié)構(gòu),具有平衡的光路能夠?qū)⒉恍枰墓庵囟ㄏ虻筋~外的輸出優(yōu)化權(quán)重矩陣的額外自由度
& d2 {4 b/ q. }; ^1 ~[/ol]
1 G0 Z, ^1 G& j% ]0 [& I% H1 R4x4 Diamond處理器的單一矩陣由下式給出:
# d0 o$ X# ~, t6 u" Y
1prnfvrpj5e64076735931.png (71.81 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
1prnfvrpj5e64076735931.png
2 小時(shí)前 上傳
0 {5 ?$ O. S! n2 o& K: r, f
8 R8 T0 L& q, T2 |/ i- G" E
可以使用與Reck網(wǎng)格類似的分解過程對(duì)其進(jìn)行編程,遵循圖7所示的順序。
4 B( k L* H5 }# O6 X
zz1clakmcvm64076736031.png (236.55 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
zz1clakmcvm64076736031.png
2 小時(shí)前 上傳
5 I5 y# z+ M0 H1 l& O. f# e
圖7:4x4 Diamond網(wǎng)格中用于編程的MZI分解順序。
7 |* R5 h7 D9 P1 ~
- V, ?" p3 g( J0 C5 W$ j8 y! a% K性能比較
8 Q: Y2 p$ K; ]7 W0 t! @+ Y為比較Reck和Diamond架構(gòu),分析了各種大小的單層ONN的實(shí)現(xiàn)性能。圖8顯示了4x4處理器的分類準(zhǔn)確度與相位誤差的關(guān)系。( X8 @* L/ g B9 O
rlujfeftugo64076736131.png (125.34 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
rlujfeftugo64076736131.png
2 小時(shí)前 上傳
1 n% ?5 ]; d3 T; {/ v2 c; M* }+ Z0 J圖8:4x4 Reck和Diamond ONN的分類準(zhǔn)確度與相位誤差的關(guān)系,每個(gè)MZI的損耗為(a)0 dB和(b)1 dB。1 z B1 W9 @! L1 _" p
3 ^* [8 W# d! a) L; uDiamond網(wǎng)格對(duì)相位誤差表現(xiàn)出更好的魯棒性,尤其是在存在光損耗的情況下。這種優(yōu)勢在更大的網(wǎng)絡(luò)規(guī)模中變得更加明顯。
Q* J8 R0 H% N$ b: Y0 S
: f/ ?" K2 f1 z/ R* ?圖9比較了不同大小處理器(最大64x64)的準(zhǔn)確度與相位誤差的關(guān)系。
! }3 p: z7 Y x3 D7 R g3 H1 W- B
p0oz0wwbgf364076736231.png (416.84 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
p0oz0wwbgf364076736231.png
2 小時(shí)前 上傳
, y6 ~- ]4 F. T1 K/ ?圖9:不同大小(a-d)Reck和(e-h)Diamond ONN的分類準(zhǔn)確度與相位誤差的關(guān)系。- A8 @& D0 h+ j9 _$ g* f9 J+ R
7 M4 B# J9 i$ l3 {. b. V1 e( k對(duì)于較大的網(wǎng)絡(luò),高精度區(qū)域縮小,但Diamond網(wǎng)格在所有尺寸上都保持更好的性能。
% q# r3 Q5 B0 F3 M4 G& n' U; v) Q' @
圖10將此分析擴(kuò)展到包括每個(gè)MZI的光損耗影響。
( x/ V, B. J! j
kagrofhrnyk64076736332.png (391.07 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
kagrofhrnyk64076736332.png
2 小時(shí)前 上傳
5 b& Y1 _; q5 V" j圖10:不同大小(a-d)Reck和(e-h)Diamond ONN的分類準(zhǔn)確度與損耗和相位誤差的關(guān)系。+ w4 ` f+ F2 o/ |3 A0 \
; m" g, X. r- z- f# ~# O9 F3 D
再次,Diamond網(wǎng)格在所有網(wǎng)絡(luò)規(guī)模上表現(xiàn)出更優(yōu)的魯棒性。
2 c' A- L2 z& h4 N/ K
7 I( e) w: L0 Z, d6 d& d最后,圖11總結(jié)了不同網(wǎng)絡(luò)規(guī)模的兩個(gè)關(guān)鍵性能指標(biāo) - 性能指標(biāo)(>75%準(zhǔn)確度的區(qū)域)和訓(xùn)練期間達(dá)到的最終損失值。& @5 i* X& i1 i# W
ry5kcbvddlr64076736432.png (92.32 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
ry5kcbvddlr64076736432.png
2 小時(shí)前 上傳
" M o/ A# J% D5 L, m0 _3 J' V
圖11:不同大小的Reck和Diamond ONN的(a)性能指標(biāo)和(b)最終損失值比較。
& F6 R; n2 ]# f, V( [3 p% w
+ ~$ Z; x8 F- ADiamond網(wǎng)格在這兩個(gè)指標(biāo)上始終優(yōu)于Reck網(wǎng)格,優(yōu)勢隨網(wǎng)絡(luò)規(guī)模增大而增加。6 l# {2 \ F$ K0 I5 `% b9 [
8 ^2 `" Y$ t4 n) E6 \
結(jié)論# n5 U* q% A/ b H# G
基于可編程MZI的光處理器為實(shí)現(xiàn)ONN和加速機(jī)器學(xué)習(xí)計(jì)算提供了有前途的平臺(tái)。Reck網(wǎng)格提供了可實(shí)現(xiàn)任何單一變換的緊湊設(shè)計(jì),但Diamond網(wǎng)格提高了對(duì)制造誤差和光損耗的魯棒性。這使Diamond架構(gòu)更適合實(shí)際的大規(guī)模ONN。硅基光電子制造和架構(gòu)設(shè)計(jì)的持續(xù)進(jìn)步可能會(huì)進(jìn)一步提高這些光處理器的性能,有望實(shí)現(xiàn)新一類超快速、節(jié)能的機(jī)器學(xué)習(xí)加速器。
0 f: f* K6 Q! R8 Q4 P9 A, c' s% U+ X8 N
參考文獻(xiàn): N+ F, q, o% a& \$ a9 o
[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
" D3 ?2 f. T8 L4 V0 d* B" x$ A* ZEND" k% K0 _- G8 j6 v2 {
: Z/ T" z) A( v7 G3 Z
N" {- R& d9 j* r6 s1 E" r- r
軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。; y3 W) {: p1 a7 a& E
點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
' {2 t4 c8 H/ R( h- z
) O' p. ^5 g. O" L6 U$ F6 `; p# p$ @+ q歡迎轉(zhuǎn)載
1 |1 J' ^& p, R$ G1 v! r) C3 @. n4 F8 g! \: ^ O g
轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!' A$ k% m8 Q/ e. G: B# }- u
9 i9 W6 v; d8 m2 c1 n8 h% f# ^* Z. V+ q" m
0 O0 u# s e: R8 d
3xfam3wcrst64076736532.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
3xfam3wcrst64076736532.gif
2 小時(shí)前 上傳
5 Z+ Z3 t, M) \4 E
5 F( `$ Q) `* H1 j3 d) ^0 j關(guān)注我們
3 y$ M& T+ n- W @1 u* T" l
. R0 `$ f, z' J( s
6 k5 a. B5 E! q( [& ?
vodpuva2mj564076736632.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
vodpuva2mj564076736632.png
2 小時(shí)前 上傳
g: f* u6 G" f! P
| 7 a+ G/ K! E. Y4 J$ e
u5is0s3sr5f64076736732.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
u5is0s3sr5f64076736732.png
2 小時(shí)前 上傳
5 f0 n2 X6 v: k" ^' n2 r | 6 z+ \0 v: Z, e+ @* i5 e3 r+ j
txrhkjadsy064076736832.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
txrhkjadsy064076736832.png
2 小時(shí)前 上傳
2 S( E6 u) P# \: g1 V" f" N/ _' i
| - d+ ?( ?' d3 I7 w! k# d
( G- L( R) A3 v: D' o
9 N( s' `! K# T8 f9 E0 A; X
7 h2 H/ b, r/ X" s; v
關(guān)于我們:
" S6 ^3 X0 ]& J( `; E1 |4 e) @深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。7 N# k; ]1 I l8 T* @2 k8 R
, P0 ]4 m) `, ?8 ?5 J8 `
http://www.latitudeda.com/. l2 F* n+ E5 b( d/ w; M7 [" ~( \
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|