近日,《Nature》雜誌發表了 IBM 的一項新研究。 利用光學元件建構的「全光」深度神經網路可以比傳統運算方法更加節能,並且具有可擴展性、無需光電轉換和高頻寬等優點。 這項發現可能為未來光神經網路加速器的出現奠定基礎。 然而,如果需要對這些傳輸資料進行分析,則應將其從光訊號轉換為電訊號,然後由電子設備進行處理。 一段時間以來,光學被認為是未來最有潛力的計算技術的基礎,但與電子計算機的快速進步相比,光學計算技術的競爭力明顯不足。成本越來越受到關注。 因此,光計算系統再次受到越來越多的關注。 光運算能耗低,可作為AI演算法的專用加速硬件,如深度神經網路(DNN)。 近日,Feldmann等人在《自然》雜誌上發表了這種「全光網絡實現」的最新進展。
深度神經網路包括多層人工神經元和人工突觸。 這些連結的強度(稱為網路權重)可以是正值(表示神經元興奮),也可以是負值(表示神經元抑制)。 網路會盡力減少實際輸出與期望輸出之間的差異,從而改變突觸的權重來執行影像辨識等任務。 DNN的訓練可以使用已知的資料集,訓練好的DNN可以用來推斷任務中的未知資料。 雖然計算量很大,但計算操作的多樣性不會很高,因為在許多突觸權值和神經元激勵中「乘法和累加」操作占主導地位。可以正常工作。 因此,DNN 網路代表了非傳統運算技術的潛在機會。 研究人員正在嘗試建造基於新型非揮發性儲存設備的 DNN 加速器。 這類設備還可以在切斷電源時保存訊息,透過模擬電子計算提高DNN的速度和能源效率。
那為什麼不考慮使用光學呢?光導組件可以包含大量數據 - 無論是用於電信的光纖還是光子晶片上的波導。 在這種波導中,可以利用「波分複用」技術讓許多不同波長的光一起傳播。 然後可以以與電子到光學調製和光電檢測相關的可用頻寬限制的速率來調製每個波長(以可以攜帶訊息的方式改變)。 1.全光脈衝神經元電路使用諧振器可以實現單一波長的添加或去除,就像卡車的裝卸一樣。 DNN網路的突觸權重陣列可以利用微米環形諧振器建構。 諧振器可以是熱調製、電光調製或相變材料調製。 這些材料可以在非晶相和晶相之間轉換,不同材料的光吸收能力差異很大。 理想情況下,乘法和累加的功耗非常低。
費爾德曼的研究團隊在毫米光子晶片上實現了“全光學神經網路”,其中網路中沒有使用光電轉換。 輸入資料被電子調製為不同的波長並注入網絡,但隨後所有資料仍保留在晶片上。 整合相變材料用於調整突觸權重並整合神經元。 2 人工神經元的脈衝產生和操作 作者示範了小規模的監督和無監督學習-即使用標記資料進行訓練(DNN 學習)和使用未標記資料進行訓練(類似於人類學習)。
圖。 3 基於相變的監督學習和無監督學習全光神經元系統由於權重表達是透過光吸收實現的,負權重需要較大的偏壓訊號,無法激活相變材料。 另一種方法是利用馬赫曾德干涉儀裝置將單一波導分成兩個臂,然後重新組合。 此時,傳輸光的量取決於兩個傳播路徑之間的光相位差。 然而,將該方法與波分複用結合起來可能很困難,因為每個乾涉儀的臂需要為每個波長引入適當的相位差。 理想情況下,它們的總功率利用率可能較低,通常需要熱光功率來調整和維持每個馬赫曾德爾干涉儀臂中的光學相位差。
圖。 4 全光神經網路的可擴展架構此外,注入到包含相變材料的系統中的總光功率必須經過仔細校準,以使材料對輸入訊號的響應滿足預期。 雖然也可以使用相變材料來調節馬赫曾德爾相位,但材料吸收的光強度與減慢光速之間不可避免地會存在交叉耦合,這會增加系統的複雜性。 ,可能包含數千個神經元和數百萬個突觸。 然而,光子網路的波導需要彼此遠離以防止耦合,並避免急劇彎曲以防止光離開波導。 因為兩個波導的交叉可能會將不需要的功率注入到錯誤的路徑中,這極大地限制了光子晶片設計的2D特性。
圖。 5 單層脈衝神經網路的實驗實現 建構光學元件的神經網路需要長距離、大面積,但各光學結構關鍵元件的製造需要高精度。 這是因為波導和耦合區域,例如每個微環諧振器的入口和出口,必須達到相應網路效能所需的精確尺寸。 如何製造小型微環諧振器也存在許多限制。
Feldmann團隊的研究進展有望推動該領域未來的發展。 這項研究可能為未來節能且可擴展的光神經網路加速器的出現奠定基礎。