近日,《Nature》杂志发表了 IBM 的一项新研究。 利用光学器件构建的“全光”深度神经网络可以比传统计算方法更加节能,并且具有可扩展性、无需光电转换和高带宽等优点。 这一发现可能为未来光神经网络加速器的出现奠定基础。 光纤可以以光的形式将数据传输到全世界,成为现代电信技术的支柱。 然而,如果需要对这些传输数据进行分析,则应将其从光信号转换为电信号,然后由电子设备进行处理。 一段时间以来,光学被认为是未来最有潜力的计算技术的基础,但与电子计算机的快速进步相比,光学计算技术的竞争力明显不足。然而,在过去的几年里,业界计算能源的成本越来越受到关注。 因此,光计算系统再次受到越来越多的关注。 光计算能耗低,可作为AI算法的专用加速硬件,如深度神经网络(DNN)。 近日,Feldmann等人在《自然》杂志上发表了这种“全光网络实现”的最新进展。
深度神经网络包括多层人工神经元和人工突触。 这些连接的强度(称为网络权重)可以是正值(表示神经元兴奋),也可以是负值(表示神经元抑制)。 网络会尽力减少实际输出与期望输出之间的差异,从而改变突触的权重来执行图像识别等任务。CPU和其他硬件加速器通常用于DNN计算。 DNN的训练可以使用已知的数据集,训练好的DNN可以用来推断任务中的未知数据。 虽然计算量很大,但计算操作的多样性不会很高,因为在很多突触权重和神经元激励中“乘法累加”操作占主导地位。在计算精度较低的情况下,DNN 仍然可以正常工作。 因此,DNN 网络代表了非传统计算技术的潜在机会。 研究人员正在尝试构建基于新型非易失性存储设备的 DNN 加速器。 这类设备还可以在切断电源时保存信息,通过模拟电子计算提高DNN的速度和能源效率。
那么为什么不考虑使用光学呢?光导组件可以包含大量数据 - 无论是用于电信的光纤还是光子芯片上的波导。 在这种波导中,可以利用“波分复用”技术让许多不同波长的光一起传播。 然后可以以与电子到光学调制和光电检测相关的可用带宽限制的速率来调制每个波长(以可以携带信息的方式改变)。 1.全光脉冲神经元电路使用谐振器可以实现单个波长的添加或去除,就像卡车的装卸一样。 DNN网络的突触权重阵列可以利用微米环形谐振器构建。 谐振器可以是热调制、电光调制或相变材料调制。 这些材料可以在非晶相和晶相之间转换,不同材料的光吸收能力差异很大。 理想情况下,乘法和累加的功耗非常低。
费尔德曼的研究团队在毫米光子芯片上实现了“全光学神经网络”,其中网络中没有使用光电转换。 输入数据被电子调制为不同的波长并注入网络,但随后所有数据仍保留在芯片上。 集成相变材料用于调整突触权重并整合神经元。 2 人工神经元的脉冲生成和操作 作者演示了小规模的监督和无监督学习——即使用标记数据进行训练(DNN 学习)和使用未标记数据进行训练(类似于人类学习)。
图。 3 基于相变的监督学习和无监督学习全光神经元系统由于权重表达是通过光吸收实现的,负权重需要较大的偏置信号,无法激活相变材料。 另一种方法是利用马赫曾德干涉仪装置将单个波导分成两个臂,然后重新组合。 此时,传输光的量取决于两个传播路径之间的光相位差。 然而,将该方法与波分复用结合起来可能很困难,因为每个干涉仪的臂需要为每个波长引入适当的相位差。DNN的全光学实现仍然面临重大挑战。 理想情况下,它们的总功率利用率可能较低,并且通常需要热光功率来调整和维持每个马赫曾德尔干涉仪臂中的光学相位差。
图。 4 全光神经网络的可扩展架构此外,注入到包含相变材料的系统中的总光功率必须经过仔细校准,以使材料对输入信号的响应满足预期。 虽然也可以使用相变材料来调节马赫曾德尔相位,但材料吸收的光强与减慢光速之间不可避免地会存在交叉耦合,这会增加系统的复杂性。传统的DNN已经发展规模很大,可能包含数千个神经元和数百万个突触。 然而,光子网络的波导需要彼此远离以防止耦合,并避免急剧弯曲以防止光离开波导。 因为两个波导的交叉可能会将不需要的功率注入到错误的路径中,这极大地限制了光子芯片设计的2D特性。
图。 5 单层脉冲神经网络的实验实现 构建光学器件的神经网络需要长距离、大面积,但各个光学结构关键部件的制造需要高精度。 这是因为波导和耦合区域,例如每个微环谐振器的入口和出口,必须达到相应网络性能所需的精确尺寸。 如何制造小型微环谐振器也存在许多限制。最后,调制技术提供了较弱的光学效应,并且需要较长的相互作用区域才能对通过的光实现显着的有限影响。
Feldmann团队的研究进展有望推动该领域未来的发展。 这项研究可能为未来节能且可扩展的光神经网络加速器的出现奠定基础。