Recientemente, Nature publicó una nueva investigación de IBM. La red neuronal profunda "totalmente óptica" construida con dispositivos ópticos puede ser más eficiente energéticamente que los métodos informáticos tradicionales y tiene las ventajas de escalabilidad, ausencia de conversión fotoeléctrica y gran ancho de banda. Este descubrimiento puede sentar las bases para el surgimiento de un acelerador de red neuronal óptica en el futuro. La fibra óptica puede transmitir datos a todo el mundo en forma de luz, lo que se ha convertido en el pilar de la tecnología de telecomunicaciones moderna. Sin embargo, si es necesario analizar estos datos de transmisión, deben convertirse de señales ópticas a señales electrónicas y luego procesarse mediante equipos electrónicos. Durante algún tiempo, la óptica se consideró la base de la tecnología informática con mayor potencial en el futuro, pero en comparación con el rápido progreso de las computadoras electrónicas, la competitividad de la tecnología informática óptica es obviamente insuficiente. Sin embargo, en los últimos años, la industria Ha prestado cada vez más atención al coste de la energía informática. Por lo tanto, el sistema de computación óptica ha vuelto a atraer cada vez más atención. La computación óptica tiene un bajo consumo de energía y puede usarse como hardware de aceleración especial para algoritmos de IA, como la red neuronal profunda (DNN). Recientemente, Feldmann y otros publicaron los últimos avances de esta "implementación de redes totalmente ópticas" en la revista Nature.
La red neuronal profunda incluye neuronas artificiales multicapa y sinapsis artificiales. La fuerza de estas conexiones, llamadas pesos de red, puede ser positiva, lo que indica excitación neuronal, o negativa, lo que indica inhibición neuronal. La red hará todo lo posible para minimizar la diferencia entre la salida real y la salida esperada, a fin de cambiar el peso de las sinapsis para realizar tareas como el reconocimiento de imágenes. La CPU y otros aceleradores de hardware generalmente se utilizan para el cálculo de DNN. El entrenamiento de DNN puede utilizar el conjunto de datos conocidos y el DNN entrenado se puede utilizar para inferir datos desconocidos en la tarea. Aunque la cantidad de cálculo es grande, la diversidad de operaciones de cálculo no será muy alta, porque la operación de "multiplicación y acumulación" domina muchos pesos sinápticos y excitación neuronal. DNN aún puede funcionar normalmente cuando la precisión del cálculo es baja. Por lo tanto, las redes DNN representan oportunidades potenciales para tecnologías informáticas no tradicionales. Los investigadores están intentando construir un acelerador DNN basado en nuevos dispositivos de memoria no volátil. Este tipo de equipo también puede guardar información al cortar el suministro de energía y mejorar la velocidad y la eficiencia energética de DNN a través de la computación electrónica analógica.
Entonces, ¿por qué no considerar el uso de la óptica? Los componentes conductores de luz pueden contener una gran cantidad de datos, ya sean fibras ópticas para telecomunicaciones o guías de ondas en chips fotónicos. En este tipo de guía de ondas, se puede utilizar la tecnología de "multiplexación por división de longitud de onda" para permitir que muchas longitudes de onda diferentes de luz se propaguen juntas. Luego, cada longitud de onda se puede modular (cambiar de manera que pueda transportar información) a una velocidad limitada por el ancho de banda disponible relacionado con la modulación electrónica a óptica y la detección optoelectrónica. 1 circuito de neurona de pulso totalmente ópticoEl uso de resonadores permite agregar o eliminar una sola longitud de onda, al igual que la carga y descarga de camiones. La matriz de pesos sinápticos de la red DNN se puede construir utilizando un resonador de anillo de micras. El resonador puede modularse térmicamente, electroópticamente o mediante materiales de cambio de fase. Estos materiales pueden cambiar entre fase amorfa y fase cristalina, y la capacidad de absorción de luz de diferentes materiales varía mucho. En condiciones ideales, el consumo de energía de la multiplicación y acumulación es muy bajo.
El equipo de investigación de Feldmann ha implementado "una red neuronal totalmente óptica" en un chip fotónico milimétrico, en el que no se utiliza conversión fotoeléctrica en la red. Los datos de entrada se modulan electrónicamente a diferentes longitudes de onda y se inyectan en la red, pero luego todos los datos permanecen en el chip. Los materiales de cambio de fase integrado se utilizan para ajustar el peso sináptico e integrar las neuronas.Fig. 2. Generación de pulsos y operación de neuronas artificiales. Los autores demuestran el aprendizaje supervisado y no supervisado a pequeña escala, es decir, entrenamiento con datos etiquetados (aprendizaje DNN) y entrenamiento con datos no etiquetados (similar al aprendizaje humano).
¡Fig! 3 aprendizaje supervisado y aprendizaje no supervisado basado en cambio de fase en todos los sistemas de neuronas ópticas. Debido a que la expresión del peso se realiza mediante absorción de luz, el peso negativo requiere una señal de polarización mayor, que no puede activar el material de cambio de fase. Un método alternativo es utilizar el dispositivo del interferómetro Mach Zehnder para dividir una única guía de ondas en dos brazos y luego recombinarlos. En este momento, la cantidad de luz transmitida depende de la diferencia de fase óptica entre las dos rutas de propagación. Sin embargo, puede resultar difícil combinar este método con la multiplexación por división de longitud de onda, porque el brazo de cada interferómetro necesita introducir una diferencia de fase adecuada para cada longitud de onda. Toda implementación óptica de DNN aún enfrenta grandes desafíos. Idealmente, su utilización total de energía puede ser baja y, a menudo, se requiere energía termoóptica para ajustar y mantener la diferencia de fase óptica en cada brazo del interferómetro Mach Zehnder.
¡Fig! 4 arquitectura escalable de todas las redes neuronales ópticasAdemás, la potencia óptica total inyectada en el sistema que contiene materiales de cambio de fase debe calibrarse cuidadosamente para que la respuesta de los materiales a la señal de entrada cumpla con las expectativas. Aunque los materiales de cambio de fase también se pueden utilizar para ajustar la fase de Mach Zehnder, habrá un acoplamiento cruzado inevitable entre la intensidad de la luz absorbida por los materiales y la desaceleración de la velocidad de la luz, lo que aumentará la complejidad del sistema. Se ha desarrollado el DNN tradicional. a gran escala, que puede contener miles de neuronas y millones de sinapsis. Sin embargo, las guías de ondas de las redes fotónicas deben estar alejadas entre sí para evitar el acoplamiento y evitar flexiones bruscas para evitar que la luz salga de la guía de ondas. Porque la intersección de las dos guías de ondas puede inyectar energía no deseada en el camino equivocado, lo que limita sustancialmente las características 2D del diseño de chips fotónicos.
¡Fig! 5 implementación experimental de una red neuronal de pulsos de una sola capa Se necesita una gran distancia y un área grande para construir una red neuronal para dispositivos ópticos, pero la fabricación de partes clave de cada estructura óptica requiere alta precisión. Esto se debe a que la guía de ondas y la región de acoplamiento, como la entrada y salida de cada resonador de microanillo, deben alcanzar el tamaño exacto requerido para el rendimiento de la red correspondiente. También existen muchas limitaciones sobre cómo fabricar pequeños resonadores de microanillos. Finalmente, la tecnología de modulación proporciona un efecto óptico débil y requiere una región de interacción larga para lograr un nivel significativo de influencia limitada en el paso de la luz.
Se espera que los avances realizados en la investigación del equipo de Feldmann promuevan el desarrollo futuro de este campo. Esta investigación puede sentar las bases para la aparición en el futuro de aceleradores de redes neuronales ópticas escalables y energéticamente eficientes.
Shenzhen TigerWong Technology Co.... Ltd
Tel:86 13717037584
Correo electrónico: info@sztigerwong.com
Dirección: 1.er piso, edificio A2, parque industrial digital Silicon Valley Power, no. 22 Dafu Road, calle Guanlan, distrito de Longhua,
Shenzhen, provincia de GuangDong, China