최근 네이처(Nature)는 IBM의 새로운 연구 결과를 발표했습니다. 광학 장치로 구축된 "전체 광학" 심층 신경망은 기존 컴퓨팅 방법보다 에너지 효율적일 수 있으며 확장성, 광전 변환 없음 및 높은 대역폭의 장점을 가지고 있습니다. 이번 발견은 향후 광신경망 가속기 등장의 초석이 될 수 있다. 광섬유는 빛의 형태로 전 세계에 데이터를 전송할 수 있어 현대 통신기술의 기둥이 됐다. 그러나 이러한 전송 데이터를 분석해야 하는 경우에는 광 신호를 전자 신호로 변환한 후 전자 장비를 통해 처리해야 합니다. 한동안 광학은 미래의 가장 유력한 컴퓨팅 기술의 기반으로 여겨졌으나, 전자컴퓨터의 급속한 발전에 비하면 광컴퓨팅 기술의 경쟁력은 확실히 부족하다. 컴퓨팅 에너지 비용에 점점 더 많은 관심을 기울여 왔습니다. 따라서 광컴퓨팅 시스템이 다시 주목을 받고 있다. 광컴퓨팅은 에너지 소모가 적고 심층신경망(DNN) 등 AI 알고리즘을 위한 특수 가속 하드웨어로 활용될 수 있다. 최근 Feldmann과 다른 사람들은 Nature 저널에 이 "모든 광 네트워크 구현"의 최신 진행 상황을 발표했습니다.
심층 신경망에는 다층 인공 뉴런과 인공 시냅스가 포함됩니다. 네트워크 가중치라고 하는 이러한 연결의 강도는 양수(신경 자극을 나타냄) 또는 음수(신경 억제를 나타냄)일 수 있습니다. 네트워크는 이미지 인식과 같은 작업을 수행하기 위해 시냅스의 가중치를 변경하기 위해 실제 출력과 예상 출력 간의 차이를 최소화하기 위해 최선을 다합니다. 일반적으로 DNN 계산에는 CPU 및 기타 하드웨어 가속기가 사용됩니다. DNN의 훈련은 알려진 데이터 세트를 사용할 수 있으며, 훈련된 DNN은 작업에서 알려지지 않은 데이터를 추론하는 데 사용될 수 있습니다. 계산량이 크더라도 계산 작업의 다양성은 그다지 높지 않을 것입니다. 왜냐하면 많은 시냅스 가중치와 신경 흥분에서 "곱셈과 누적" 연산이 지배적이기 때문입니다. DNN은 계산 정확도가 낮을 때에도 여전히 정상적으로 작동할 수 있습니다. 따라서 DNN 네트워크는 비전통적인 컴퓨팅 기술에 대한 잠재적인 기회를 나타냅니다. 연구원들은 새로운 비휘발성 메모리 장치를 기반으로 하는 DNN 가속기를 구축하려고 노력하고 있습니다. 이런 장비는 전원을 차단할 때 정보를 저장할 수도 있고, 아날로그 전자 컴퓨팅을 통해 DNN의 속도와 에너지 효율성을 향상시킬 수도 있다.
그렇다면 광학 장치 사용을 고려해 보는 것은 어떨까요? 도광 구성 요소에는 통신용 광섬유나 광자 칩의 도파관 등 많은 양의 데이터가 포함될 수 있습니다. 이러한 종류의 도파관에서는 '파장 분할 다중화' 기술을 사용하여 다양한 파장의 빛을 함께 전파할 수 있습니다. 그런 다음 각 파장은 전자 대 광 변조 및 광전자 감지와 관련된 사용 가능한 대역폭에 의해 제한되는 속도로 변조(정보를 전달할 수 있는 방식으로 변경)될 수 있습니다. 1 전체 광 펄스 뉴런 회로 공진기를 사용하면 트럭의 싣고 내리는 것과 마찬가지로 단일 파장의 추가 또는 제거가 가능합니다. DNN 네트워크의 시냅스 가중치 배열은 마이크론 링 공진기를 사용하여 구성할 수 있습니다. 공진기는 열적으로 변조되거나, 전기 광학적으로 변조되거나, 상 변화 물질에 의해 변조될 수 있습니다. 이러한 물질은 비정질 상과 결정상 사이를 전환할 수 있으며, 다양한 물질의 광 흡수 용량은 크게 다릅니다. 이상적인 조건에서 곱셈과 누적의 전력 소비는 매우 낮습니다.
펠드만 연구팀은 네트워크에서 광전변환을 사용하지 않는 '전광신경망'을 밀리미터 광칩에 구현했다. 입력 데이터는 전자적으로 다른 파장으로 변조되어 네트워크에 주입되지만 모든 데이터는 칩에 남아 있습니다. 통합된 상변화 물질은 시냅스 무게를 조절하고 뉴런을 통합하는 데 사용됩니다. 2 인공 뉴런의 펄스 생성 및 작동 저자는 소규모의 지도 학습과 비지도 학습, 즉 레이블이 있는 데이터를 사용한 훈련(DNN 학습)과 레이블이 없는 데이터를 사용한 훈련(인간 학습과 유사)을 보여줍니다.
무화과. 3 위상 변화를 기반으로 한 지도 학습 및 비지도 학습 모든 시신경 시스템 가중치 표현은 빛 흡수에 의해 구현되므로 음의 가중치에는 더 큰 바이어스 신호가 필요하므로 위상 변화 물질을 활성화할 수 없습니다. 또 다른 방법은 Mach Zehnder 간섭계 장치를 사용하여 단일 도파관을 두 개의 암으로 나눈 다음 다시 결합하는 것입니다. 이때, 투과되는 빛의 양은 두 전파 경로 사이의 광학 위상 차이에 따라 달라집니다. 그러나 각 간섭계의 암이 각 파장에 대해 적절한 위상차를 도입해야 하기 때문에 이 방법을 파장 분할 다중화와 결합하는 것은 어려울 수 있습니다. DNN의 모든 광학 구현은 여전히 주요 과제에 직면해 있습니다. 이상적으로는 총 전력 활용도가 낮을 수 있으며 각 Mach Zehnder 간섭계 암의 광학 위상 차이를 조정하고 유지하려면 열광학 전력이 필요한 경우가 많습니다.
무화과. 4 모든 광 신경망의 확장 가능한 아키텍처 또한, 입력 신호에 대한 재료의 반응이 기대치를 충족할 수 있도록 위상 변화 물질을 포함하는 시스템에 주입된 총 광 전력을 주의 깊게 보정해야 합니다. 상변화 물질을 사용하여 마하 젠더 위상을 조정할 수도 있지만 물질이 흡수하는 빛의 강도와 빛의 속도를 늦추는 것 사이에 필연적으로 교차 결합이 발생하여 시스템의 복잡성이 증가하게 됩니다. 전통적인 DNN은 기존의 DNN이 개발한 수천 개의 뉴런과 수백만 개의 시냅스를 포함할 수 있는 대규모로. 그러나 광자 네트워크의 도파관은 결합을 방지하고 빛이 도파관을 떠나는 것을 방지하기 위해 날카로운 구부러짐을 방지하기 위해 서로 멀리 떨어져 있어야 합니다. 두 도파관의 교차로 인해 원하지 않는 전력이 잘못된 경로에 주입될 수 있으며, 이는 포토닉 칩 설계의 2D 특성을 실질적으로 제한합니다.
무화과. 5 단층 펄스 신경망 실험 구현광소자용 신경망을 구축하려면 장거리와 넓은 면적이 필요하지만, 각 광학 구조의 핵심 부품을 제조하려면 높은 정밀도가 필요합니다. 이는 각 마이크로링 공진기의 입구 및 출구와 같은 도파관 및 결합 영역이 해당 네트워크 성능에 필요한 정확한 크기에 도달해야 하기 때문입니다. 소형 마이크로링 공진기를 제조하는 방법에도 많은 제한이 있습니다. 마지막으로 변조 기술은 약한 광학 효과를 제공하며 통과하는 빛에 대한 상당한 수준의 제한된 영향을 달성하려면 긴 상호 작용 영역이 필요합니다.
Feldmann 팀의 연구에서 이루어진 진전은 이 분야의 향후 발전을 촉진할 것으로 기대됩니다. 이 연구는 미래에 에너지 효율적이고 확장 가능한 광 신경망 가속기의 출현을 위한 기반을 마련할 수 있습니다.
심천 TigerWong 기술 Co.,Ltd
전화:86 13717037584
이메일: info@sztigerwong.com
주소: 실리콘밸리 파워디지털산업단지 A2빌딩 1층 22 Dafu Road, Guanlan Street, Longhua District,
심천, 광동성, 중국