近日,华中科技大学武汉光电国家研究中心董建绩教授、周海龙副教授团队在集成光计算领域取得突破,成功研发了一种“输入-隐藏层简并”的光学衍射非线性神经网络芯片。该芯片创新性地打破了传统光芯片的物理输入限制,在极小的片上空间内实现了输入维度的平方级扩展与纯光域非线性计算,为解决光计算中“输入受限”与“非线性缺失”两大核心瓶颈提供了全新方案。相关研究成果发表在学术期刊《Optica》上,题为 On-chip input-hidden-layer-degenerate optical diffractive nonlinear neural network 。
随着人工智能对算力需求的爆炸式增长,光计算因其高带宽、低能耗优势备受关注。然而,现有的集成光子芯片面临两大难题:一是受限于一维边缘波导接口,数据输入通道极其有限,难以处理海量数据;二是光传输的线性本质使得芯片难以直接实现AI所需的非线性激活,往往需依赖外部高功耗的电域处理,制约了光计算的集成度与能效。
针对上述难题,研究团队提出并实现了一种“输入-隐藏层简并”的光学衍射神经网络新架构,如图1所示。该芯片巧妙地摒弃了传统端口输入模式,采用“简并”设计策略,将数据直接编码到芯片内部光学神经元的调控参数中。利用光的衍射特性,携带数据的光波在层间发生复杂的相互作用与混合,在仅0.5平方毫米的足迹内,不仅将输入维度从N扩展至N2,更利用物理衍射产生了高阶交叉项(Cross terms)。这种机制在不依赖外部电子辅助的情况下,成功实现了无需光电转换的“结构性非线性”。
该芯片的核心创新在于通过将数据编码在光学神经元上,实现了“高维输入”与“非线性计算”的一体化。团队在实验中充分展示了该芯片的卓越性能:在螺旋线分类和手写数字识别任务中,分别实现了88%和98%的高准确率。更为引人注目的是,该芯片在图像压缩与重构任务中展现了巨大的应用潜力,成功实现了片上高达256:1的超高压缩比,同时在极高压缩率下仍保留了关键的图像信息。与传统线性光学方案相比,IHD-ODN3在光学信息处理及复杂非线性计算任务上具有显著优势。

图1:“输入-隐藏层简并”光学衍射非线性神经网络(IHD-ODN3)的工作原理与架构。该方案摒弃了受限的传统边缘端口输入模式,创新性地采用“简并”策略,将二维图像数据直接编码至芯片内部的光学神经元参数中。利用光在层间传播时的多层衍射与充分混合,该架构在无需光电转换的情况下,成功实现了输入维度的N2级扩展与输入数据的非线性映射,有效突破了传统光计算芯片的集成度与非线性瓶颈。
该工作攻克了光计算中输入维度受限与非线性缺失的双重难题,为构建大规模、高集成度的全光深度非线性神经网络开辟了新路径。这种兼具高算力密度与能效的架构,有望打破传统电子硬件在处理海量非线性任务时的功耗墙,为自动驾驶、智能传感及大数据处理等领域开发下一代高性能光子智能芯片提供了坚实的技术基础。
该项目受到了国家自然科学基金资助。华中科技大学武汉光电国家研究中心博士生徐文广为该论文的第一作者,周海龙副教授为通讯作者。