NPU的光计算:光学神经网络的前沿
去年调试一块光电混合计算板卡时,我盯着示波器上那团乱麻般的波形整整三天。板卡上集成了微环谐振器阵列,理论上应该实现每秒10^15次乘加运算,但实际测到的信噪比始终达不到设计值。最后发现是片上激光器的温度漂移导致谐振波长偏移了0.3纳米——这个在电子芯片上完全不是问题的量级,在光计算领域足以让整个矩阵乘法结果变成噪声。那次经历让我意识到,光学神经网络不是简单的“把电子换成光子”,它需要重新理解计算的基本物理约束。
为什么光计算突然“复活”了
光计算这个概念其实比晶体管还老。上世纪60年代就有学者用透镜做傅里叶变换,但后来被数字电子计算机碾压了半个世纪。最近十年它重新被关注,根本原因是电子NPU遇到了两个物理天花板:一是互连带宽密度,二是功耗墙。电子芯片内部金属连线的RC延迟随工艺微缩反而恶化,而光波导的带宽密度理论上可以做到电互连的1000倍以上。更关键的是,光计算的核心操作——矩阵乘法——在光学域里几乎不消耗能量,能量主要花在电光转换和光电探测上。
但别被“零功耗计算”这种宣传词忽悠了。光计算的实际功耗取决于你用什么调制方式、什么探测器。我实测过马赫-曾德尔干涉仪阵列,单个MZI的调相功耗大约在皮焦量级,比电子乘法器低两个数量级,但整个系统的激光器功耗和温控功耗会迅速吃掉这个优势。
光学神经网络的核心架构:从干涉到衍射
目前主流的光学神经网络架构可以粗暴地分成两类:干涉式(基于MZI网格)和衍射式(基于空间光调制器)。前者更像传统数字电路,用分束器和移相器构建可编程的线性变换;后者则更接近模拟计算,用衍射光学元件直接实现卷积。</