光计算机瘦身90%:科学家称手机将获光速思考能力
近日,美国康奈尔大学团队给光学计算机成功减了肥,让它缩小了 90% 以上,但性能却几乎没有下降。这意味着我们距离一个万物智能的世界更近了,比如智能手表有望搭载一个能以光速思考的 AI 助手,汽车可能拥有匹敌人类的视觉系统。

图 | 李彦栋(来源:李彦栋)
相关论文的第一作者、康奈尔大学博士后李彦栋开发出针对光学系统的模型压缩与简化策略,将光学神经网络的物理尺寸缩小到传统设计的 1%–10%, 同时保持推理准确率基本不变。
研究进一步表明,随着光学计算系统体积的增大,其推理准确率的提升会逐渐趋缓,需要不断扩大架构规模,才能获得有限的性能提升。这意味着,在许多应用场景中,通过优化结构与资源分配,在有限尺寸内实现高效计算,往往比单纯追求更大规模更为关键。

(来源:https://www.nature.com/articles/s41467-025-63453-8)
在传统电子计算中,信息以电压的形式存在,通过晶体管在电路中不断调控来完成运算。而在光计算中,信息被编码在光的物理特征中,例如光的强度、相位、偏振和频率。这些光信号在器件内部或不同光学器件之间传播时,会严格按照物理规律发生变化。正是这些受控的物理变化过程,本身就构成了一种模拟计算。更重要的是,这些光学器件并非一成不变。通过设计或调控器件的结构和参数,人们可以让光在传播过程中执行特定的数学运算,从而实现所需要的计算功能。
随着 AI,尤其是大模型的快速发展,计算系统正面临能耗、速度等多方面的挑战。光计算正是在这些关键维度上,展现出独特的潜在优势。
首先是能效优势。与电信号在金属导线中传输相比,光在许多材料中的传播损耗要低得多。在计算规模足够大的情况下,例如超大规模矩阵运算,用于调控光学器件的能耗相对于整体计算来说可以忽略不计。这使得光计算在大规模计算任务中,具备显著优于传统电子计算的能效潜力。
然后是信息通量优势。光在信息承载能力上具有天然优势。在空间维度上,自由空间光学系统可以轻松支持上百万个空间模式同时调控;在频谱维度上,光的带宽处于太赫兹量级,可支持成百上千个频域模式并行处理。
最后是速度优势。光计算的运算速度,本质上由光穿过器件的时间决定。虽然在现代电子处理器中,电信号的传播速度本身也接近光速。但在处理光信号时,电子处理器仍然需要进行光电转换。光计算的关键优势在于:当输入信号本身就是光时,可以用光学器件对其直接进行处理,从而避免光电转换所带来的时间延迟。这种低延迟特性在 AI 视觉相关应用中非常关键,例如自动驾驶、增强现实和具身智能等场景。

(来源:https://www.nature.com/articles/s43588-024-00657-w)
既然光计算优势显著,尤其适合超大规模计算,为什么还没有在实际系统中广泛应用?一个重要原因是,现有光计算设备往往体积较大。
光计算系统依赖特定形式的非定域性:某个输出结果需要依赖来自多个空间位置的输入信息。这要求光在器件内部进行横向的信息交换,而不仅仅是沿传播方向前进。
在复杂计算任务中,不同输出依赖的输入区域往往高度重叠。为了避免相互干扰,系统需要支持大量互相独立的横向传播通道,而这些并行通道通常只能通过增加器件厚度来实现。因此,随着计算复杂度的提高,光计算设备往往不可避免地变得更厚、更大。

(来源:https://www.nature.com/articles/s41467-025-63453-8)
李彦栋的研究灵感,来自 AI 领域广泛应用的神经网络剪枝。在 AI 中,剪枝通过删除冗余或不重要的参数与连接,在尽量保持性能不变的前提下,显著降低模型规模和计算复杂度,已成为边缘计算和大模型加速的关键技术。
但在光学计算中,真正需要“剪掉”的并不是参数数量,而是整个系统的物理尺寸。围绕这一核心问题,李彦栋针对两种主流光学平台——自由空间光路和光子芯片——提出了面向物理约束的剪枝策略。
在自由空间光路中,要让器件变薄,关键在于让每个输出主要依赖附近的局域输入,而不是与整个输入平面耦合,即限制光所需的横向“信息交换范围”。基于这一物理直觉,他在训练过程中引导光学神经网络形成“本地稀疏结构”,通过惩罚远距离连接并重新排列神经元位置,将非定域连接压缩到局部区域。结合常规权重剪枝后,器件厚度可降至传统设计的 2%–25%,同时显著改善规模定律(Scaling Law):计算规模扩大 100 倍,器件厚度仅增加约 10 倍,而不再是传统设计的线性 100 倍增长。
在光子芯片平台上,若所有输入与输出完全耦合,所需器件数量会随规模平方增长,成为小型化瓶颈。对此,他提出将计算结构引导为块对角形式,把高度耦合的运算拆分为多个相互独立的小模块。这种设计虽然牺牲了部分全局耦合,但模型性能基本保持,同时所需器件数量大幅下降,使系统的规模定律从平方级改善为准线性。在超大规模计算场景下,相比传统设计,所需器件数量可减少约 99%,为超大规模片上光计算提供了可行路径。
在严格证明规模定律改进的同时,李彦栋将这套剪枝策略应用到实际的光学神经网络中,设计了小型化的光子芯片模块,用于替换目标检测模型 Faster R-CNN 中的大规模矩阵运算。通过将这部分计算转移到光学模块,60% 以上的 GPU 侧参数被移除,显著减轻了 GPU 的计算负担。

(来源:李彦栋)
小型化、可扩展光学神经网络的突破,并不是终点,而是新的起点。它引出了更深层次的问题:从信息论的角度,应该如何理解光学系统的计算与信息处理能力?
与此同时,李彦栋也期待这一方向能够催生新的应用范式——将光计算视为一种全新的计算资源,或许可以像量子计算一样,构建基于光学计算的云平台,让更多研究者和开发者能够低门槛地接触、试用,并开发直接适配光学硬件的高效算法。
“小型化光学系统的设计,仍然高度依赖我们对物理规律和系统约束的理解。”李彦栋表示,“我希望模型能够自主‘理解’物理规律、任务目标、资源投入与回报,进而演化为具备完全自动优化能力的智能体,让算法与物理系统协同进化,为未来的智能硬件打开更大的想象空间。”
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Swissbit N7000嵌入式SSD采用自封NAND与自研主控固件
近日,欧洲领先的工业级存储解决方案提供商Swissbit,正式发布了其全新一代嵌入式固态硬盘产品线——N7000系列。该系列产品的核心亮点在于实现了从闪存颗粒到主控固件的全链路关键技术整合:不仅采用了Swissbit自主封装的NAND闪存,更首次搭载了其自研的PCIe Gen4 NVMe主控芯片及配
iQOO 15T首发天玑9500 Monster版 性能解析与价格速览
iQOO15T性能旗舰手机首发天玑9500Monster版芯片,配合帧内感知调度技术,性能与稳帧表现显著提升。其配备8K冰穹VC散热系统与寰宇电竞网络2 0,保障高强度使用体验。手机搭载8000mAh超薄电池与100W闪充,支持边充边用且减少电池损耗。屏幕采用2K144HzLTPO技术,实现清晰护眼流畅的视觉体验。
SpaceX上市最新进展谷歌或成最大外部受益者
SpaceX即将上市,估值或达1 75万亿至2万亿美元,有望创下全球最大IPO纪录。公司凭借火箭发射主导地位及星链业务高速增长支撑高估值。早期投资者如D1资本、达尔萨纳资本回报丰厚,Alphabet作为重要股东持股价值约875亿美元。创始人马斯克保持控制权,员工期权池亦价值巨大。上市进程已进入最后阶段。
武汉发布首款家庭通用机器人可叠衣做饭收拾餐桌
全国首款面向家庭环境的通用型服务机器人正式发布。5月20日,在武汉光谷,一款名为“拾光 S1”的智能家用机器人揭开面纱。该机器人致力于解决多样化的家庭事务,涵盖衣物整理、餐食准备、餐桌清理以及老人陪伴交流等场景,并具备持续学习与技能升级的成长能力。 它完全不同于传统工业流水线上按固定程式作业的机械臂
南京江北新区低空经济乘风而上逐梦未来
江阴大桥的巡检工作,过去需要一支20人的团队,耗费整整两个月才能完成。如今,这项任务只需一人,十天就能全部搞定。效率发生如此碘伏性提升,秘密在于给无人机装上了“智慧大脑”——这正是南京韦博智控科技有限公司带来的变革。 而这,仅仅是南京江北新区在低空经济浪潮中乘风起飞的一个缩影。在这里,低空不再仅仅是
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

