美国国家实验室转向初创企业寻求AI芯片替代方案
近年来,人工智能技术的迅猛发展深刻改变了全球芯片产业的竞争态势。以英伟达、AMD为代表的行业巨头,几乎将全部研发资源和产能都集中在了高利润的AI低精度计算市场。然而,这场席卷全球的“AI算力竞赛”,却让另一个关乎国家科研与工程命脉的领域——高精度科学计算,面临着被边缘化的风险。
一个清晰的迹象是,包括美国桑迪亚国家实验室在内的顶尖科研机构,正因难以从主流供应商处采购到合适的高性能计算芯片,而不得不将合作目光转向以往规模较小的芯片初创企业。

巨头战略倾斜,高精度计算芯片供应紧张
桑迪亚国家实验室并非普通科研单位,它是美国核心的核武器设计、测试与维护机构之一。其部署的液冷超级计算机,常年承担着全球最复杂的科学模拟任务:例如精确模拟高超音速核载具在大气层中的飞行轨迹,或是推演极端条件下核爆的连锁物理效应。过去数十年,为这些“国之重器”提供核心算力的芯片,几乎被英伟达和AMD所垄断。
如今,这一格局正在松动。桑迪亚实验室高性能计算部门负责人Steve Monk透露,随着主流芯片厂商的战略重心全面转向人工智能,加之全球供应链持续紧张,实验室在获取适用于高精度科学计算的专用芯片时,面临的挑战日益严峻。这种从供应链到技术路线的双重压力,甚至引发了团队对未来能否保障关键国家科研项目顺利运行的深切担忧。
矛盾的核心,聚焦于一项名为“双精度浮点运算”(FP64)的关键技术指标。在核物理模拟、流体力学、气候预测等尖端科研领域,计算芯片必须能够在极高数值范围内保持精确无误的运算能力,不能有丝毫精度损失。尽管英伟达与AMD长期争夺该领域的领导地位,并赢得了大量政府及学术机构的超算订单,但当前火爆的AI模型训练与推理,主要依赖FP8、FP16等低精度格式,对FP64的需求极低。因此,芯片巨头的产品研发路线图不可避免地发生了偏移。
双精度浮点计算(FP64)被视作科学计算的“精度基石”,它是确保新型航空器设计、航天发射、药物研发乃至核威慑体系可靠性的数学基础,能够表达超过1.8×10^19个唯一数值。相比之下,当前多数AI应用使用的FP8格式仅能表达256个值,两者在精度维度上存在天壤之别。
一个颇具代表性的案例是英伟达最新发布的Rubin GPU。其在AI推理算力上实现了代际飞跃,峰值性能达50 PetaFLOPS,是前代Blackwell架构的2.5倍。然而,其FP64的硬件峰值性能却仅为约33 TeraFLOPS,甚至略低于四年前推出的H100芯片。当然,英伟达也推出了基于Ozaki算法的FP64软件仿真方案,宣称可在CUDA库中实现高达200 TeraFLOPS的矩阵运算性能。但这一方案也引发了业界专家的疑虑。AMD研究员Nicholas Malaya指出,此类仿真技术在标准基准测试中或许表现尚可,但在涉及真实物理过程(如材料相变、燃烧动力学)的模拟中,其数值可靠性存疑,且存在IEEE标准合规性不足、内存占用倍增等潜在问题。
芯片行业咨询机构More Than Moore的首席分析师Ian Cutress对此评价道:英伟达即将推出的Rubin芯片,其双精度性能在某些关键指标上不增反降,这无疑给全球高性能计算领域的众多科学家敲响了警钟。
市场缝隙显现,初创企业迎来机遇
行业巨头的战略转向,无意中为市场留下了一片蓝海。而像NextSilicon这样的创新公司,正试图抓住这一历史性机遇。这家成立于2017年的以色列芯片初创企业,经过八年潜心研发,累计获得了约3.03亿美元融资,估值一度触及15亿美元。
NextSilicon选择了与英伟达、AMD截然不同的技术路径。其旗舰产品“Maverick-2”芯片采用了创新的智能数据流架构。简而言之,该架构能够通过软件定义的数据流硬件,在运行时动态地重构与优化自身,实现芯片对特定计算任务的高效自适应。在能效方面,数据流架构极大减少了数据在存储与计算单元之间的无效搬运,从而在功耗控制上展现出显著优势。
对于这种新颖的架构,桑迪亚国家实验室负责新型计算架构评估的高级科学家James Laros给予了积极反馈:“NextSilicon的测试性能结果令人瞩目,它展示出一种巨大的潜力——无需对现有科学计算代码进行大规模重写,即可显著提升整体运算效率。”
近期,桑迪亚国家实验室、NextSilicon以及系统集成商Penguin Solutions共同宣布,搭载NextSilicon芯片的超级计算机原型系统,已成功通过了一系列通用高性能计算基准测试的关键技术验证。这标志着该系统获得了“准入资格”,将于今年秋季接受更贴近核安全实际应用场景的极端复杂计算任务考验。
Laros揭示了实验室携手初创公司的深层战略考量:构建一个多元化的、具备韧性的芯片供应链体系。其目的是确保即使未来主流芯片供应商完全转向其他市场,国家实验室依然能够持续、稳定地获得满足重大科研项目需求的尖端算力。
“我们必须确保自己拥有完成使命的可选方案,”Laros强调,“因为这项使命,不容有失。”
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
2026年618大促AI全场景应用深度解析与产业观察
2026年618大促将全面融合AI技术,覆盖全场景与产业链。平台通过持续研发,将AI应用于零售、物流、健康及工业等数千场景,旨在提升产业效率与消费体验。以“附身智能”JoyInside为代表的AI能力正接入超千万台智能设备。京东在AI基础设施层面已构建全栈产品矩阵及多个垂直模型,研发投入大幅增长。
AI训练数据选择难题破解智能配方秤精准筛选方案
字节跳动与加州大学提出InfoLaw框架,解决大模型因重复使用高质量数据导致的性能下降问题。该框架量化数据信息获取量,结合质量、重复次数与模型规模等因素,建立预测性能的统一曲线,可主动搜索最优数据混合比例,提升训练数据利用效率。
AI视觉识别模糊的原因与解决方法
2026年5月提出的MoCam采用分阶段新视角合成方法:早期利用粗糙点云确定布局,后期切换至原始视频修正错误并补充细节。该方法解决了传统方式中几何与外观冲突导致的画面模糊问题,在静态与动态场景中均提升了生成质量与控制精度,为影视、虚拟现实等领域提供了新思路。
芯片AI与智慧家电三企同步启动港股招股
5月18日,港股市场迎来新股集中招股。云英谷科技、深演智能和华曦达三家公司同步启动招股,分别聚焦显示驱动芯片、AI营销与智慧家庭产品,申购均于21日截止。同日,翼菲科技上市首日大涨,龙丰集团通过港交所聆讯。
腾讯吐司与蚂蚁灵光对比评测普通人如何选择AI应用开发工具
腾讯“吐司”与蚂蚁“灵光”均主打AI生成应用,但路径不同。吐司能打包生成APK文件,实现真正安装,过程耗时较长;灵光生成HTML页面,速度更快但依赖平台运行。两者均降低了应用制作门槛,适合生成简单工具,但面临分发挑战,且无法满足专业开发需求。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

