英伟达Feynman GPU前瞻:效仿AMD X3D堆叠,盖楼式集成LPU单元
12月30日,据科技媒体Wccftech昨日报道,英伟达计划在2028年推出的“费曼”(Feynman)GPU中,集成Groq的LPU(语言处理单元)技术,旨在借此主导AI推理市场。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

理查德·费曼(Richard Feynman,1918-1988)是美国著名理论物理学家、诺贝尔奖得主,他以在量子电动力学(QED)领域的贡献而闻名,特别是提出了以他名字命名的费曼图。因这项工作,他与施温格、朝永振一郎共同获得了1965年诺贝尔奖。
GPU领域专家AGF于12月28日在X平台分析预测称,费曼GPU将借鉴AMD在X3D处理器上的成功经验,极有可能采用台积电先进的SoIC(系统整合芯片)混合键合技术,实施3D堆叠设计。

根据这一构想,主计算裸片(compute die,包含Tensor单元与控制逻辑)将采用台积电最先进的A16(1.6nm)工艺制造,而包含大规模SRAM(静态随机存取存储器)存储库的LPU单元则会制成独立的Die,直接堆叠在计算核心之上。
这种设计利用了A16工艺的“背面供电”特性,释放了芯片正面空间用于垂直连接,从而实现超低延迟的数据传输。

该专家分析认为,英伟达之所以考虑这种复杂的堆叠方案,主要源于物理层面的限制。随着制程工艺不断微缩,SRAM的缩放速度已明显滞后于逻辑电路。
若在昂贵的先进制程节点上制造单片式的大容量SRAM,不仅会造成高端硅片的浪费,还将导致晶圆成本急剧飙升。因此,将LPU/SRAM剥离为独立Die并进行堆叠,成为平衡性能与成本的最优解,这也符合当前半导体行业追求“芯粒”(Chiplet)化的技术趋势。
援引博文介绍,尽管堆叠方案理论上能带来巨大的推理性能飞跃,但实际落地仍面临重重困难。首先是散热问题,在原本就高密度的计算核心上再堆叠发热单元,极易触碰热功耗墙。
其次是更为棘手的软件适配问题:Groq的LPU架构强调“确定性”执行顺序,而英伟达赖以生存的CUDA生态则基于硬件抽象与灵活性设计。

如何在保证CUDA兼容性的前提下,完美融合LPU的固定执行逻辑,将是英伟达工程师必须攻克的“工程奇迹”。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
三星SSD惊现山寨版,性能造假如何辨别真伪
作为市面上最优秀的SSD(固态硬盘)之一,三星990 Pro近日出现了一款“高仿产品”。据tomshardware报道,其做工之精细、表现之接近,既令人惊叹,也让人不寒而栗。媒体指出,假货厂商在包装
WinRAR解压前删除原文件设置教程
WinRAR解压前自动删除原文件是因启用了“解压前删除已存在的文件”选项,需通过设置界面取消勾选、右键解压时调整覆盖选项或修改winrar ini中DeleteFilesOnExt
英特尔酷睿 Ultra 2x3PE 处理器确认:支持 Bartlett Lake 12P 系列
1 月 17 日消息,半导体和电子元器件代理商 Mouser Electronics 贸泽电子目前已在正式列出了多款命名格式符合“酷睿 2x3PE”的英特尔处理器新品。从此前现身基准测试的酷睿 7
TikTok海外版上架商品链接教程与前提条件详解
必须完成五项前提:一、通过TikTok Shop卖家资质认证;二、绑定TikTok账号与Shop店铺;三、商品已上架且符合区域政策;四、账号达1000粉并升级为专业号、开通带货权限
有道云笔记网页版:在线编辑与官方登录入口详解
有道云笔记在线编辑入口为https: note youdao com ,支持多端同步、网页剪报、OCR识别、PDF转换及语音速记等功能,实现云端协作与高效知识管理。有道云笔记在线
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

