英伟达下月GTC大会将发布新款推理芯片,集成Groq LPU设计
英伟达计划在下个月的GTC开发者大会上发布一款整合了Groq“语言处理单元”(LPU)技术的全新推理芯片,标志着英伟达正加速向推理计算领域转型,以应对客户对高效能、低成本计算方案的迫切需求。
据华尔街日报报道,这款被英伟达首席执行官黄仁勋称为“世界从未见过”的全新系统,专为加速AI模型的查询响应而设计。该产品的推出预计将重塑当前的AI算力市场格局,直接影响正在寻找更具成本效益替代方案的云服务提供商和企业级投资者。
作为市场对该技术初步认可的重要标志,ChatGPT开发商OpenAI已同意成为该新处理器的最大客户之一,并宣布将向英伟达购买大规模的“专用推理产能”。这一举动不仅稳固了英伟达的核心客户盘,也向市场发出了明确信号:支持自研AI智能体的底层基础设施正从大规模预训练转向高效推理。
在面对谷歌、亚马逊以及众多初创公司激烈竞争的背景下,英伟达正在突破传统图形处理器(GPU)的单一依赖。通过引入新的技术架构以及探索纯中央处理器(CPU)的部署模式,该公司试图在AI产业演进的下一阶段继续巩固其市场统治地位。
整合LPU设计,直击大模型推理瓶颈
随着AI行业从模型训练向实际应用部署转移,推理计算成为核心焦点。AI推理主要分为预填充(pre-fill)和解码(decode)两个阶段,其中大型AI模型的解码过程尤为缓慢。针对这一技术瓶颈,英伟达选择通过外部技术整合来突破物理极限。
据华尔街日报报道,英伟达去年底斥资200亿美元获得了初创公司Groq的关键技术许可,并在一次大规模的“核心聘用”交易中吸纳了包括创始人Jonathan Ross在内的高管团队。Groq所设计的“语言处理单元”(LPU)采用了与传统GPU截然不同的架构,在处理推理功能时表现出极高的效率。
业内分析认为,即将发布的新品可能涉及具备颠覆性的下一代Feynman架构。据华尔街见闻此前文章,Feynman架构可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术将LPU深度整合其中,专门针对延迟和内存带宽这两大推理瓶颈进行优化,从而大幅降低AI智能体运行的能耗与成本。
拓展纯CPU部署,提供多元化计算选择
在引入LPU架构的同时,英伟达也在灵活调整其传统处理器的使用方式。英伟达以往的标准做法是将Vera CPU与其强大的Rubin GPU捆绑在数据中心服务器中,但在处理某些特定的AI智能体工作负载时,这种配置被证明成本过高且能效不足。
部分大型企业客户发现,纯CPU环境在运行特定AI任务时更为高效。顺应这一趋势,英伟达本月宣布扩大与Meta Platforms的合作,进行了首次大规模的纯CPU部署,以支持Meta的广告定向AI智能体。这一合作被市场视为英伟达战略调整的早期窗口,表明公司正超越单一的GPU销售模式,试图通过多元化的硬件组合来锁定AI市场的不同细分领域。
市场需求换挡,竞争态势持续升级
这种底层硬件设计的演进,直接源于科技行业对AI代理应用需求的爆发。许多构建和运营AI智能体的公司发现,传统的GPU成本过于昂贵,且在实际运行模型时并非最佳选择。
OpenAI的动向凸显了这一趋势。除了承诺采购英伟达的新系统以改进其快速增长的工具外,OpenAI上个月还与初创公司Cerebras达成了一项价值数十亿美元的计算合作。据Cerebras首席执行官Andrew Feldman称,其专注于推理的芯片在速度上超越了英伟达的GPU。此外,OpenAI还签署了使用亚马逊Trainium芯片的重大协议。
不仅是初创公司,主要云服务商也在加紧自研芯片步伐。被广泛视为自动编码市场领导者的Anthropic Claude Code,目前主要依赖亚马逊AWS和Alphabet旗下谷歌云设计的芯片,而非英伟达的产品。面对竞争对手的围剿,黄仁勋在接受wccftech采访时强调,英伟达正从单纯的芯片供应商向涵盖半导体、数据中心、云和应用的完整AI生态系统构建者转型。对于投资者而言,下个月的GTC大会将是检验英伟达能否在推理时代延续90%市场份额神话的关键节点。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
比亚迪确认收购欧洲闲置工厂计划属实
一则关于比亚迪加速欧洲本土化布局的最新动态,近日引发了汽车行业广泛关注。据权威财经媒体报道,这家全球领先的中国新能源汽车制造商正在与Stellantis集团等多家欧洲主流汽车制造商进行深入接触,核心议题是商讨接管后者在欧洲地区利用率不足或闲置的工厂设施。 今日,比亚迪官方通过中证金牛座等渠道证实了谈
成都机器人吸引爱尔兰议员驻足互动海外嘉宾纷纷点赞
2026年成都国际友城合作与发展大会现场,一股源自本土的“硬核”科技风潮成为全场瞩目的焦点。来自成都的“智元”远征A2机器人、“四川具身”情感交互机器人等前沿产品集中展示,其创新形态与智能交互能力迅速吸引了众多与会嘉宾的关注。 会议期间,爱尔兰统一党议员基兰·丹尼森对这些成都制造的机器人表现出浓厚兴
东华测试在可控核聚变结构强度测试中的应用与进展
可控核聚变,被誉为解决人类未来能源需求的终极方案。然而,从科学构想到工程实现,需要坚实而渐进的技术积累。近期,在一次专业的技术研讨中,东华测试分享了其在核能测试领域的最新动态,为我们洞察这一尖端行业的进展提供了具体视角。 从战略布局分析,公司的技术能力已全面覆盖核能发展的两大主流路径。在面向未来的可
美股科技股普遍下跌英伟达连续七日创新高白银价格大跌近5
5月14日晚,美股市场开市呈现高开态势,三大股指全线飘红。然而,市场的乐观情绪并未能持续蔓延至所有板块。 大型科技股普遍承压下行。截至当晚22:00左右,芯片巨头英伟达却逆势上扬,涨幅接近3%,股价连续第七个交易日刷新历史纪录,总市值攀升至5 63万亿美元。回顾过去两个月,其累计涨幅已接近24%,势
马斯克携幼子访华引热议 孩子穿中式服装学普通话
5月14日,特斯拉CEO埃隆·马斯克现身北京人民大会堂,其6岁儿子X AE A-XII(昵称小X)的造型成为全场焦点。这位小男孩身着复古中式马甲与虎头帽,手拎精致虎头包,活泼可爱的模样迅速在各大社交平台引发热议,收获无数网友点赞。 当晚,马斯克本人在社交媒体上用中文发文,分享了一个温馨细节:“我的儿
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

