英伟达押注AI推理：计算变革迎来重大突破

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

英伟达押注AI推理：计算变革迎来重大突破

热心网友时间：2026-03-17

转载

AI计算迎来重大变革，英伟达押注的“推理”是什么？

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

图1：黄仁勋开始发力推理芯片

北京时间3月17日，《华尔街日报》报道称，AI领域正在经历一场重大变革，这对大大小小的科技公司都影响深远。

过去五年间，AI领域的主要焦点一直是大语言模型的训练。这是一个成本高昂的过程，需要数万块芯片、消耗巨大的能源，且在偏远的大型数据中心进行。这一训练过程需要使用数千个专业微处理器芯片组成的集群，将数百亿条信息输入模型。芯片集群每周7天、每天24小时运行，持续数周甚至数月之久。

从训练到推理

如今，随着越来越多的公司部署AI智能体，并试图将基于大语言模型构建的新工具商业化，焦点已转向推理：这种计算方式能让训练好的AI模型响应用户的查询。

根据研究机构Gartner的数据，今年全球在推理基础设施上的资本支出，预计将首次超过训练资本支出。到2029年，企业在推理上的投入将达到720亿美元，是训练投入370亿美元的近两倍。

AI计算迎来重大变革，英伟达押注的“推理”是什么？

推理支出将超过训练

这一转变意味着，科技公司购买的芯片类型将发生重大变化。英伟达之所以成为全球市值最高的公司，靠的是销售名为GPU的芯片，这类芯片具备模型训练所需的原始处理能力。但乔治城大学研究AI的学者雅各布·菲尔德戈伊斯表示，那些预期将进行更多推理工作的公司，可以通过使用专门为推理任务优化的芯片来获得性能提升。

专门生产推理芯片的制造商包括谷歌、Cerebras Systems、SambaNova等，他们正以越来越快的速度签下价值数十亿美元的订单。英伟达则准备推出自己的推理专用处理器，此前该公司于去年12月斥资200亿美元，获得了定制推理芯片公司Groq的技术授权并吸纳其顶尖人才。

那么，究竟什么是推理计算？它与训练所需的计算有何不同？为什么需求如此迅速转向推理？这对市场又意味着什么？

推理计算的原理

你可以把AI想象成一家餐厅。模型就是那位厨师。在经过一段时间的密集培训，学习了数百乃至数十亿个食谱和烹饪技巧后，它就可以开始接单了。

推理就是这家餐厅的日常运营。食客下单，厨师备餐。

AI计算迎来重大变革，英伟达押注的“推理”是什么？

推理的原理

推理包含两个阶段，即预填充和解码。当用户输入提示词时，预填充阶段开始，模型通过处理其中的每个单词、符号或图像来解读用户的查询。

解码则是模型运用其在训练中学到的一切，生成查询响应的过程。

推理的这两个阶段对芯片有着不同的要求：预填充阶段需要更强的处理能力，而解码阶段则需要更大的内存，部分原因在于它必须调动所积累的全部知识，才能为用户呈上新鲜出炉的"词元"。

什么是词元？

词元是用于处理查询并生成响应的基本数据单位。

虽然不同类型的数据对应的换算范围有所不同，但通常认为一个词元大约相当于四分之三个英文单词。以"今天天气怎么样？"这样简单的聊天机器人查询为例，模型会将其解析为六到八个词元。

AI计算迎来重大变革，英伟达押注的“推理”是什么？

词元

模型通常逐次生成一个词元，并且必须按正确的顺序输出每个词元，这样才能保证回答通顺合理。

目前，那些试图将AI工具变现的公司，从会计软件、旅行预订服务到图像生成器，都痴迷于诸如"每瓦每秒生成的词元数"或"每美元每秒生成的词元数"这类成本指标。

芯片制造商格芯的CEO蒂姆·布林表示，这使得推理芯片高效输出结果的能力变得尤为重要，"如今，降低推理成本才是关键所在"。

训练与推理芯片的区别

由于训练需要在长时间内处理海量数据，所采用的芯片必须具备强大的处理能力，且芯片所在的数据中心必须能够获得充足的能源以及用于冷却芯片的水。训练同样需要内存，但如果GPU内存不足，可以将部分处理任务分派给其他芯片，或者等待现有内存释放。

相比之下，推理过程是按需进行的，耗时以秒计，而非数周。"超过十秒钟，用户就已经开始用大拇指敲手机屏幕，准备去做下一件事了。"芯片设计公司SambaNova的CEO罗德里戈·梁表示。

因此，推理芯片必须配备更大容量的高带宽内存，且其所在的数据中心必须邻近用户聚集区以降低延迟。像Ayar Labs这样的芯片创业公司也越来越多地采用光纤连接组件，光纤的数据传输速度比铜缆更快，且所需冷却更少。

Ayar Labs CEO马克·韦德表示："如今，一切都围绕着推理规模化展开。"

更多一手新闻，欢迎下载凤凰新闻客户端订阅科技。想看深度报道，请微信搜索"科技"。

来源:https://tech.ifeng.com/c/8rYveWAeHeZ

上一篇：巨型充电宝诞生记：探秘创新能源方案历程

下一篇：抖音在深成立信息科技新公司，布局大湾区业务

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

NS版饿殍明末千里行今日发售全流程攻略与剧情解析

洛克王国倒影暗域地图位置与进入方法详解

洛克王国奇丽花性格选择攻略与对战搭配指南

洛克王国铁居小堡技能组合与实战搭配攻略

洛克王国水晶地穴位置与进入方法详解

洛克王国月光桃源进入条件与VIP权限详解

DNF千海天版本光枪毕业装备搭配指南

DNF千海天版本驱魔师最强毕业装备搭配指南

植物大战僵尸网页版2026最新官方入口地址与登录指南

DNF千海天混沌魔灵毕业装备搭配攻略

小米汽车推出寻天子品牌增程车型将改变家用车市场格局

张雪机车WSBK再夺冠 A股“朋友圈”不断刷新：谁将分享胜利

云端上网难普及！揭秘飞机Wi-Fi为何落地这么慢

C#怎么实现泛型编程_C#如何使用泛型类和泛型方法提高代码复用【基础】

C++如何获取当前进程的虚拟内存大小 _ 平台特定API调用方法【实战】

C#怎么实现享元模式_C# Flyweight减少大量细粒度对象内存【性能】

C++ std::is_trivially_destructible用法 _ 优化大规模对象销毁效率【干货】

C#如何进行Base64编码转换_C#图片与字符串Base64互转【实用】

C++ Linux编程中怎样使用智能指针

C++ Linux系统中怎样进行内存映射

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

东京电玩展官方辟谣：王国之心2.8终章高清版4传闻不实发布于 2026-05-12

Farever新手入门指南：快速上手的实用技巧与心得分享发布于 2026-05-12

未竟约定即将开启新版本前瞻内容详解发布于 2026-05-12

红色沙漠开发商Pearl Abyss公布DLC计划与游戏升级蓝图发布于 2026-05-12

eBay拒绝GameStop CEO科恩560亿美元收购要约发布于 2026-05-12

Fayde 与 Wolves 战队解约原因及未来去向分析发布于 2026-05-12

天龙八部手游石灰包使用技巧与实战效果解析发布于 2026-05-12

斗罗大陆猎魂世界寻宝活动玩法全攻略发布于 2026-05-12

冬季早卧晚起必待日光养生原则最早出自哪部中医经典发布于 2026-05-12

霓凰装备宝玉搭配攻略这城有良田最强阵容推荐发布于 2026-05-12

王者荣耀世界铠伽罗阵容搭配与实战玩法详解发布于 2026-05-12

洛克王国不褪色的羁绊活动即将结束未参与玩家速来发布于 2026-05-12

命运石之门重启版8月20日发售明日开放预购发布于 2026-05-12

2026年热门战争策略游戏盘点与推荐发布于 2026-05-12

明日方舟终末地测试资格申请与获取全攻略发布于 2026-05-12

免费MP3格式转换软件推荐与实用盘点发布于 2026-05-12

Win11资源监视器使用教程详解系统资源占用查看方法发布于 2026-05-11

统信UOS系统安装Redis数据库详细配置教程发布于 2026-05-11

统信UOS系统安装钉钉详细教程在家办公与上网课必备指南发布于 2026-05-11

Win11屏幕保护程序设置教程自定义样式与时间详解发布于 2026-05-11

统信UOS系统安装IntelliJ IDEA详细步骤 Java开发环境配置指南发布于 2026-05-11

Linux系统版本与内核版本查看命令详解发布于 2026-05-11

Windows 11防火墙设置教程如何禁止指定程序联网发布于 2026-05-11

统信UOS系统更新卡在99%解决方法清理更新包教程发布于 2026-05-11

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

英伟达押注AI推理：计算变革迎来重大突破

南加州大学突破大模型编辑瓶颈实现知识更新与记忆稳固

微软Copilot付费用户超2000万年增长率达33%

纽约大学提出成本感知AI框架让智能体学会权衡决策

谷歌Chrome浏览器为何自动安装本地AI模型

2026款现代IONIQ 5评测高性价比电动SUV值得买吗

英伟达押注AI推理：计算变革迎来重大突破

南加州大学突破大模型编辑瓶颈实现知识更新与记忆稳固

微软Copilot付费用户超2000万 年增长率达33%

纽约大学提出成本感知AI框架 让智能体学会权衡决策

谷歌Chrome浏览器为何自动安装本地AI模型

2026款现代IONIQ 5评测 高性价比电动SUV值得买吗

微软Copilot付费用户超2000万年增长率达33%

纽约大学提出成本感知AI框架让智能体学会权衡决策

2026款现代IONIQ 5评测高性价比电动SUV值得买吗