面包屑图标 当前位置: 首页
AI资讯
热点详情

黄仁勋重大决策影响深远

AI热点日报
AI热点日报时间:2026-06-03
热点解读

英伟达联合微软、ARM推出RTXSpark芯片,采用统一内存架构,AI算力达1petaflop,旨在打破Wintel联盟。但端侧AI尚无杀手级应用,出货量预计仅占PC市场2%。其真意是将CUDA开发者生态扩展到笔记本端。

有朋友在问,怎么看待英伟达和微软联手推ARM架构的AI PC。

这问题问得好。芯片参数那些东西,翻两篇新闻就能看全,真正有意思的,是有人在拆一个存在了整整40年的联盟。

PC行业有个老词儿,叫Wintel。Windows加Intel,一个出操作系统,一个出CPU。就这么个组合,牢牢锁死了全球几十亿台电脑的底层架构。

40年了,你买一台Windows电脑,CPU不是英特尔就是AMD,全是x86架构,没第三个选项。

但这个联盟,最近挨了两刀。

第一刀,来自苹果。2020年M1芯片横空出世,直接把英特尔踢出了Mac阵营。苹果自己造CPU、自己配系统,效果确实惊艳,但代价是它只管自家那一亩三分地。macOS跟Windows毛关系都没有。

第二刀,则是高通。2024年,骁龙X Elite带着Windows on ARM的梦想来了。我翻了翻Canalys的数据,2024年第三季度,骁龙X总共出货72万台,市场份额只有0.8%。

没起来的核心原因就一个:软件生态。

微软连ARM版Windows 11的官方安装包都拖着不肯发。大量应用需要转译,反作弊软件、企业级驱动也搞不定。高通有芯片,但没生态,一个人根本撬不动Wintel这把锁。

但这次,情况变了。6月1日,黄仁勋在台北Computex上发布了RTX Spark。英伟达、微软、ARM三家在同一时间,发了同一条消息:「A new era of PC」。

跟高通过来做骁龙X那次完全不一样。上次微软的态度是“支持”,发了几台Surface,推了个Copilot+ PC的概念,然后对ARM的适配继续拖。这次微软是主动的。Build 2026大会上,纳德拉几乎是把Windows重新定义成了本地AI Agent的运行平台,一口气发了Aion 1.0本地模型、Windows Local AI运行时、还有Project Solara。微软第一次把端侧AI当成了正经事来干,压上了真金白银的筹码。

你再回头看,整个逻辑就清晰了。苹果那刀砍在了自家院子里,高通那把锁撬了半天没撬动。而这次,造芯片的和造锁的,直接坐一桌了。连锁都换了。

......

换的那把锁,叫RTX Spark。黄仁勋在Computex上给了它一个词:超级芯片(Superchip)。这不是营销话术。你把它的架构看一遍就知道,他没吹牛。

过去两年,PC行业一直在喊AI PC。怎么喊的?拿一颗x86处理器,旁边贴一个NPU,也就是神经网络处理单元,跑点轻量级的AI任务。微软给Copilot+ PC定的门槛是NPU算力40 TOPS。

40 TOPS能干嘛?

语音转文字。做一些基础的图像识别,支撑Windows Copilot做点文本补全。想在本地跑一个百亿参数的大语言模型?别想了。差一个数量级都不止。

RTX Spark的思路,完全不一样。

这颗芯片,700亿个晶体管,台积电3nm工艺。它把20核的Grace CPU和一颗Blackwell架构的GPU封在同一块芯片上,中间用NVLink-C2C互联,带宽高达600GB/s。GPU那边是6144个CUDA核心,AI算力达到1 petaflop FP4。大概是之前那些NPU的25倍。

翻译一下,这GPU性能大致相当于一块笔记本版的RTX 5070。以前这个级别的GPU是独立显卡,插在主板上。现在,它跟CPU长到一起了。

内存架构也改了。

传统笔记本,CPU一份内存,GPU一份内存,各跑各的。RTX Spark用的是统一内存架构,最高支持128GB,CPU和GPU共享。你在本地加载一个大模型,不用在CPU和GPU之间来回搬数据,直接在同一块内存里跑。

这个架构不陌生,苹果M系列走的就是这条路——统一内存、CPU和GPU封在一起、芯片级集成。RTX Spark做的事,是在Windows阵营里第一次复刻了这个思路,同时把GPU规模拉到了苹果给不了的级别。

它有个前身,叫DGX Spark,是英伟达年初发布的桌面AI工作站,定价3999美元。RTX Spark是它的笔记本化版本。OEM厂商已经排好了队,微软Surface Laptop Ultra打头阵,戴尔、惠普、联想、华硕、MSI全部跟进。今年秋天上市,整台电脑的设计核心变了,以前是塞一块显卡进去,现在是把AI引擎放在了最中间,围着它转。

......

芯片是好芯片。但问题是,谁需要它?

郭明錤在RTX Spark发布前一天发了一条分析,拿的是供应链数据。搭载这颗芯片的设备,未来两年出货量大概在1000万台左右。1000万台,听着不少。但你放到全球PC市场里算一下:一年卖2.5亿台,1000万分两年,一年500万,占比2%。

郭明錤给了一个定性:小众市场。这东西瞄准的,是对端侧AI算力有极致需求的重度用户。

这个判断背后藏着一个更扎心的事实。他说,目前PC上的AI应用,核心全在云端。你打开浏览器用ChatGPT、用Claude、用Gemini,算力全跑在别人服务器上。你通过API调用大模型,算力也在云端。你的电脑在这个过程中,干的活就是一个浏览器。什么芯片跑浏览器,有差别吗?根本没有。

郭明錤举了两个例子:2026年PC行业最热的一件事是MacBook Neo,苹果出了一款低价MacBook,卖疯了,出货量预估从500万台直接调到1000万台。消费者买的是什么?低价、设计、生态。跟端侧AI算力半毛钱关系都没有。

另一个例子是便宜的小主机,比如Mac mini这类产品。因为能7×24小时挂着跑AI Agent,很多开发者关注。听着像端侧AI的应用场景对吧?但实际上,这些Agent的推理算力几乎全部来自云端。小主机干的事就是保持在线、调度任务,真正的计算根本不在本地。

所以,这事指向一个根本问题:端侧AI目前没有杀手级应用。不是硬件不够。RTX Spark的算力,在本地跑百亿参数的模型绰绰有余。但问题是,跑它干嘛?用户根本想不出一个非要在本地跑不可的理由。

微软不是没看到这件事。Build 2026上发的那一堆东西,本质上都在回答同一个问题:操作系统怎么让端侧AI变得有用。Aion 1.0是一个140亿参数的本地小模型,支持工具调用,直接内置在Windows里。以后Windows上的AI Agent,不用每次都去云端取指令,一部分推理和决策可以在你的电脑上直接完成。方向是对的,就是刚起步。

端侧AI真正能干、而云端干不了的事,其实很清楚:隐私数据不出本机,跨应用的数据调度不经过第三方服务器,还有低延迟的实时响应。这些能力需要操作系统层面的深度整合,不是装一个 App能解决的。

那现在是什么局面?很清晰:芯片已经准备好了,操作系统刚迈出第一步,而用户需求还停留在“用浏览器上ChatGPT”的阶段。三样东西跑在三条不同的时间线上,芯片最快,生态最慢。

......

英伟达又不傻。份额就那么大,干这事图什么?

黄仁勋在Computex的媒体问答上说了一句:英伟达已经不是一家GPU公司了,是一家基础设施公司。放在PC的语境里,意味完全不一样。英伟达做RTX Spark,不是来抢英特尔那点CPU份额的。PC市场一年3000多亿美元,听着很大;但英伟达光数据中心业务,上个季度就做了752亿美元。PC那点钱,犯不着让它专门打一仗。

它要的是另一件东西。我查了一下。今年3月GTC大会上,英伟达纪念CUDA二十周年,公布了一个数字:600万开发者。

这600万人用CUDA写代码,跑在英伟达的GPU上,覆盖了AI训练、推理、科学计算、图形渲染、视频生产。整个AI产业的软件栈,底层就是CUDA。CUDA的护城河是迁移成本。大学教CUDA,论文发CUDA基准测试,创业公司招CUDA工程师。一个团队一旦在CUDA上积累了代码、工具链和工程经验,换平台?代价是组织级的。

这600万开发者现在在哪?在数据中心里,用着几万美元一块的芯片。RTX Spark干的事,就是把CUDA拉到笔记本上。这些人写的代码,不用改、不用重新编译,直接在一台笔记本上就能跑。因为架构是通的。

黄仁勋在发布会上还说了一句:我们要重新发明人类最重要的工具。说的就是PC。他还同时宣布了一件事:RTX Spark之后的第二代、第三代芯片已经在规划中。未来英伟达每一代平台架构,都会包含一颗Spark芯片。30多款笔记本、10多款台式机,同时上市。

这不是试水,这是战略布局。不过,CUDA能不能真正长到每一台终端上,取决于一个英伟达自己控制不了的变量:价格。全球DRAM现在正处在供应紧张的周期里,内存涨价。笔记本版第一批产品的起步价不会低。想让CUDA的覆盖不只局限于重度用户,需要更多代的产品,以及制程和内存的成本曲线配合。

英伟达选择在这个时间点落子,说白了,是因为它看到了一个窗口:微软第一次认真对待端侧AI;ARM架构在Windows上第一次有了成规模的OEM支持;而CUDA的开发者基数已经足够大。你看,三件事凑到一起了,这才是背后真正的动机。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:黄仁勋重大决策影响深远要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://36kr.com/p/3837092383044736
黄仁勋

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-06-03 22:07
英伟达Blackwell服务器供应新机会与2026AI趋势新手必看

英伟达Blackwell架构服务器的推出,标志着AI算力进入新阶段。这为产业链上下游带来新机遇,包括先进封装、高速连接、液冷散热及配套软件服务。对于关注2026年AI产业趋势的从业者,理解算力需求演变、供应链关键环节以及应用场景的落地路径,是把握未来方向的关键切入点。

AI热点2026-06-03 21:59
Perplexity AI智能问答与信息总结,高效获取知识

Perplexity AI产品介绍说到AI助手,不少人第一反应就是ChatGPT或者Claude——但Perplexity AI其实是个很不一样的存在。它更像一个“智能信息助理”,核心目标不是陪你聊天,而是帮你更快、更准地找到和消化信息。具体来说,Perplexity AI能干几件很实在的事。首先是

AI热点2026-06-03 21:58
Contenda FSH 技术深度解析

Contenda FSH Tech是什么 简单来说,Contenda FSH Tech是一套由The Empathetic Tech Company开发的综合性软件工具包,专为居民与市政机构设计。它的核心目标是:将人员、流程与技术高效整合,帮助市政部门解决实际业务难题,同时显著节省时间与成本。该工具

AI热点2026-06-03 21:57
标题优化硬性要求:60字符内单标题无多余内容

ContentFries是什么 ContentFries,通俗来说,是一款专门为内容创作打造的AI工具。由ContentFries团队研发,它的核心目标非常明确:帮助用户高效创作内容,并实现二次复用。无论是撰写视频脚本、激发创意灵感、追踪热门趋势,还是将长视频剪辑成短片段、自动添加字幕和表情识别,它

延伸阅读