面包屑图标 当前位置: 首页
AI资讯
热点详情

AI资本开支新变局 Meta卖算力 Palantir不满智谱顶流

AI热点日报
AI热点日报时间:2026-07-03
热点解读

Meta考虑出售多余算力引发市场波动,但云厂商收入持续增长。Palantir批评token收费模式,企业开始优化AI支出。开源模型如智谱GLM-5 2被用于降低成本,算力需求从总量转向结构分化,关键在于保持利用率。

AI 市场再度遭遇剧烈回调,导火索是 Meta 暗示可能将自身多余的 AI 算力对外出售。

若这个信息出现在三年前,大概不会引发过多关注。云计算本质上就是将服务器资源拆分后再出售的商业模式,亚马逊、微软、谷歌等巨头早已践行多年。CoreWeave、Nebius 等新兴云厂商也沿袭同一路径,将英伟达芯片作为融资抵押物,再用筹集到的资金购买更多芯片。

然而,当主角换成 Meta,整件事便产生了截然不同的意味。

Meta 过往对算力的理解并非如此。它购买芯片、建设数据中心、争夺电力与土地资源,目标是为自身模型服务,用于优化广告系统、提升推荐流效果,并支撑扎克伯格口中那个愈发接近的超级智能(superintelligence)。它并非云服务商,原本并不依赖租赁机器来盈利。

一家公司过去宣称,我需要尽可能多的机器,因为未来会将其全部消耗。现在它却说,若这些设备暂时有闲置,也可以转售给他人。

这虽不能直接证明算力过剩,但也绝不容轻易忽视。

股市暴跌当天,Palantir 首席执行官 Alex Karp 在 CNBC 的访谈节目中,对着镜头近乎宣泄地批评了将近二十分钟。

他原本计划讨论 Palantir 与英伟达的新合作,但话题很快转向 OpenAI 和 Anthropic 的 token 收费模式。他透露,许多 CEO 私下向他抱怨,当前企业的 AI 采用模式等同于「为毫无价值的 token 付费,同时还得交出自身数据」。他甚至将不断攀升的模型账单,形容为压在各大企业身上的一种财富税。

过去两年中,行业热议的话题是谁敢于大额支出、谁的投入速度最快、谁能率先将数据中心堆砌起来。如今,核心问题正逐渐转变:机器购入之后,谁能持续保持其满载运行。

Meta 的表态尚未转化为正式业务。公开报道显示,Meta 内部存在一个称为 Meta Compute 的方向,可能出售原始算力,或效仿亚马逊 Bedrock,将不同模型部署在自家基础设施上向开发者销售。扎克伯格此前在股东会上提及,外部公司几乎每周都来询问,能否购买他们的 API 服务,或一部分计算资源,且愿意支付高于 Meta 自身成本的溢价。

他当时也补充道:他们尚未采取行动,因为 Meta 自认为仍需要这些算力。

如果算力自用尚可,出租只是一个可选方案。若自用不足,出租则变成了资产负债表的权宜之计。

最难以判断之处也在于此。Meta 或许只是在建设节奏中腾出一个窗口期,将暂时闲置的资源外售。也可能是在向投资者传递信号:千亿美元级别的 AI 支出不能永远依赖遥不可及的超级智能来支撑,必须率先找到一条更近的收入线。

这两种解释都各有道理。

需求并未消失,只是开始筛选参与者

Capex(资本支出)是 AI 叙事的核心,没有之一。与 2021 年的宽松货币政策类似,只要 Capex 的增长预期持续,资金不断投入,市场中的各个分支领域才有可能同步上涨。一看到 Meta 准备出售算力,许多人的第一反应是:AI 的 Capex 要崩塌了。大型科技公司终于承认买入过多,半导体盛宴即将解散。

这样的判断过于草率。

公开数据尚不支持如此绝对的结论。AWS 一季度收入增长 28%,达到 376 亿美元,创下近年来少有的快速增长记录。Google Cloud 一季度增长更猛,收入达到 200 亿美元。微软 Azure 仍保持在 40% 左右的增速。

亚马逊仍在强调今年资本开支可能达 2000 亿美元,Alphabet 将 2026 年资本开支指引提升至 1800 亿至 1900 亿美元,Meta 自身也将全年资本开支指引上调至 1250 亿至 1450 亿美元。

这些数字并不指向一场需求崩溃。

更像是一场分流。

云厂商与模型厂商的处境截然不同。云厂商出售的是基础设施通道。只要路上有运力在运行,无论车辆由谁制造,它都能从中收费。OpenAI、Anthropic、企业客户、政府机构、初创公司,最终都要落脚于某个数据中心、某种芯片、某条网络及某个电力合同。

因此,三大云巨头能够继续维持强势态势。

AWS 甚至在 6 月底提高了某项 AI 云服务的价格,这项服务允许客户提前锁定 GPU。AWS 将该项服务 7 月后的价格再度上调约 20%。1 月时已上调过一次,幅度约为 15%。这并非需求疲软时会出现的市场动作。

稀缺状态下,卖方拥有提价权。

但模型公司未必都能如此轻松。

模型公司的资产更加挑剔。算力并非放置在那里便自动产生收入。它需要被更优秀的模型、更高频的用户、更昂贵的企业工作流持续填满。只有当模型足够优质,用户才会甘愿忍受排队、限额、涨价以及愈发复杂的订阅层级。

这也正是 Anthropic 被市场视为另类公司的原因。它并非因价格便宜,而是因为用户愿意将高价值任务交予它处理。编写代码、改造系统、运行长任务、对接企业工作流——这些任务一旦真正进入生产环境,所消耗的 token 将远超闲聊场景。

强模型的困境在于机器不够用。

弱模型的困境在于机器无人珍惜。

这两个问题都涉及算力,但性质截然不同。

xAI 那条线也带有同样的味道。Grok 并未像最强模型那样形成清晰的企业心智,但马斯克体系中的部分算力却可以流向 Anthropic。这一动作比任何口号都更显冷静。机器不会认创始人,它只认谁能将其满载运行。

Google 与 Meta 之间的关系也说明事情并不简单。6 月有消息称,Google 限制了 Meta 对 Gemini 的使用,原因是 Meta 想购买的算力超出了 Google 的供给能力,甚至影响了 Meta 内部部分 AI 项目的进展。一家公司一边考虑出售算力,另一边在某些任务上又买不到足够的头部模型能力。

这并非传统意义上的过剩。

而是错配,核心原因是账单开始变得刺眼。

云厂商可以继续提价,因为它们提供的是一份确定性。客户需要的是在一定时间内必定能获取的 GPU、一个稳定的数据中心、一套不会在半夜中断的基础设施。

但企业客户拿到算力后,问题并未结束。

它们还需要将这张账单交给 CFO。CFO 不会问你使用了多少 token,他会问这些 token 为企业节省了多少成本,多创造了多少利润,减少了多少错误。

在企业层面,token 变成了电表

这就回到了开头 Karp 的那场采访。

他将许多 AI 公司卖给企业的东西定义为过度销售。节目前一天,Palantir 还在 X 平台发布了一份九点声明,谈及所谓 AI 主权,其中专门点名了 tokenmaxxing 这种模式。这个词难以直译,但意思并不复杂:即将消耗 token 视作进步,将烧钱视作使用,将账单视作生产力。

Karp 将 OpenAI、Anthropic 这类前沿实验室推上了台面。他的意思并非企业不应使用最强模型,而是企业不应将自身的数据、流程和业务判断全部交出去,然后再按消耗量支付一张越来越大的账单。

Palantir 想出售的是另一种东西:不是一个通用聊天框,不是单一 API,而是将数据、审批、权限、运营规则和 AI 整合进同一套业务系统之中。客户花钱购买的并非「使用了多少次 AI」,而是某条生产线、某套风控流程、某个政府任务是否真正得到了改造。

企业中掌握财权的人已经开始觉醒。

UBS 近期与企业 IT 高管的沟通揭示了一个明确方向:许多企业并非停止使用 AI,而是在为 AI 支出安装刹车。约 60% 的受访企业在压缩 token 开支、增加使用护栏,尤其是那些已过试用期、开始将 AI 融入日常流程的企业。

这也是一个颇为有趣的反转。

AI 从玩具转变为工具后,花钱反而变得更加困难。在玩具阶段,老板愿意给预算,因为大家都怕错过机会。在工具阶段,CFO 会追问:它为谁节省了工时,为谁增加了销量,为谁降低了风险。

在这张表上,token 不像收入。

它更像电表。

你当然可以说,电表转得快说明工厂正在开工。也可以说,电表转得太快而产量没有提升,说明这台机器存在问题。

AI agent 将这一问题放大了。OpenAI 与几所大学合作的一项 Codex 研究提供了一组令人惊讶的数据:2026 年上半年,Codex 活跃用户增长超过五倍;OpenAI 内部某些岗位的输出 token 也大幅飙升,法律岗位的中位数月输出 token 比 2025 年 11 月高出 13 倍,研究岗位高出 50 多倍。

另一篇研究则给出了更硬的结论:agentic coding 任务所消耗的 token,可以是普通代码聊天和代码推理的 1000 倍。同一任务在不同运行之间的 token 消耗可能相差 30 倍。

这才是今天算力紧缺的深层原因。

并非大家多问了几句聊天机器人。

而是软件开始演变成一群会反复读取文件、运行命令、修改代码、经历失败、重新尝试、再次失败、再度尝试的小型工人。它们没有午餐时间,但每一步都在消耗 token。

当 token 变成电表,谁拥有发电厂,谁就拥有权力。但谁浪费了电,谁也将率先受到审视。

账单一变厚,便宜模型便有了立足之地

CFO 一旦开始关注这张电表,下一步几乎无需人指导。

他会问:哪些任务必须使用最强模型,哪些任务只需够用的模型即可。

此时,GLM、Kimi、DeepSeek、Qwen 等开源模型不再只是技术新闻。它们变成了企业采购会议上的砍价工具。

就连硅谷顶级风投 a16z 的马克·安德森都表示,许多 AI 从业者已将智谱 GLM-5.2 视为首批在多数任务中能够匹配甚至超越美国头部公开模型的中国模型。这一判断未必是最终结论,但它让企业多了一个选择依据。

Coinbase 则提供了更为具体的例子。Brian Armstrong 表示,公司将默认 AI 模型切换至 GLM 5.2、Kimi 2.7 等开源模型,再结合模型路由、缓存及上下文精简,尽管 token 使用量仍在指数级增长,AI 支出却削减了接近一半。

这句话的杀伤力在于,企业首次可以将模型能力拆分采购。

最困难的任务继续交给最贵的模型。普通摘要、客服、信息抽取、模板化代码、内部知识库问答,则交由便宜模型和本地部署处理。

开源模型未必需要赢下全部战场。

它只需让采购部门相信:并非每一度电都需要按豪宅电价来支付。

至此,Meta 出售算力便不再是一条孤立的新闻。

它与 Palantir 批评 token 模式、Coinbase 切换开源模型讲述的是同一件事:AI 的支出链条正开始被拆解。上游出售确定性,中游出售结果,下游则压低单价。每一层都仍在增长,但每一层都开始被追问:钱到底花得值不值。

最难的并非购买机器,而是让机器持续有活干

过去两年,AI 行业最容易讲的故事,是资源不足。

GPU 不够,电力不够,数据中心不够,工程师不够,能将模型跑起来的云也不够。这个故事太过顺畅。只要资源短缺,所有人都会本能地向前冲刺:先占位,先签电力合同,先买芯片,先将机器架设起来。

在抢资源的过程中,人们不太会细算账。

因为慢一步的代价看起来更大。

但 Meta 的这条消息将另一个问题推到了前台:机器买回来后,并不会因其昂贵而自动变成好生意。它需要每天有活干,有客户愿意付费,有模型将其满载运行,有应用将成本转化为收入。

这就是利用率。

利用率这个词听起来很冷,其实很残酷。它问的不是你是否有未来,而是你今天这台机器有没有开工。它不关心你在发布会上的言辞,也不关心你购买的是否是最贵的 GPU。它只关注一件事:这笔支出有没有变成持续的现金流。

云厂商回答这个问题相对容易。它们本就是销售基础设施的。AWS、Google Cloud、Azure 出售的是通道、电力和机房。客户要训练模型、运行推理、托管应用,最终都要落在某片云上。

因此它们还能保持强势。

强模型公司也有自己的答案。如果模型足够强,用户愿意排队,企业愿意接入,开发者愿意围着它优化工作流,那么算力就不是库存,而是瓶颈。机器越多,它越能跑得开。

最难的则是中间那一层。

它们有机器,有故事,有模型团队,也有庞大的预算。但模型未能跑到最前列,产品未能变成日常习惯,开发者也不愿为它改变工作流。对这类公司而言,算力从武器变为库存,只需要一次模型发布失败,或一次用户迁移。

库存未必无用。

但库存必须降价,必须出租,必须寻找新用途。

这正是 Meta 出售算力显得刺眼之处。它不证明 Meta 失败,也不证明 AI 需求消失。它只是让市场第一次看见:AI 基础设施也会遭遇普通工厂所面临的问题。

工厂建好了,订单在哪里。

算力并未消失,只是开始分层

因此,对这件事的最佳理解并非「算力过剩」。

这个词太过笼统。

更准确的说法是:算力开始分层。

最上面那一层,仍然紧缺。最强模型、最好的云、最稳定的 GPU 集群,依然被争抢。AWS 的服务能提价,正是因为确定性本身具有价值。客户购买的不仅是 GPU,更是某一天、某一小时、某一批机器必定能用。

中间那一层,开始陷入尴尬。它或许不算差,但不够稀缺。它能跑模型,能做推理,也能卖给外部客户。只是客户会进行比较和砍价,会询问为何不使用更便宜的模型,为何不换用别人的云,为何这批机器一定值这个价格。

最下面那一层,则会被开源模型和成本优化逐步挤压。企业不会为普通任务始终调用最贵模型。它们会做路由、做缓存、压缩上下文,将模型拆分为不同档位。

需求已变得成熟。

小孩子花钱不看账单,成年人会看。AI 进入企业后,也会经历类似过程:试点阶段,大家害怕错过;规模化阶段,大家开始精打细算。

精打细算之后,产业链便不会再像早期那样整齐划一。

有人继续提价,因为他出售的是不可替代的确定性。有人转而销售结果,因为客户不愿为消耗本身付费。有人被迫降价,因为够用的替代品已经出现。有人将机器对外出租,因为机器闲置比低价出租更难看。

这几件事同时发生,就会让行业看起来充满矛盾。

一边是算力紧缺。

一边是算力出租。

一边是 token 消耗暴涨。

一边是企业压低 AI 支出。

一边是头部模型越来越强。

一边是开源模型越来越便宜。

它们并不冲突。它们只是说明,AI 已从一个总量故事,进入了一个结构故事。

旧铁路的故事还会再讲一遍

十九世纪的铁路泡沫中,铁路本身并非虚假。

铁轨铺设之后,货物确实开始流通,城市确实得以成长,时间确实被大幅缩短。许多后来最有价值的商业网络,确实生长在那些铁轨旁边。

但这并不妨碍当年众多铁路建设者亏损。

他们输的不是方向。他们输在建设过早、建设过量、建设到了没有客货流的地方,或者借了太贵的钱去修一条回本周期过长的路。

互联网泡沫中的光纤也是同理。光纤没有错。后来整个世界都因它而得以支撑。错的是那一批账本:它们将未来几十年的需求一次性塞进了几年的资本开支里。

AI 数据中心可能也会留下许多有用的资产。GPU 会折旧,电力合同会续签,数据中心会更换设备,软件会越来越善于消耗算力。如今看似夸张的 token 消耗,几年后或许会像高清视频流量一样稀松平常。

但资产有其自身的脾气。

它不关心你信不信未来。它只关心每天有没有人来使用它。

Meta 出售算力的信号,就卡在这个节点上。

它不是 AI 的终点,也不是半导体的终点。它更像资本开支叙事走到中段时,第一次有人打开门,让外界看见仓库里究竟有多少机器。

有些机器会被头部模型消耗。

有些机器会被云客户租走。

有些机器会在价格战中变得便宜。

还有些机器,会静静地等待一个尚未出现的应用。

过去两年,市场愿意相信所有机器最终都会等到自己的命运。如今,它开始追问:谁先等到,谁等不到,谁等到了也赚不到足够的钱。

这个问题一旦提出,AI 的故事就发生了改变。

它不再只属于那些买机器最快的人。

它属于那些能让机器持续运转下去的人。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:AI资本开支新变局 Meta卖算力 Palantir不满智谱顶流要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.odaily.news/zh-CN/post/5211690
ai

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-03 18:16
人工智能未来三年将深刻改变人类活动方式

那些碘伏性的科技创新,从来不只是技术层面的突破——它们催生新的创业风口,重塑城市格局,改写财富分配逻辑,本质上是一场深刻的社会变革。未来三年,人工智能将如何改变我们的生活?它会深度嵌入人类活动方式,推动AI与全球价值链加速整合,引发新一轮产业变革,最终成为城市发展和经济高质量发展的核心引擎。 在科技

AI热点2026-07-03 18:16
汽车行业智能助手开发:模型微调与RAG优缺点对比

近年来,在众多汽车行业技术交流与AI应用研讨会上,一个经典但又始终缺乏标准答案的议题再次被热议:在开发智能助手时,究竟应该选择模型微调路线,还是依靠RAG技术来撑起实际应用?今天,我们以汽车销售这一具体业务场景为切入点,把这个话题掰开揉碎,深入聊一聊。首先给出一个核心判断:没有绝对的优劣之分,只有场

AI热点2026-07-03 18:16
人工智能崛起未来哪些职业最安全且稳定

人工智能时代,医疗、教练、艺术创作、发型设计、社工等需要情感互动、领导激励或精细手艺的职业相对安全。机器人难以复制人类的情感理解、直觉和复杂人际能力,因此无法完全替代这些工作。

AI热点2026-07-03 18:16
人工智能灵活性提升与新技术发展方向

人工智能(AI)如今已成为各行各业关注的焦点,制造业也不例外。媒体上频繁报道的新功能与新趋势,无疑在加速生产数字化进程中发挥了重要作用。然而,坦率地说,当前AI在众多应用场景中仍处于理论探索阶段,距离大规模普及尚有相当距离。不少第三方服务商打着“基于AI技术”的旗号,将自家产品包装得玄妙且昂贵,反而

延伸阅读