当前位置: 首页
AI
火山引擎日均调用量破百万亿,AI云赛道竞争加剧

火山引擎日均调用量破百万亿,AI云赛道竞争加剧

热心网友 时间:2026-03-26
转载

Token 与 Agen 爆发带来的新机会。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

《晚点 LatePost》独家获悉,自今年春节以来,字节跳动云计算业务火山引擎的日均云端大模型调用量已超过 100 万亿 Tokens,不到两个月上涨了超 60%。来自个人用户的 Token 消耗近期也明显增长。

据了解,全球目前只有三家公司的 Token 消耗量超过 100 万亿,分别是 OpenAI、Google 与字节跳动。不过字节跳动的 Token 消耗主要来自中国市场,海外市场则在快速增长阶段。

一位火山引擎人士告诉我们,火山目前的增长还是在一定约束条件下实现的——字节跳动旗下的视频生成模型 Seedance 2.0 API 尚未在海外正式上线。

Token 是 AI 理解和生成文本的最小语义处理单元,使用者每一次与大模型的交互,最终都要被拆解成 Token 来完成运算。因此 Token 调用量成为了衡量 AI 模型活跃度、AI 企业算力承载力的关键指标。

过去一年里,Claude Code 等编程智能体产品的走红让许多科技公司进一步意识到了 Token 的重要性——一次智能体任务往往包含多轮推理、工具调用和任务执行,Token 消耗通常显著高于普通 AI 对话。OpenClaw 则将 Agent 推向了更广泛的大众用户,进一步放大了 Token 的价值。

当地时间 3 月 16 日,英伟达创始人兼 CEO 黄仁勋在英伟达 GPU 技术大会上称,Token 将是未来数字世界最核心、最值钱的大宗商品;Token 的相关指标将成为全球企业 CEO 追踪的核心经营数据,它的表现会直接反映在企业后续的收入中。

提供 MaaS业务的云厂商是这一轮 Token 大爆发最大的受益者之一。它们通过出售模型调用服务、推理能力和配套工具获利;市场对 Token 需求的激增会直接推高它们的模型调用量,并带动收入增长。

2025 年起,围绕 Token 的 AI 云战争已经打响。亚马逊 AWS 管理层在 10 月的财报电话会议披露,长远来看,MaaS 的收入贡献将与 EC2不相上下。

阿里云则在 11 月末启动了 “百炼战役”,目标是短期内将百炼Token 调用规模提升三倍以上。今年 3 月 16 日,阿里巴巴成立了 Alibaba Token Hub 事业群,由集团 CEO 吴泳铭直接带队。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在接受我们的访谈时曾提到,过去取得了什么成绩并不重要,下一年增量的 10% 都会大于上一年的全量。2026 年,阿里云的目标是拿下中国 AI 云市场增量的 80%。

《晚点 LatePost》独家了解到,火山引擎此前曾定下了 2026 年 MaaS 业务收入超百亿元的目标,随着 Seed 2.0、Seedance 2.0 等模型发布、OpenClaw 持续爆火,团队已提升了收入目标。就在上一年,火山引擎也曾因这块业务增长迅猛,两度上调收入目标。

从边缘走向竞争中心的 MaaS 业务

2024 年底,随着新一轮生成式 AI 浪潮卷起,云厂商迎来了一个新的机会:将大模型封装成可调用、可计费的云服务,卖给企业与开发者,并借此打开新的收入来源。

在早期,国内的几家头部云厂商中,只有火山引擎对于推进 MaaS 业务最为积极,也始终将 MaaS 放在了很高的战略位置。2024 年,火山引擎甚至调整了销售团队的业绩考核指标,把销售 MaaS 产品排在第一位。销售卖同等价格的 MaaS 产品得到的回报,要比卖传统云服务更高。

相比阿里、华为与腾讯,字节在云计算上起步最晚,很难在传统的云服务上突围,新兴的 MaaS 业务因而成了它最有可能实现弯道超车的机会——先切入模型服务市场,进而拉动 IaaS、PaaS 以及上层应用服务的增长。

这在海外已有先例。比如对微软的云服务 Azure 来说,出售 OpenAI 模型的 API 只是第一步。客户一旦开始把大模型真正接进业务,往往就不只购买模型能力本身,还会继续采购检索、数据库、数据平台等配套云服务,这将直接提升他们在 Azure 上的整体支出。

推广 MaaS 业务也有助于字节的大模型能力迭代。一位火山引擎人士告诉我们,模型只有通过 MaaS 进入真实的 B 端场景,团队才能持续获得真实反馈,比如模型是否被用起来了、被用在什么场景、哪些地方做得好、哪些地方还不够好,并据此优化模型效果。

上述火山引擎人士透露,火山引擎很早就通过与客户开展协作计划意识到,B 端的企业客户会更多用 AI 来做长线程任务,有大量 Agentic Coding的需求,这在一定程度上反向推动了字节模型能力的演进。

许多传统的云厂商虽然也很早发布了自己的 MaaS 业务,但推进的节奏并不算快。部分原因在于,它们原有的收入和组织能力,仍主要建立在 CPU 时代的传统云计算生意上,包括 IaaS、数据库、存储、网络、安全以及各类企业软件服务。大模型带来的这套新需求,无论是底层算力结构,还是上层产品形态,都和过去很不一样。转型需要时间。

此外在国内大模型能力相对有限的阶段,全行业的 Token 消耗规模还不大且价格较低——百万 Tokens 在一元钱左右,这就导致 MaaS 业务的营收规模很小,不被市场所看好。

根据国际数据公司公布的数据,2024 年中国整体公有云服务市场规模则超过了 3000 亿元,MaaS 市场规模仅为 7.1 亿元。

直到 2025 年初,MaaS 在中国终于迎来第一次显著提速。DeepSeek 的出现让大模型走出技术圈,进入更广泛的应用场景,越来越多企业和开发者开始通过云端调用模型。

另一个驱动力是多模态模型的成熟,生图、生视频的需求在快速增长。一位火山引擎人士回忆,字节的视频生成模型 Seedance 1.0 刚上线的时候,内部感觉它可能还不能很好地被使用在一些特别专业的创作上。但后来的实际情况是,有相当多的用户会用它来创作整部漫剧,这极大带动了火山引擎 Token 消耗量的增长。

国家数据局 2025 年 8 月数据显示,2024 年初中国日均 Token 消耗量为 1000 亿。截至 2025 年 6 月底,中国日均 Token 消耗量突破 30 万亿,一年半时间增长了 300 多倍。

MaaS 也开始从云服务行业的边缘走向中心。

《财经》曾报道,2025 年 12 月末,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中称,MaaS 收入在云厂商整体收入的占比,有可能达到 30% 甚至更高。

我们了解到,火山引擎在大模型领域的增长也在带动其传统云计算服务。目前火山引擎一定比例的 CPU 算力、数据库等需求来自大模型客户。

Agent 的爆发带动 AI 云市场扩容

2025 年 5 月,Anthropic 推出的 Claude Code 在开发者群体与企业间流行了起来。它提供了一种全新的服务——让 AI 真正进入工作流,成为能读代码、调工具、跑任务的 Agent,从根本上改变了构建软件的方式。

Claude Code 等产品还带动了 Coding Plan 这类面向开发者的付费模式开始快速成型。它把原本按次、按量调用的 AI 编程能力,变成了可以高频使用的服务,进一步加快了 Agent 在开发者中的普及,并持续推高了 Token 消耗。

半导体与算力研究机构 SemiAnalysis 估算,目前 GitHub 上约 4% 的公开代码提交由 Claude Code 完成;按这一趋势,到 2026 年底,Claude Code 占 GitHub 每日公开提交总量的比例可能超过 20%。

年底,OpenClaw 的出现又将 Agent 带入到了更广泛的大众群体中,Agent 也开始从 Coding 走向更广泛场景,包括搜索资料、处理邮件、撰写文档、安排日常事务。

2026 年初,Agent 风潮来到中国,硅谷此前经历过的一切又在这里重演了一遍。

最先受益的是几家 AI 创业公司。2 月,智谱将面向开发者的 GLM Coding Plan 价格上调至少 30%,直接原因便是开发者对 AI 编程工具的需求上升;长期聚焦 C 端产品的 MiniMax 也在其招股书和第一次财报中重点介绍了自己的 Coding Plan 模式。3 月 23 日,MiniMax 宣布将自己的 Coding Plan 升级为 Token Plan,成为了全球首个支持全模态模型的统一订阅计划。

国内的一众类 OpenClaw 涌现后,Agent 进入大众视野。一位火山引擎人士告诉我们,过去一个多月,来自个人用户的 Token 消耗增长了约 16 倍。

Agent 的普及、Token 的暴涨也在带动 MaaS 和 AI 云市场扩容。

对企业来说,通过公有云调用是当前使用大模型最实用、也最有效的方式。企业真正需要的不是自己维护机器,而是按 Token 灵活调用模型能力;同时,大模型迭代极快、不同模型的最佳部署方式又各不相同,只有 MaaS 这类持续升级的平台,才能更快接入新模型,并把背后的部署、适配和运维复杂度一并接住。

继亚马逊 AWS、谷歌云年初释放涨价信号后,腾讯云、阿里云、百度智能云密集跟进,主流云计算服务商基本上全都加入涨价行列。

不过 Agent 时代对云厂商带来的挑战也不小。过去的云平台基本都是为 Web、App 场景服务的,现在则要转向围绕着 Agent 设计。

火山引擎智能算法负责人吴迪曾在火山引擎 FORCE 原动力大会上提到,下一代 Agent 应用绝不能只停留在探索层面,最终要真正走进企业的生产和业务需求里。这就要求 Agent 需要具备三大核心能力,长期记忆的能力,随业务数据变化的自我进化能力,以及准确执行多步骤复杂任务的能力。

对任何一家云厂商而言,这注定是一场艰难的攻坚战。“这个事还太早期了。” 火山引擎总裁谭待此前曾跟我们提到。他也会告诉团队 “马拉松才跑 500 米,别取得一点点小成绩就满意了。”

来源:https://tech.ifeng.com/c/8rmDk69RYSA

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Nature重磅:AI生成论文在顶会通过率55%,单篇成本仅15美元

Nature重磅:AI生成论文在顶会通过率55%,单篇成本仅15美元

新智元报道编辑:元宇【新智元导读】刚刚,Nature盖章AI独立科研时代!全新Scaling Law显现,人类死守的学术铁王座,正发生不可逆的转移。一篇长达数十页的学术论文,在人类设定研究主题和实验

时间:2026-03-28 15:07
CMU首创无毒AutoGEO方案,破解GEO投毒产业链焦虑

CMU首创无毒AutoGEO方案,破解GEO投毒产业链焦虑

新智元报道编辑:LRST【新智元导读】ChatGPT上线广告、315曝光GEO投毒产业链,AI搜索商业化的隐忧接连浮出水面。龙虾热背后,3000元就能让AI搜索信口开河,离全面「瞎说」还有多远?来自

时间:2026-03-28 15:01
华为王云鹤离任诺亚方舟实验室,引发业界关注

华为王云鹤离任诺亚方舟实验室,引发业界关注

机器之心编辑部今天,华为诺亚方舟实验室主任王云鹤在朋友圈官宣离职。2026 年以来,国内 AI 圈的一系列高层人事变动,正在宣告整个行业正在经历一次深刻的结构性转折。王云鹤:一位华为老兵王云鹤,生于

时间:2026-03-28 14:55
华为盘古大模型负责人王云鹤离职投身Agent创业

华为盘古大模型负责人王云鹤离职投身Agent创业

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI刚刚,华为盘古大模型负责人王云鹤,宣布离职。王云鹤在北大攻读博士期间,就进入了华为诺亚方舟实验室实习,2018年博士毕业后,正式入职。8年间,王云鹤

时间:2026-03-28 14:49
小牛电动车发布灵犀AIOS:双轮迈入智能新时代,骑行体验再升级

小牛电动车发布灵犀AIOS:双轮迈入智能新时代,骑行体验再升级

在传统认知中,两轮电动车常被视为简单的代步工具,以亲民的价格和便捷的使用方式占据市场。而人工智能(AI)技术则多与智能手机、智能汽车等高端科技产品关联,给人一种高门槛的印象。然而,近日一场新品发布会

时间:2026-03-28 13:25
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程