阿里云MaaS收入激增15倍，揭秘Token业务规模化增长策略

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

阿里云MaaS收入激增15倍，揭秘Token业务规模化增长策略

热心网友时间：2026-05-22

转载

在AI的竞技场上，Token的争夺战早已超越了单纯的数量比拼，进入了追求“含金量”的新阶段。

一个最新的数据印证了这一点：阿里云MaaS业务的Token收入，在2026年前五个月里增长了惊人的15倍，月度收入已达数亿元级别。这背后最直接的驱动力，指向了一个关键词——Agent。

就在5月20日，阿里云紧锣密鼓地发布了新一代旗舰模型Qwen 3.7 Max等一系列产品。要知道，距离其前代Qwen 3.6 Max的亮相，仅仅过去了一个月。为何如此急切？

原因很直接。自今年2月OpenClaw引爆市场以来，各大模型厂商都开始全力押注Agent，尤其是提升模型的代码生成能力。这场围绕Coding的军备竞赛日趋白热化，阿里必须拿出一款在代码能力上足够能打的模型，以捍卫其MaaS业务的竞争力。用阿里云公共云总裁刘伟光的话说，“未来是Agent Cloud的时代。”

无独有偶，同一天在大洋彼岸的硅谷，Google I/O大会的主题也聚焦于Agent Cloud。从新发布的芯片、模型到应用，几乎所有的产品线都围绕着Agent展开。

一个全球性的AI共识已然清晰：Agent Coding，是当前战局的核心。

狠狠做Agent

阿里云这次发布会的第一个“前菜”，是一个名为“千问云”的独立官网。这可不是一个普通的网站，它是阿里云成立17年来，首次为单一业务线设立的独立官网。其特别之处在于，它的设计初衷并非服务于人类，而是为Agent量身打造。

这个决策源于阿里云内部在2024年底的一个关键判断：未来云计算产品的主要使用者，将逐渐从人类工程师转变为Agent。

回想一下传统的云服务使用流程：开发者需要注册、登录，面对成百上千的产品分类，自己挑选机型、配置网络、开通实例、安装环境、调试API……每一步都需要人类的专业判断，门槛不低。

而“千问云”试图碘伏这一流程。其背后的逻辑是，未来的动线将彻底反转：Agent会首先寻找合适的模型，然后匹配所需的工具和技能，最后才去调度底层的云资源。顺序完全调了个个儿。

一个现实的例子已经发生。在内部代号“龙虾”的项目上线后，阿里云发现，Agent可以在一天内自动完成云计算资源的开通。同样的工作，过去需要人类工程师花费两周时间。刘伟光对此的描述很形象：“未来不需要人来开通了，Agent自动就在后台把云计算资源激活了。”

官网只是序幕。实际上，阿里云从上层的模型、中间的Infra到底层的芯片，完成了一次围绕Agent的全面重构。

首当其冲的，便是新一代旗舰模型Qwen 3.7 Max的闪电发布。距离上一代发布仅一个月就推出重大升级，其紧迫性可见一斑。

尽管阿里在开源领域积累了深厚的影响力，但相较于国内智谱GLM、Kimi等对手，其旗舰模型并未完全享受到上一轮Agent热潮的最大红利。

因此，Qwen 3.7 Max的推出，被视为阿里在代码能力战场上一次关键的“扳回一城”。

根据目前业界最权威的代码能力基准测试，Qwen 3.7 Max已经追平了DeepSeek的最强版本。而在难度更高的复杂工程任务测试中，它更是拿下了第一的位置。

△Qwen3.7-Max可独立执行长达35小时的长程复杂任务，工具调用数量也在各大模型中位于前列，图源：阿里云

与Qwen 3.6 Max Preview相比，Qwen 3.7 Max最核心的升级在于长周期任务能力的飞跃。这意味着Agent能够自主执行跨越数十小时、涉及上千个步骤的复杂任务，全程无需人类干预。

长程任务能力越强，Agent能独立处理的业务复杂度就越高，人类需要插手的地方就越少。这也正是Claude Code、Gemini Deep Research等顶级Agent产品的核心竞争力所在。

阿里云CTO周靖人举了一个生动的例子：在平头哥的新芯片平台上，Qwen3.7-Max通过自主编程和超过1000次的工具调用，实现了平台关键内核的自我进化，最终将推理速度提升了10倍。

这标志着，模型已经能够像一位经验丰富的工程师那样，独立排查代码中的深层缺陷，或协助开发复杂功能。当然，这一切的实现，也离不开底层芯片和基础设施的适配。

在芯片层面，阿里云新一代训推一体AI芯片“真武M890”以及自研互联芯片ICN Switch 1.0，都被集成到超节点服务器中，专门针对Agent所需的大规模并发场景进行了优化。

目前，阿里平头哥的PPU芯片出货量已超过54万片，并已在“悟空”、“秒悟”等AI应用中提供推理服务。

怎么把Token生意越做越大

Agent的爆发，直接带来了Token消耗量的指数级增长。毕竟，Agent的本质是代码生成，完成一次任务所调用的Token量，往往是普通对话场景的十倍甚至百倍。

于是，围绕Agent的共识，迅速演变为模型市场一场“明牌”战争：谁的模型在Agent场景下被调用得越多，谁就能更快地收割收入。目前的全球最大赢家无疑是Anthropic，据《华尔街日报》报道，其营收预计将在第二季度增长一倍以上，达到109亿美元。

△图源：华尔街日报

阿里云同样是这波红利的受益者。2025年，阿里云全年营收超过1466亿元，其中28.6%的增速主要得益于AI产品的贡献。阿里巴巴CEO吴泳铭在上周的财报电话会上进一步透露，包含百炼MaaS平台在内的AI模型与应用服务，其年化经常性收入（ARR）将在6月份季度突破100亿元，并计划在年底达到300亿元。

不过，在这场Token战争中，阿里和字节跳动选择了两种截然不同的路径。

“Token收入主要来自两大块：一块是以Coding为代表的大语言模型，另一块是视频模型。但过去一段时间，很多人把这两个市场的增长混为一谈了，这其实不太准确。”刘伟光特别强调。

字节跳动牢牢占据了视频模型市场。有研究机构测算，自Seedance 2.0爆火后，字节在视频模型市场的日均Token消耗量已占据整个市场的80%。火山引擎曾在2025年底立下“2026年MaaS服务收入超100亿”的目标，而在Seedance 2.0之后，这个目标已经被再次上调。

相比之下，阿里云则将优势押注在大语言模型，尤其是Coding领域。“有开发者的公司，才需要云。所以阿里云现有的存量客户，几乎天然就是Coding的潜在用户。”刘伟光解释道。

2025年底，阿里云曾喊出“拿下2026年AI云市场增量80%”的目标。如今，其业务火力高度集中于Coding领域。“今年前5个月，我们可以说，阿里云已经拿到了LLM模型市场增量的80%。”

为了配合这一战略，阿里云甚至调整了销售团队的考核方式——核心不再是比拼谁卖出的Token数量最多，而是看谁卖出的Token“最值钱”。

道理很简单。单纯聊天产生的Token消耗，其单价早已跌至地板价，并非理想的收入来源。

因此，阿里云如今关注一个更关键的指标：模型接入客户核心业务系统的数量。他们希望销售的Token，是被客户用来写代码、做业务决策、跑核心流程的。一旦模型深度嵌入企业的生产流程，Token的消耗量将呈指数级上升，单价更高，客户粘性更强，对应的收入质量也截然不同。

这源于Coding与视频在Token消耗逻辑上的根本差异。视频模型的消耗是一次性的——生成一段视频，任务结束，消耗停止。

而代码场景则是一个自我强化的飞轮：模型写出代码，代码部署成应用，应用在云上运行，运行过程中又需要持续调用模型来优化或生成新代码……循环往复，生生不息。

时至今日，大模型的竞争早已演变为一场系统工程的综合较量。芯片、基础设施与大模型之间的深度耦合，决定了训练和推理的效率；而商业场景的快速落地与验证，则为模型的持续进化反哺智能。

“芯片、模型和云，现在就像三个必须严丝合缝咬合在一起、共同螺旋上升的齿轮。”刘伟光表示。未来的胜负手或许在于，“如果比拼的是每一块芯片都能比竞争对手跑出更多、更高质量的Token，那胜利就属于我们。”

在后续的分享中，刘伟光进一步阐述了阿里云对Agent趋势和Token之战的理解：

1. 云计算的天花板被Agent再度撬开

传统云计算商业模式相对简单，但有个长期痛点：企业IT预算中，用于内部软件开发和人力外包的那部分，云厂商很难触及。现在情况反过来了，这部分预算恰恰是AI Coding能够100%覆盖的。

数据显示，互联网企业的Token支出已占其IT总支出的15%~20%，而传统企业还在5%以下，增长空间巨大。阿里云今年的目标是，在每个客户的收入中，Token收入的占比不低于20%。

以汽车行业为例，过去云厂商能做的主要是ERP上云，后来是智能驾驶算力，再后来是大模型对话。现在，连广告营销都能用AI来做了。汽车行业最大的IT投入领域，正从传统的ERP转向AI。

金融领域也是如此。以前做券商客户，很难切入对方的业务系统，那是专业壁垒很高的领域。现在则是客户主动找上门，因为头部机构的投研、量化、私募等核心业务场景，都必须与大模型深度结合。

可以说，Agent已经成为带动模型市场、乃至盘活存量云市场的最大引擎。因此，Token业务和云业务在阿里云内部是天然绑定的。这也是为什么Coding被定为最重要的方向——它几乎适用于一切（for everything）。

2. Agent天然是云业务的增长飞轮

Token消耗和GPU使用量之间存在换算关系。实际数据揭示了一个有趣的现象：Agent爆发后，每产生100元的GPU推理消耗，往往会同时带动约200元的GPU+CPU云资源消耗。因为Agent生成的应用需要部署、运行、弹性扩容，这些都会消耗额外的云资源。

这意味着，如果一家厂商没有强大的CPU云资源池，就根本无法有效服务这些Agent客户。这也是“Agent Cloud”概念的核心所在——它形成了一个真实的、可闭环的商业增长飞轮。

3. 销售体系需要快速变革

为了抓住机会，阿里云正在为大型客户单独配置纯MaaS销售，让他们与传统的IaaS销售协同作战。即便在一个客户身上出现两三个销售重叠，这个代价也可以接受，核心是绝不能错失市场窗口。

坦白说，在云产业经营太久，每个人都会有思维惯性。过去卖云，市场版图很清晰——客户线下有多少台服务器，迁移上云大概需要多少预算，答案八九不离十。但做MaaS完全不同，进去之后可能发现市场潜力远超想象。而且，MaaS销售需要直接与客户的业务部门甚至CEO对话，而不是传统的IT部门，这本身就是巨大的挑战。

一个有意思的现象是，越传统的企业，有时反而越容易拥抱AI，因为AI实实在在地简化了他们的一些复杂工作。现在，连畜牧行业的企业都在大规模引入AI，这在过去是不可想象的。

4. Token之战：质量重于数量

调用量可以通过简单的对话堆砌出来，但这没有意义。阿里云关注三个更本质的指标：付费Token客户数是否持续增长；客户是否将模型接入核心系统解决刚需；Agent自主完成任务闭环的效率。美国的行业共识也是如此——目标是用最少的Token完成最有效的任务，而不是用更多的Token完成更多的任务。

正因为追求高质量、高价值的Token，MaaS业务从第一天起就应该是一门有利润的生意。目前，阿里云的百炼平台（基础设施）和模型团队紧密协作，每天都在对推理框架进行极致优化。

尽管中国市场目前仍以按量计费为主，但行业的终极目标，无疑是让客户为最终的业务结果和价值付费。

来源:https://www.aitntnews.com/newDetail.html?newId=25364

上一篇：毕业论文AI检测标准科学吗？如何有效降低查重率

下一篇：汇纳科技股价上涨1.10% 主力资金净流入54万元