阿里云MaaS收入激增15倍,揭秘Token业务规模化增长策略

在AI的竞技场上,Token的争夺战早已超越了单纯的数量比拼,进入了追求“含金量”的新阶段。
一个最新的数据印证了这一点:阿里云MaaS业务的Token收入,在2026年前五个月里增长了惊人的15倍,月度收入已达数亿元级别。这背后最直接的驱动力,指向了一个关键词——Agent。
就在5月20日,阿里云紧锣密鼓地发布了新一代旗舰模型Qwen 3.7 Max等一系列产品。要知道,距离其前代Qwen 3.6 Max的亮相,仅仅过去了一个月。为何如此急切?
原因很直接。自今年2月OpenClaw引爆市场以来,各大模型厂商都开始全力押注Agent,尤其是提升模型的代码生成能力。这场围绕Coding的军备竞赛日趋白热化,阿里必须拿出一款在代码能力上足够能打的模型,以捍卫其MaaS业务的竞争力。用阿里云公共云总裁刘伟光的话说,“未来是Agent Cloud的时代。”
无独有偶,同一天在大洋彼岸的硅谷,Google I/O大会的主题也聚焦于Agent Cloud。从新发布的芯片、模型到应用,几乎所有的产品线都围绕着Agent展开。
一个全球性的AI共识已然清晰:Agent Coding,是当前战局的核心。

狠狠做Agent
阿里云这次发布会的第一个“前菜”,是一个名为“千问云”的独立官网。这可不是一个普通的网站,它是阿里云成立17年来,首次为单一业务线设立的独立官网。其特别之处在于,它的设计初衷并非服务于人类,而是为Agent量身打造。

这个决策源于阿里云内部在2024年底的一个关键判断:未来云计算产品的主要使用者,将逐渐从人类工程师转变为Agent。
回想一下传统的云服务使用流程:开发者需要注册、登录,面对成百上千的产品分类,自己挑选机型、配置网络、开通实例、安装环境、调试API……每一步都需要人类的专业判断,门槛不低。
而“千问云”试图碘伏这一流程。其背后的逻辑是,未来的动线将彻底反转:Agent会首先寻找合适的模型,然后匹配所需的工具和技能,最后才去调度底层的云资源。顺序完全调了个个儿。
一个现实的例子已经发生。在内部代号“龙虾”的项目上线后,阿里云发现,Agent可以在一天内自动完成云计算资源的开通。同样的工作,过去需要人类工程师花费两周时间。刘伟光对此的描述很形象:“未来不需要人来开通了,Agent自动就在后台把云计算资源激活了。”
官网只是序幕。实际上,阿里云从上层的模型、中间的Infra到底层的芯片,完成了一次围绕Agent的全面重构。
首当其冲的,便是新一代旗舰模型Qwen 3.7 Max的闪电发布。距离上一代发布仅一个月就推出重大升级,其紧迫性可见一斑。
尽管阿里在开源领域积累了深厚的影响力,但相较于国内智谱GLM、Kimi等对手,其旗舰模型并未完全享受到上一轮Agent热潮的最大红利。
因此,Qwen 3.7 Max的推出,被视为阿里在代码能力战场上一次关键的“扳回一城”。
根据目前业界最权威的代码能力基准测试,Qwen 3.7 Max已经追平了DeepSeek的最强版本。而在难度更高的复杂工程任务测试中,它更是拿下了第一的位置。

△Qwen3.7-Max可独立执行长达35小时的长程复杂任务,工具调用数量也在各大模型中位于前列,图源:阿里云
与Qwen 3.6 Max Preview相比,Qwen 3.7 Max最核心的升级在于长周期任务能力的飞跃。这意味着Agent能够自主执行跨越数十小时、涉及上千个步骤的复杂任务,全程无需人类干预。
长程任务能力越强,Agent能独立处理的业务复杂度就越高,人类需要插手的地方就越少。这也正是Claude Code、Gemini Deep Research等顶级Agent产品的核心竞争力所在。
阿里云CTO周靖人举了一个生动的例子:在平头哥的新芯片平台上,Qwen3.7-Max通过自主编程和超过1000次的工具调用,实现了平台关键内核的自我进化,最终将推理速度提升了10倍。
这标志着,模型已经能够像一位经验丰富的工程师那样,独立排查代码中的深层缺陷,或协助开发复杂功能。当然,这一切的实现,也离不开底层芯片和基础设施的适配。
在芯片层面,阿里云新一代训推一体AI芯片“真武M890”以及自研互联芯片ICN Switch 1.0,都被集成到超节点服务器中,专门针对Agent所需的大规模并发场景进行了优化。
目前,阿里平头哥的PPU芯片出货量已超过54万片,并已在“悟空”、“秒悟”等AI应用中提供推理服务。
怎么把Token生意越做越大
Agent的爆发,直接带来了Token消耗量的指数级增长。毕竟,Agent的本质是代码生成,完成一次任务所调用的Token量,往往是普通对话场景的十倍甚至百倍。
于是,围绕Agent的共识,迅速演变为模型市场一场“明牌”战争:谁的模型在Agent场景下被调用得越多,谁就能更快地收割收入。目前的全球最大赢家无疑是Anthropic,据《华尔街日报》报道,其营收预计将在第二季度增长一倍以上,达到109亿美元。

△图源:华尔街日报
阿里云同样是这波红利的受益者。2025年,阿里云全年营收超过1466亿元,其中28.6%的增速主要得益于AI产品的贡献。阿里巴巴CEO吴泳铭在上周的财报电话会上进一步透露,包含百炼MaaS平台在内的AI模型与应用服务,其年化经常性收入(ARR)将在6月份季度突破100亿元,并计划在年底达到300亿元。
不过,在这场Token战争中,阿里和字节跳动选择了两种截然不同的路径。
“Token收入主要来自两大块:一块是以Coding为代表的大语言模型,另一块是视频模型。但过去一段时间,很多人把这两个市场的增长混为一谈了,这其实不太准确。”刘伟光特别强调。
字节跳动牢牢占据了视频模型市场。有研究机构测算,自Seedance 2.0爆火后,字节在视频模型市场的日均Token消耗量已占据整个市场的80%。火山引擎曾在2025年底立下“2026年MaaS服务收入超100亿”的目标,而在Seedance 2.0之后,这个目标已经被再次上调。
相比之下,阿里云则将优势押注在大语言模型,尤其是Coding领域。“有开发者的公司,才需要云。所以阿里云现有的存量客户,几乎天然就是Coding的潜在用户。”刘伟光解释道。
2025年底,阿里云曾喊出“拿下2026年AI云市场增量80%”的目标。如今,其业务火力高度集中于Coding领域。“今年前5个月,我们可以说,阿里云已经拿到了LLM模型市场增量的80%。”
为了配合这一战略,阿里云甚至调整了销售团队的考核方式——核心不再是比拼谁卖出的Token数量最多,而是看谁卖出的Token“最值钱”。
道理很简单。单纯聊天产生的Token消耗,其单价早已跌至地板价,并非理想的收入来源。
因此,阿里云如今关注一个更关键的指标:模型接入客户核心业务系统的数量。他们希望销售的Token,是被客户用来写代码、做业务决策、跑核心流程的。一旦模型深度嵌入企业的生产流程,Token的消耗量将呈指数级上升,单价更高,客户粘性更强,对应的收入质量也截然不同。
这源于Coding与视频在Token消耗逻辑上的根本差异。视频模型的消耗是一次性的——生成一段视频,任务结束,消耗停止。
而代码场景则是一个自我强化的飞轮:模型写出代码,代码部署成应用,应用在云上运行,运行过程中又需要持续调用模型来优化或生成新代码……循环往复,生生不息。
时至今日,大模型的竞争早已演变为一场系统工程的综合较量。芯片、基础设施与大模型之间的深度耦合,决定了训练和推理的效率;而商业场景的快速落地与验证,则为模型的持续进化反哺智能。
“芯片、模型和云,现在就像三个必须严丝合缝咬合在一起、共同螺旋上升的齿轮。”刘伟光表示。未来的胜负手或许在于,“如果比拼的是每一块芯片都能比竞争对手跑出更多、更高质量的Token,那胜利就属于我们。”
在后续的分享中,刘伟光进一步阐述了阿里云对Agent趋势和Token之战的理解:
1. 云计算的天花板被Agent再度撬开
传统云计算商业模式相对简单,但有个长期痛点:企业IT预算中,用于内部软件开发和人力外包的那部分,云厂商很难触及。现在情况反过来了,这部分预算恰恰是AI Coding能够100%覆盖的。
数据显示,互联网企业的Token支出已占其IT总支出的15%~20%,而传统企业还在5%以下,增长空间巨大。阿里云今年的目标是,在每个客户的收入中,Token收入的占比不低于20%。
以汽车行业为例,过去云厂商能做的主要是ERP上云,后来是智能驾驶算力,再后来是大模型对话。现在,连广告营销都能用AI来做了。汽车行业最大的IT投入领域,正从传统的ERP转向AI。
金融领域也是如此。以前做券商客户,很难切入对方的业务系统,那是专业壁垒很高的领域。现在则是客户主动找上门,因为头部机构的投研、量化、私募等核心业务场景,都必须与大模型深度结合。
可以说,Agent已经成为带动模型市场、乃至盘活存量云市场的最大引擎。因此,Token业务和云业务在阿里云内部是天然绑定的。这也是为什么Coding被定为最重要的方向——它几乎适用于一切(for everything)。
2. Agent天然是云业务的增长飞轮
Token消耗和GPU使用量之间存在换算关系。实际数据揭示了一个有趣的现象:Agent爆发后,每产生100元的GPU推理消耗,往往会同时带动约200元的GPU+CPU云资源消耗。因为Agent生成的应用需要部署、运行、弹性扩容,这些都会消耗额外的云资源。
这意味着,如果一家厂商没有强大的CPU云资源池,就根本无法有效服务这些Agent客户。这也是“Agent Cloud”概念的核心所在——它形成了一个真实的、可闭环的商业增长飞轮。
3. 销售体系需要快速变革
为了抓住机会,阿里云正在为大型客户单独配置纯MaaS销售,让他们与传统的IaaS销售协同作战。即便在一个客户身上出现两三个销售重叠,这个代价也可以接受,核心是绝不能错失市场窗口。
坦白说,在云产业经营太久,每个人都会有思维惯性。过去卖云,市场版图很清晰——客户线下有多少台服务器,迁移上云大概需要多少预算,答案八九不离十。但做MaaS完全不同,进去之后可能发现市场潜力远超想象。而且,MaaS销售需要直接与客户的业务部门甚至CEO对话,而不是传统的IT部门,这本身就是巨大的挑战。
一个有意思的现象是,越传统的企业,有时反而越容易拥抱AI,因为AI实实在在地简化了他们的一些复杂工作。现在,连畜牧行业的企业都在大规模引入AI,这在过去是不可想象的。
4. Token之战:质量重于数量
调用量可以通过简单的对话堆砌出来,但这没有意义。阿里云关注三个更本质的指标:付费Token客户数是否持续增长;客户是否将模型接入核心系统解决刚需;Agent自主完成任务闭环的效率。美国的行业共识也是如此——目标是用最少的Token完成最有效的任务,而不是用更多的Token完成更多的任务。
正因为追求高质量、高价值的Token,MaaS业务从第一天起就应该是一门有利润的生意。目前,阿里云的百炼平台(基础设施)和模型团队紧密协作,每天都在对推理框架进行极致优化。
尽管中国市场目前仍以按量计费为主,但行业的终极目标,无疑是让客户为最终的业务结果和价值付费。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
ManusAI教育应用指南 AI智能体教学实战案例解析
ManusAI是专为教育设计的智能协作者,教师只需用自然语言描述教学目标,它便能自动完成资源检索、内容生成、交互开发等全套工作,无需复杂操作。其内置教育流程可生成覆盖课前到课后的完整教学资源包,支持互动网页、微课脚本、个性化题库等。实际案例显示,该工具能有效提升学生参与度并减。
五菱缤果Pro威海上市 续航长配置全5.68万起预售火爆
五菱缤果Pro新能源车正式上市,售价5 68万至7 08万元,提供330公里与403公里两种续航版本。新车采用五门五座布局,空间利用率高,并配备快充技术。车身结构强调安全,高强度钢占比达72%。智能座舱搭载大模型与多互联方式,兼顾舒适与便利性。预售订单已突破5万台。
Trae在Python数据分析与机器学习项目中的实际应用评测
Trae在Python数据分析与机器学习项目中主要通过四种方式提供支持:利用Auto模式自动生成并执行端到端分析脚本;通过AgentCLI命令行自动化机器学习建模流程;对现有代码进行智能调试与优化;借助语音交互快速构建数据处理函数。这些功能覆盖了从需求描述到代码生成、模型构建及代码优化的全流程。
吉利银河星耀7 MAX四驱版上市 售价10.88万起性能解析
吉利银河星耀7正式上市,共五款配置,售价10 88万元起。新车定位中型SUV,提供MAX四驱版本,搭载e-AWD智电四驱系统,零百加速5 4秒。设计延续“涟漪美学”,配备发光格栅与贯穿式尾灯。内饰采用环抱式座舱,配备智慧中岛扶手与Eva车载机器人。智能驾驶方面搭载千里浩瀚H3方案,支持高速NOA与自动泊车功能。
AI视频教程:如何制作镜头推进效果
在即梦AI中实现镜头推进效果,可通过慢推模板或手动运镜控制来设置轨道距离与速度。结合运动笔刷可增强局部动态,利用分镜与预设指令库能优化节奏与效率。需注意主体描述明确,参数匹配画面比例。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

