Copilot下架Opus、Qwen计费、GLM受限,Token涨价,人比Token便宜?
最近的AI行业出现了一个颇为有趣的现象:一边高调宣发模型能力多强、工具多好用,另一边又因为算力吃不住,纷纷涨价或变相收紧服务。钉钉CEO最近有句话挺扎眼的——“只要被我看到这个文档是人写的,我肯定批评”。听起来很激进对吧?
但你再看阿里云Qwen这边的操作:先是Lite版下架不给续费,然后是Lite订阅直接停掉,接着200块/月的Pro订阅抢都抢不到,随后又传出Pro订阅也要下架的消息。最近推出的Token Plan,基本等于宣告Qwen要全面转向按量计费了。细看一下,尊享版1398的用量对标的是过去的Code Plan Pro,可价格呢?提价意图已经写在了脸上。
类似的戏码近期轮番上演。GitHub Copilot在4月20号调整了订阅政策:Copilot Pro直接移除了Opus系列(4.5、4.6、4.7),用户再也选不了;Copilot Pro+(月费约40美元)目前只保留了Opus 4.7;同时Student、Pro、Pro+的新订阅全部暂停。官方说辞是“提升服务可靠性和简化模型供应”,但真实原因大家都懂——agentic workflows带来的算力消耗翻着倍往上蹿,不收紧高端模型的访问根本扛不住。
更有意思的是,哪怕你已经付了钱,服务说变就变,而且看起来还真合法。GitHub的协议里白纸黑字写着类似条款,国内各大平台也如出一辙。高峰期限速、给你返回429简直是家常便饭。回想一下,这些订阅模式本质上跟健身房的年卡差不多,都算对赌协议。只不过谁也没想到技术普及的速度这么快,各家发现自己根本扛不住这Token消耗,怎么看都是血亏,于是不约而同地开始大幅收索。
如果你走的是API路线,道理一样。标准的SaaS协议三件套基本都包含:服务内容可以修改、功能可以调整;不承诺某个功能永久存在;第三方依赖可变。拿Qwen的Code Plan举例,你买的是“服务授权”,用量由平台控制,而不是你拥有了多少使用权。这就是为什么订阅了也能中途变卦的根源。
智谱GLM海外版Z.AI的Coding Plan最近也调整了协议,严格限制非代码场景的使用——说白了就是不让你在OpenClaw里用,非Coding场景会被严格限速,违规三次直接永久封禁。Claude Pro虽然还是每月20美元,但可用性已经明显下滑。在一些用户的实测里,Opus 4.7一次性做对的比率只有74.5%,而4.6能做到83.8%;每次修改需要的平均重试次数几乎翻了一倍。明面上没涨价,实际上却“降智”了,你的消耗自然水涨船高。
Google这边,需求爆炸之下优先保稳定,免费和低成本通道大幅缩水,免费层的配额削减了50%到80%,RPM、TPM、RPD全面收紧。Windsurf也涨了价:Pro从15美元涨到20美元,Teams从30美元每人每月涨到40美元。就在这种涨价和稳定性双重夹击之下,一度被吐槽的“Trae优速通”反而卖得不错,每月999块的权益居然有市场。只能说,大家的接受阈值正在悄然变化。
不只是订阅,算力产品同样在涨。阿里AI算力产品今年上调了5%到34%,DataWorks API免费额度大幅缩减,转为按量付费;百度智能云涨了5%到30%;腾讯云也上调了混元大模型API价格,后续AI算力产品再次跟进。回过头来看,当时被骂贵的小米MIMO,现在反倒显得有点性价比了?环境变化是真快。
当然,选AI服务不能只看价格,API的有效性和速度同样关键。有人做了不同平台Code Plan的速度测试,平台间的差距还是挺明显的。虽然光快也没用就是了。
总体来看,AI企业对订阅和服务的控制力相当到位。之前铺天盖地宣传的“AI裁员替代潮”,核心逻辑是用Token替代部分人力的成本来开源节流。但过去觉得“便宜”的印象,很大程度上是订阅制带来的错觉。如今价格一路上涨,稳定性也在承受考验,很多东西值得重新审视——毕竟一个员工的薪资是稳定的,还能背锅;而AI呢,动不动就要调整预期、申请加薪,高峰时还理直气壮地“429休息”,你连骂它两句都得算Token消耗……
最后想到一件事:前段时间OpenAI的奥特曼深情感谢老一辈程序员,感谢古法编程的开发者让OpenAI走到今天。结果评论区风向急转直下——大家显然不买账。
AI的浪潮当然还会继续向前。短期来看,底层算力和基础设施集体涨价、使用限制收紧的趋势已经很明显,高消耗场景比如Agent、Coding最终会被迫转向按量计费或更高阶的付费方案。这已经是正在发生的事实。至于长期,Token的价格或许还是会降下来?但眼下,大家也只能被这波大势裹挟着往前走罢了。
你现在用的是什么套餐?
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
scRNA-hdWGCNA共表达网络分析教程:网络图可视化函数详解
```html 单细胞RNA测序技术的广泛普及,使得WGCNA(加权基因共表达网络分析)从传统的bulk RNA-seq分析成功延伸至单细胞转录组领域。hdWGCNA正是为此场景量身定制的R包,其高度模块化的设计能够高效构建细胞层次或空间层次的共表达网络,精准识别高度共表达的基因模块,并借助统计检验
婚姻宝在线智能法律助手专注婚姻家事咨询
当婚姻遇到法律难题,你需要的不仅是一位律师 婚姻中的法律问题,往往伴随着复杂的情感和现实考量。什么时候该签婚前协议?离婚时财产怎么分才算公平?孩子的抚养权究竟该怎么争取?这些问题,在传统法律服务模式下,往往意味着高昂的咨询费和反复的“等律师档期”。但市场上一款名为“婚姻宝”的AI法律助手,正在悄然改
大模型聚合API路由算法选型:静态到动态调度技术演进
随着大模型步入规模化产业落地阶段,企业纷纷采用多模型聚合架构,将通用大模型、垂直领域模型和轻量化推理模型等异构资源进行整合。在此背景下,聚合API路由作为连接用户请求与模型算力的核心枢纽,直接影响系统推理延迟、算力利用率、调用成本以及服务稳定性。过去那种“一刀切”的静态规则分发模式,面对海量、异构、
SEO标题优化硬性规则:18-30汉字内单一标题
Writefull AI是什么 对学术写作者来说,论文中最令人头疼的往往不是数据不足,而是如何将想法转化为精准、地道的学术语言。Writefull AI正是为此场景量身打造——它是一款专为研究人员设计的智能写作助手,其底层数据库来源于海量学术期刊与论文,能够提供非常具体且可靠的语用反馈。简单来说,它
PyTorch Transformer多头自注意力机制:序列反转与图像异常检测应用附智能体代码数据
摘要 本文从理论解析到代码实现,系统拆解了Transformer模型的两大核心模块——缩放点积注意力与多头自注意力,并基于PyTorch框架从零构建了完整的Transformer编码器。我们将这一架构应用于两个实际场景:经典的序列反转任务,以及更具挑战性的集合异常检测任务。全文旨在解答以下核心问题:
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

