美科技公司因Token烧钱太快陷入AI账单焦虑
年初以来,硅谷掀起了名为“Token最大化”(tokenmaxxing)的热潮。简言之,就是将AI Token的消耗量与员工绩效直接绑定,消耗越多即被视为生产力越高。亚马逊内部设立了排行榜,依据员工使用AI的频次进行排名;Meta同样不甘落后,其内部系统鼓励员工比拼Token消耗量。这股趋势一度被誉为效率革命的关键指标。
然而问题迅速浮现——昂贵的AI账单开始让企业感到“心疼”了。
根据英国《金融时报》6月30日的报道,美国网约车公司Uber就遭遇了一次典型“翻车”。员工积极采用AI编程工具,结果仅四个月便耗尽了原本计划维持到2026全年的AI预算。管理层被迫紧急叫停,现在每位员工每月在这类工具上的支出上限被设定为1500美元。毕马威5月对2145名全球企业领导者开展的调查表明,近半数受访者因成本超过收益,已减少了AI智能体的使用。
OpenAI首席执行官山姆·奥特曼在6月初的一席话,引发广泛共鸣:“今年年初,一个从未被提及的问题突然变得异常严峻……我的公司第一季度就用掉了原本规划到2026年的预算。”
那么,问题究竟出在哪里?
表面上,Token单价确实在下降。但症结在于,AI公司的定价模式已从固定订阅转向按使用量计费。任务步骤日益增多,输入内容不断延长,每项任务的Token消耗变得难以预测。企业面临的并非稳定成本,而是一张张不可预估、价格不菲的账单。
咨询机构Gartner预测,到2028年,AI编程成本将超过一名普通开发者的平均年薪。更令人担忧的是,Gartner调查显示,四分之三的高管预计今年技术预算将增长,其中近半数预期将实现两位数增幅。成本与预算同步攀升,但关键在于:涨幅是否能跑赢回报?
这听起来有些夸张,对吧?但更核心的问题是:是否每一分Token都要投入最昂贵的模型?
答案显然是否定的。飙升的Token账单迫使企业重新审视每一笔AI支出。微软CEO萨蒂亚·纳德拉和网络安全公司Palo Alto Networks的CEO尼科什·阿罗拉等科技巨头高管最近纷纷表态:更小、更便宜的模型完全能够满足企业大部分需求。换言之,杀鸡焉用牛刀。
企业软件公司Atlassian便是典型案例。他们为每位员工在固定周期内设定了Token使用上限,若员工认为不足,需提交申请并经经理审批。CEO迈克·坎农-布鲁克斯一针见血地指出:“许多公司直接选择最贵的模型并随心所欲地使用,这种做法极为危险,因为它会养成非常糟糕的习惯。”
因此,企业开始转向OpenRouter等AI市场平台进行“精打细算”。简单任务交由性价比高的系统处理,而编程等复杂任务才动用高端模型。开源模型成为降低AI成本的关键武器。有趣的是,OpenRouter上目前最受欢迎的四个模型全部来自中国,其中DeepSeek位居榜首。
硅谷AI搜索初创公司Perplexity的CEO阿拉文德·斯里尼瓦斯直言不讳:“如果开源模型在90%的场景下能完成任务,且成本远低于前沿模型,那我就会选择它。”他补充说,前沿智能的未来依然可期,但企业不会再像过去几个月那样不计代价地投入。最终,能将Token消耗转化为最大经济价值的公司,才能获得最高估值。
帮助企业运行AI模型的WEKA公司首席AI官瓦尔·贝尔科维奇则用了一个形象的比喻来总结:“开源模型以10%的成本实现了90%的效果。我们确实无需在每个环节都支付高昂的Token。”
归根结底,这场“Token狂欢”的降温或许象征着更理性的回归。企业正在学会如何精明地花钱,而非盲目地烧钱。至于那些AI实验室,是继续高歌猛进,还是主动降价抢占市场?好戏还在后头。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。
苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面
苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。
纳睿雷达推出睿宸超精细化短时临近AI气象大模型
纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达
南航国际创新港一期交付 四大专业园区打造空天产业强磁场
近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个
- 日榜
- 周榜
- 月榜
相关攻略
2026-07-03 12:53
2026-07-03 12:53
2026-07-03 12:53
2026-07-03 12:53
2026-07-03 12:52
2026-07-03 12:52
2026-07-03 12:52
2026-07-03 12:52
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

