DeepSeek V4 API调用20亿Token费用揭秘
最近一直在打磨RealPLC产品的各个细节,前后试了两套AI方案:Codex和GPT-5.5 High、Claude Code、DeepSeek V4 Pro/Flash。Codex用的是Plus方案,额度用完后就切到第二套。这个月几乎每天都在迭代调整。
说实话,最大开销不是API费用或订阅费,而是时间。一个地方的改动,很可能把其他地方搞崩。每次调整后docker重启至少要几分钟,来回折腾,时间根本不够用。期间不少朋友催着问内测邀请码,但眼看着要发布了,总因为某个小细节不满意又改一改——优化永无止境,有时候甚至直接重写,这部分损耗巨大。
不过持续优化到现在,方案基本稳定了,前端UI不会再加太多内容,后续主要精力放在服务端的管理和配置上,这背后是大量的工作。简单上线一个网站很容易,但要稳定运行,后台服务的工作量可不小。代码量一旦上了量级,事情就没那么简单了。
这期聊聊DeepSeek V4的费用——毫不夸张,这个月差不多消耗了20亿Tokens。光是API费用,GPT的额度每天都用完。所以RealPLC从诞生起就是AI的产物,也是我们和AI深度结合的综合体。
01
DeepSeek V4费用
之前简单介绍过:DeepSeek V4 Pro跑1个亿Token到底要花多少钱?刚好过去一个月,今天账户欠费了,翻开后台数据,正好和大家分享下具体的使用情况。

总消费:227.27元。具体分配到模型上,这张图不直观。于是把数据导出来,扔给DeepSeek网页端,让它生成一个HTML页面展示——后面详细说。
具体的Tokens分布如下:

大部分用的是Pro:Pro的Tokens约15.5亿,Flash约2.8亿。粗略估算,这个月总共消耗接近20亿。按目前的金额粗算(18亿对应230元),平均1亿Tokens约12元。
02
深度解析
让DeepSeek生成的HTML页面效果不错:

总成本概览
统计周期内,该账号累计调用支出¥227.28元。
- deepseek-v4-pro(高精度模型):¥192.35元,占比84.6%
- deepseek-v4-flash(高速轻量模型):¥34.93元,占比15.4%
Pro模型是绝对的成本主力,日均约¥8.74元;Flash日均仅¥1.59元,适合对实时性要求高、但对成本敏感的任务。
成本构成分析(基于Token级明细)
Pro模型成本构成:
- 输出Token(¥0.000006/个):贡献¥43.52,占比22.6%
- 缓存命中输入(¥0.000000025/个):贡献¥5.80,仅占3.0%
- 缓存未命中输入(¥0.000003/个):贡献¥143.03,占比74.4%
Flash模型成本构成:
- 输出Token(¥0.000002/个):贡献¥14.08,占比40.3%
- 缓存命中输入(¥0.00000002/个):贡献¥0.92,仅占2.6%
- 缓存未命中输入(¥0.000001/个):贡献¥19.93,占比57.1%
缓存命中率与调用频率
- Pro模型:缓存命中率93.5%(命中Token约13.8亿,未命中约0.96亿),请求次数13,809次
- Flash模型:缓存命中率86.5%(命中Token约2.57亿,未命中约0.40亿),请求次数6,780次
Pro的请求次数是Flash的两倍多,且命中率更高,说明大量重复或相似输入被有效缓存,降低了理论成本。但由于未命中输入的绝对量依然巨大(0.96亿Token),总成本仍然偏高。
每日成本趋势特点
- 平稳期(5月2日–9日):Pro日成本1~5元,Flash小于1元
- 爆发期(5月11日–27日):Pro多次单日超过12元,最高5月27日达¥27.76;Flash最高单日5月27日¥4.19
- 5月19日与5月27日是两个明显峰值,可能与业务活动增加或大量长上下文请求有关
03
小结
要降低成本,还得提高输入的命中率。AI给出的建议很实用:
- 提高缓存复用:尽量复用相同的会话或系统提示词,减少
cache_miss输入量。当前未命中输入贡献了Pro约74%的成本,优化这部分收益最大。 - 评估模型选择:对于非复杂推理任务,可多使用Flash模型,成本仅为Pro的1/5~1/6,且调用延迟更低。
- 控制输出长度:输出Token在两种模型中都占相当比例(Pro 23%,Flash 40%),适当限制
max_tokens或简化回答能直接节约成本。
参考链接:
【1】https://platform.deepseek.com/usage
【2】https://www.realplc.com
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI高效生成大班科学实验教学PPT下载 提升课堂质量与趣味性
```html 对于众多教师而言,大班教学既是日常挑战,也是必须面对的常态。当教室内坐着几十甚至上百名满怀期待的学生时,如何高效准备一堂既生动清晰又能牢牢抓住所有人注意力的课程?PPT 往往是那位不可或缺的“得力助手”。然而,难题也随之浮现:内容要充实,设计需美观,还要贴合不同教学主题——若从头自行
AI提升班会质量:PPT主题总结与未来计划范文
使用情景 在校园生活中,主题班会是班级凝聚力的重要体现,堪称一场“全员聚会”。同学们齐聚一堂,交流学习心得、分享生活体会,同时回顾和反思近期的整体表现。然而,每当提到“主题班会”,不少同学便会感到些许压力:如何准备?怎样才能将内容整理得既有条理、有深度,又不失趣味性?这时,PPT便成为了高效组织的得
实测ToDesk AI对比QClaw:更省额度回答更详细
前言 最近一段时间,我连续体验了几款主打“Claw”能力的桌面智能助手,最初只是想看看它们是否只是“披着AI外壳的聊天工具”。然而,真正上手体验后,感受非常明确:ToDesk AI(ToClaw)更像一个能够直接落地执行任务的桌面助手,而不只是一个会聊天、能生成内容的模型入口。 很多人在评估这类产品
大班幼儿教育PPT制作免费技巧轻松掌握告别烦恼
使用情景 在幼儿园大班的教学场景中,PPT早已成为老师们不可或缺的课堂助手。无论是日常的课件讲解、主题活动的组织,还是家长会上的总结汇报,一份优质的PPT都能让信息传递更加直观,同时有效吸引孩子们的注意力。 不过,要想把大班PPT做得既美观又实用,确实需要花费不少心思。内容既要丰富有趣,视觉上又要具
2026最新版Claude Opus 4.7国内使用全攻略:价格不变能力翻倍
比Opus 4 6更强的新一代模型Opus 4 7终于正式发布。就在OpenAI不断扩展Codex功能的同时,Anthropic迅速推出了Opus 4 7——而且这次带来的确实是实质性升级。(目前已经全量上线,用户可以直接上手体验。)那么,Opus 4 7究竟有哪些突破?先给个结论:这不是一次简单的
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

