DeepSeek大模型价格全面下调使用成本降低
大模型普惠的边界,正在被重新定义。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
4月26日,DeepSeek官方的一则API价格调整公告,在业内投下了一枚“深水冲击波”。其全系模型的输入缓存命中价格,直接降至首发价的十分之一。其中,面向企业级的DeepSeek-V4-Pro模型,更叠加了限时2.5折优惠,使得百万Tokens的输入缓存命中成本低至0.025元,创下了全球大模型定价的新低点。
根据官方定价页面,此次降价全面覆盖V4系列模型,核心调整聚焦于输入缓存命中这一高频场景。具体来看,主打高速低成本的DeepSeek-V4-Flash,其输入缓存命中价格从每百万Tokens 0.2元降至0.02元。而定位高性能旗舰的DeepSeek-V4-Pro,优惠力度更为惊人:原价1元/百万Tokens的缓存输入价格降至0.1元,在2026年5月5日前享受限时2.5折后,实际成本仅为0.025元。同时,其缓存未命中的输入价格从12元降至3元,输出价格从24元降至6元。

图片来源:DeepSeek官网
官方同时提及,为简化模型线,DeepSeek-Chat与DeepSeek-Reasoner两个模型名称将在日后弃用。出于兼容性考虑,它们实际上分别对应着DeepSeek-V4-Flash的非思考与思考两种模式。
对比调价前后数据,一个清晰的结论是:对于高频调用、长文本处理等场景,其成本降幅超过了90%。这意味着,RAG知识库、智能客服、文档深度分析等缓存命中率高的应用,将直接迎来商用成本的断崖式下跌。长期以来制约AI规模化落地的成本枷锁,有望被一举打破。
技术升级与生态协同,是降价的底气
DeepSeek此次大幅降价,绝非简单的市场策略,其背后是DeepSeek-V4系列模型的技术飞跃,以及与昇腾生态深度协同带来的底气。
就在降价公告发布前两天,4月24日,DeepSeek-V4预览版正式亮相,并同步开源了Pro与Flash两款模型。两者均支持高达100万token的超长上下文。其自研的稀疏注意力架构,从根本上大幅降低了推理所需的算力消耗。数据显示,Pro版处理单token的算力需求仅为前代V3.2的27%,KV缓存更是降至10%,实现了从模型底层开始的成本优化。
从参数看,DeepSeek-V4-Pro激活参数达490亿,预训练数据33万亿token,定位高性能旗舰;DeepSeek-V4-Flash激活参数130亿,预训练数据32万亿token,主打高速与低成本。
能力的提升更为显著。与前代模型相比,DeepSeek-V4-Pro的智能体(Agent)能力得到了质的增强。在Agentic Coding专项评测中,V4-Pro已达到当前开源模型的最佳水平,并在其他Agent相关评测中同样表现优异。据悉,该模型已成为DeepSeek内部员工使用的Agentic Coding模型。根据评测反馈,其使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6的非思考模式,但与Opus 4.6的思考模式仍存在一定差距。
在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛级代码等硬核能力测评中,V4-Pro则超越了所有已公开评测的开源模型,足以比肩世界顶级闭源模型。
相比之下,DeepSeek-V4-Flash在世界知识储备方面稍弱,但展现了接近的推理能力。得益于更小的模型参数和激活量,V4-Flash能够提供更为快捷、经济的API服务,成为高性价比之选。
此外,DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,并结合其自研的DSA稀疏注意力,实现了全球领先的长上下文处理能力,同时相比传统方法,大幅降低了对计算资源和显存的需求。
国产化信号释放,未来成本有望进一步下探
更值得关注的是,昇腾超节点全系列产品已宣布支持DeepSeek V4系列模型。这无疑释放了明确的国产化信号。
DeepSeek-V4在一份技术报告中透露:“我们在英伟达GPU和华&为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案。与强力的非融合基线相比,该方案在通用推理任务中实现了1.50-1.73倍的加速;在对延迟敏感的场景(例如强化学习rollout和高速Agent服务)中,最高可达1.96倍加速。”
DeepSeek方面强调,随着下半年昇腾超节点全系列产品的批量上市,Pro版的价格有望迎来进一步的大幅下调。这意味着,本次降价可能只是一个开始。
市场视角:打开AI应用规模化的新空间
DeepSeek-V4的发布与降价,迅速引发了市场分析机构的关注。
高盛发布的分析报告指出,DeepSeek V4的核心意义在于,能够以更低的成本支持更复杂的智能体应用落地,从而为AI应用的规模化打开了新的想象空间。对于其纳入昇腾生态,高盛认为这将进一步强化DeepSeek的成本竞争力,为更广泛的应用落地创造条件。报告还特别提到,在全球芯片供应持续紧张的背景下,中国顶尖AI模型向国产算力迁移的趋势,得到了头部玩家的明确背书。
高盛报告还援引市场消息称,腾讯和阿里正在洽谈以超过200亿美元的估值投资DeepSeek。作为参照,智谱和MiniMax的最新估值分别约为530亿美元和310亿美元。这一潜在的交易,折射出科技巨头对稀缺顶层AI能力的激烈争夺。
华泰证券则提供了另一个观察维度。其分析认为,市场容易将V4的突破简单理解为“降本压低算力、存储需求”,但更重要的边际变化在于:长上下文成本急剧下降后,复杂智能体、多文档分析、长周期任务、在线学习等此前受成本制约的高价值场景,其可用性将大幅提升。这很可能驱动推理调用量与存储访问频次的扩张,从而打开新的市场增量。
总而言之,DeepSeek此次行动,不仅是一次价格战,更是一次通过底层技术革新与生态协同,系统性降低AI使用门槛、重塑行业竞争格局的宣言。大模型普惠的时代,正加速到来。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
腾讯开源Cube Sandbox AI沙盒运行时实现60毫秒冷启动
在AI智能体与Agent应用开发领域,高效的编排框架正成为技术焦点。构建一个安全、高性能的智能体运行环境,沙箱技术是核心基础,也是业界公认的技术挑战。长期以来,开发者往往面临安全与性能的艰难取舍:Docker容器虽然轻量便捷,但其共享内核的架构存在潜在的安全隔离风险;而传统虚拟机虽然提供了彻底的隔离
飞书多维表格AI搭建工具多维秒搭使用指南
多维秒搭是什么 如果你正为如何把脑子里那个模糊的业务想法,变成飞书多维表格里清晰可用的数据结构而头疼,那么“多维秒搭”的出现,或许能让你松一口气。这款由前飞书团队核心成员打造的AI工具,瞄准的正是从“业务需求模糊”到“数据结构落地”这个核心痛点。它的逻辑很简单:你只需要用大白话描述你的业务场景,剩下
OpenClaw 服务中断原因分析与解决方案
3月16日,GTC大会的聚光灯下,黄仁勋穿着标志性的皮夹克,将OpenClaw捧上了神坛。他给出的定义清晰而宏大:如果说Mac和Windows是个人电脑的操作系统,那么OpenClaw就是个人AI的操作系统。 当全场起立鼓掌时,恐怕没人能料到,这个被称作“人类历史上增长最快的开源项目”,其高光时刻仅
索尼AI乒乓球机器人击败职业选手人工智能技术革新体育训练
近日,东京乒乓球台前的一场人机对决引发全球关注。索尼AI研发的自主乒乓球机器人“Ace”,在遵循国际乒联完整规则、由持证裁判执裁的正式比赛中,成功击败了包括职业选手在内的人类顶尖运动员。这不仅标志着机器人首次在实体竞技运动中达到专家级水平,更预示着人工智能与机器人技术在动态物理交互领域取得了里程碑式
具身智能数据需求激增60万采集员能否满足行业需求
2026年4月,具身智能领域的战鼓擂得格外密集,几件大事接连发生,将行业的核心矛盾清晰地推到了台前。 成立仅14个月的它石智航,一举拿下4 55亿美元的Pre-A轮融资,创下了国内具身智能领域的单轮融资纪录。几乎就在同一时间,光轮智能披露了一季度5 5亿元的订单,并确认了3月完成的10亿元融资,成为
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

