DeepSeek大模型价格全面下调使用成本降低

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

业界动态

DeepSeek大模型价格全面下调使用成本降低

热心网友时间：2026-05-12

转载

大模型普惠的边界，正在被重新定义。 4月26日，DeepSeek官方的一则API价格调整公告，在业内投下了一枚“深水冲击波”。其全系模型的输入缓存命中价格，直接降至首发价的十分之一。其中，面向企业级的DeepSeek-V4-Pro模型，更叠加了限时2 5折优惠，使得百万Tokens的输入缓存命中成本

大模型普惠的边界，正在被重新定义。

4月26日，DeepSeek官方的一则API价格调整公告，在业内投下了一枚“深水冲击波”。其全系模型的输入缓存命中价格，直接降至首发价的十分之一。其中，面向企业级的DeepSeek-V4-Pro模型，更叠加了限时2.5折优惠，使得百万Tokens的输入缓存命中成本低至0.025元，创下了全球大模型定价的新低点。

根据官方定价页面，此次降价全面覆盖V4系列模型，核心调整聚焦于输入缓存命中这一高频场景。具体来看，主打高速低成本的DeepSeek-V4-Flash，其输入缓存命中价格从每百万Tokens 0.2元降至0.02元。而定位高性能旗舰的DeepSeek-V4-Pro，优惠力度更为惊人：原价1元/百万Tokens的缓存输入价格降至0.1元，在2026年5月5日前享受限时2.5折后，实际成本仅为0.025元。同时，其缓存未命中的输入价格从12元降至3元，输出价格从24元降至6元。

图片来源：DeepSeek官网

官方同时提及，为简化模型线，DeepSeek-Chat与DeepSeek-Reasoner两个模型名称将在日后弃用。出于兼容性考虑，它们实际上分别对应着DeepSeek-V4-Flash的非思考与思考两种模式。

对比调价前后数据，一个清晰的结论是：对于高频调用、长文本处理等场景，其成本降幅超过了90%。这意味着，RAG知识库、智能客服、文档深度分析等缓存命中率高的应用，将直接迎来商用成本的断崖式下跌。长期以来制约AI规模化落地的成本枷锁，有望被一举打破。

技术升级与生态协同，是降价的底气

DeepSeek此次大幅降价，绝非简单的市场策略，其背后是DeepSeek-V4系列模型的技术飞跃，以及与昇腾生态深度协同带来的底气。

就在降价公告发布前两天，4月24日，DeepSeek-V4预览版正式亮相，并同步开源了Pro与Flash两款模型。两者均支持高达100万token的超长上下文。其自研的稀疏注意力架构，从根本上大幅降低了推理所需的算力消耗。数据显示，Pro版处理单token的算力需求仅为前代V3.2的27%，KV缓存更是降至10%，实现了从模型底层开始的成本优化。

从参数看，DeepSeek-V4-Pro激活参数达490亿，预训练数据33万亿token，定位高性能旗舰；DeepSeek-V4-Flash激活参数130亿，预训练数据32万亿token，主打高速与低成本。

能力的提升更为显著。与前代模型相比，DeepSeek-V4-Pro的智能体（Agent）能力得到了质的增强。在Agentic Coding专项评测中，V4-Pro已达到当前开源模型的最佳水平，并在其他Agent相关评测中同样表现优异。据悉，该模型已成为DeepSeek内部员工使用的Agentic Coding模型。根据评测反馈，其使用体验优于Sonnet 4.5，交付质量接近Claude Opus 4.6的非思考模式，但与Opus 4.6的思考模式仍存在一定差距。

在世界知识测评中，DeepSeek-V4-Pro大幅领先其他开源模型，仅稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛级代码等硬核能力测评中，V4-Pro则超越了所有已公开评测的开源模型，足以比肩世界顶级闭源模型。

相比之下，DeepSeek-V4-Flash在世界知识储备方面稍弱，但展现了接近的推理能力。得益于更小的模型参数和激活量，V4-Flash能够提供更为快捷、经济的API服务，成为高性价比之选。

此外，DeepSeek-V4还开创了一种新的注意力机制，在token维度进行压缩，并结合其自研的DSA稀疏注意力，实现了全球领先的长上下文处理能力，同时相比传统方法，大幅降低了对计算资源和显存的需求。

国产化信号释放，未来成本有望进一步下探

更值得关注的是，昇腾超节点全系列产品已宣布支持DeepSeek V4系列模型。这无疑释放了明确的国产化信号。

DeepSeek-V4在一份技术报告中透露：“我们在英伟达GPU和华&为昇腾NPU两个平台上验证了细粒度EP（专家并行）方案。与强力的非融合基线相比，该方案在通用推理任务中实现了1.50-1.73倍的加速；在对延迟敏感的场景（例如强化学习rollout和高速Agent服务）中，最高可达1.96倍加速。”

DeepSeek方面强调，随着下半年昇腾超节点全系列产品的批量上市，Pro版的价格有望迎来进一步的大幅下调。这意味着，本次降价可能只是一个开始。

市场视角：打开AI应用规模化的新空间

DeepSeek-V4的发布与降价，迅速引发了市场分析机构的关注。

高盛发布的分析报告指出，DeepSeek V4的核心意义在于，能够以更低的成本支持更复杂的智能体应用落地，从而为AI应用的规模化打开了新的想象空间。对于其纳入昇腾生态，高盛认为这将进一步强化DeepSeek的成本竞争力，为更广泛的应用落地创造条件。报告还特别提到，在全球芯片供应持续紧张的背景下，中国顶尖AI模型向国产算力迁移的趋势，得到了头部玩家的明确背书。

高盛报告还援引市场消息称，腾讯和阿里正在洽谈以超过200亿美元的估值投资DeepSeek。作为参照，智谱和MiniMax的最新估值分别约为530亿美元和310亿美元。这一潜在的交易，折射出科技巨头对稀缺顶层AI能力的激烈争夺。

华泰证券则提供了另一个观察维度。其分析认为，市场容易将V4的突破简单理解为“降本压低算力、存储需求”，但更重要的边际变化在于：长上下文成本急剧下降后，复杂智能体、多文档分析、长周期任务、在线学习等此前受成本制约的高价值场景，其可用性将大幅提升。这很可能驱动推理调用量与存储访问频次的扩张，从而打开新的市场增量。

总而言之，DeepSeek此次行动，不仅是一次价格战，更是一次通过底层技术革新与生态协同，系统性降低AI使用门槛、重塑行业竞争格局的宣言。大模型普惠的时代，正加速到来。

来源:https://36kr.com/p/3784505673112582

上一篇： AI技术如何重塑网络电影行业新生态

下一篇： AI大模型赋能工业制造开启工厂智能化新纪元