英伟达DeepSeek V4推理成本降低80%

AI热点日报时间：2026-07-03

热点解读

英伟达最新发布的Blackwell平台通过全栈推理优化，将DeepSeekV4模型单Token成本降至原来的五分之一，吞吐量提升达20倍。该平台采用三层架构，结合分离式服务与NVLink专家并行等多项创新技术。目前Baseten、Cognition等多家服务商已从中显著获益。

快科技7月2日消息，英伟达正式宣布，其Blackwell平台通过全栈推理软件深度优化，使得DeepSeek V4模型的单Token成本在一个月内大幅削减至原先的五分之一。

随着企业从AI试验阶段迈向生产级AI工厂，基础设施的决策逻辑已发生根本性转型——评判标准不再单纯依赖芯片的峰值性能，而是聚焦于每元成本、每瓦功耗以及在目标延迟约束下，究竟能高效产出多少有实际价值的Token。

英伟达通过构建三层软件架构实现了Token成本的显著降低。生产运营层负责分布式服务的编排调度与自动扩缩容，应用加速层则借助计算与通信的重叠以及内核融合技术进行运行时优化，基础设施访问层直接与GPU、网络及系统底层能力交互。这相当于为AI推理流程装备了一条智能流水线——每一层各司其职，协同运作，形成合力。

多项创新技术叠加之后，Blackwell平台单GPU的Token吞吐量最高可提升20倍。背后所运用的关键技术包括分离式服务、基于NVLink的大规模专家并行策略、NVFP4精度格式，以及多Token预测机制。简而言之，这一方案几乎将硬件潜能压榨到了极致。

英伟达将单Token成本确立为衡量AI总拥有成本的核心指标，而Blackwell平台已成功将其降至行业最低水平。

多家推理服务商已从中收获显著效益。Baseten借助TensorRT-LLM开源库在Blackwell平台上部署DeepSeek V4 Pro，其每秒Token输出量直接提升了50%。

Cognition则利用Dynamo推理框架高效管理GPU资源，无需从零搭建即可轻松扩展强化学习工作负载。Together AI同样采用TensorRT-LLM，帮助Cursor加速从模型优化到生产部署的完整链路。

开源生态进一步放大了这一全栈架构的优势。PyTorch等主流深度学习框架均原生基于CUDA构建，这意味着最新的研究成果一旦发布，即可立即在NVIDIA GPU上获得运行支持。

DeepSeek V4发布之后，vLLM和SGLang等推理框架迅速为Blackwell平台提供了部署方案，在一个月内实现了高达5倍的性能提升。这正是生态力量的体现——无需等待官方优化，社区力量已自主完成性能加速。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：英伟达DeepSeek V4推理成本降低80%要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.ofweek.com/ai/2026-07/ART-201721-8460-30693020.html

人工智能

上一篇：沂景资本投资企业思朗科技成功入围2026世界人工智能大会SAIL奖30强

下一篇：AI眼镜成世界杯观赛神器华强北被外国球迷挤爆

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周万知AI错题分析功能使用指南 02 / 本周万知AI产品介绍PPT制作教程 03 / 本周SunoAI元标签助AI识别歌词咬字处理技巧 04 / 本周万知AI商业计划书编写步骤与技巧完整指南 05 / 本周如何用MiMo代码编排Agent实现自动化性能评估协同

01 / 本月万知AI错题分析功能使用指南 02 / 本月万知AI产品介绍PPT制作教程 03 / 本月SunoAI元标签助AI识别歌词咬字处理技巧 04 / 本月万知AI商业计划书编写步骤与技巧完整指南 05 / 本月如何用MiMo代码编排Agent实现自动化性能评估协同

热点快看

07-03 15:13万知AI错题分析功能使用指南 07-03 15:13万知AI产品介绍PPT制作教程 07-03 15:13SunoAI元标签助AI识别歌词咬字处理技巧 07-03 15:13万知AI商业计划书编写步骤与技巧完整指南 07-03 15:13如何用MiMo代码编排Agent实现自动化性能评估协同

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别