英伟达Blackwell架构:每兆瓦吞吐量达Hopper的50倍
IT之家2月18日援引英伟达最新动态,该公司于2月16日通过官方博客宣布,其Blackwell Ultra AI架构(GB300 NVL72)在能效与成本控制方面实现重大突破。根据DeepSeek-R1模型测试结果显示,相较于前代Hopper GPU架构,新一代架构的每兆瓦吞吐量提升达50倍,处理百万tokens的成本降至原先的三十五分之一的水平。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

值得注意的是,英伟达在公告中还预告了下一代Rubin平台的技术规划,预计其每兆瓦吞吐量将比Blackwell架构再提升10倍,持续推动AI基础设施的迭代升级。
IT之家技术解读:每兆瓦吞吐量(Tokens / Watt)是衡量AI芯片能效表现的核心指标,具体指消耗每瓦特电力所能处理的Token数量。该数值越高,代表芯片能效表现越优异,实际运营成本也相应降低。
英伟达在技术文档中强调,实现性能飞跃的关键在于架构层面的全面升级。Blackwell Ultra通过NVLink高速互联技术,将72个GPU连接为统一的计算单元,互联带宽高达130TB/s,远超Hopper架构时代的8芯片设计方案。此外,全新的NVFP4精度格式与极致协同设计架构相结合,进一步巩固了其在计算吞吐性能方面的领先地位。

在AI推理成本方面,新平台相较Hopper架构实现显著优化,处理百万Token的成本降至原先的三十五分之一。即便是与同代Blackwell架构的GB200相比,GB300在长上下文任务中的Token成本也降低至1.5分之一,注意力机制处理速度实现倍数级提升,完美适配代码库维护等高负载应用场景。

OpenRouter发布的《推理状态报告》指出,与软件编程相关的AI查询量在过去一年中呈现爆发式增长,占比从11%攀升至约50%。这类应用通常要求AI代理在多步工作流程中保持实时响应,并具备跨代码库推理的长上下文处理能力。
为应对这一技术挑战,英伟达通过TensorRT-LLM、Dynamo等开发团队的持续优化,进一步提升了混合专家模型(MoE)的推理吞吐量。以TensorRT-LLM库的改进为例,使得GB200在低延迟工作负载上的性能在短短四个月内提升了5倍。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
智现未来联合晶合集荣获SEMICON China良率提升奖
3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业
南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天
神州写真:中国机器人租赁升温,二次开发成关键新赛道
来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年
京东翻新打印机避雷指南:警惕以旧充新三大陷阱
大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确
马斯克母亲分享长城游览视频:赞叹“令人惊叹”
来源:九派新闻、环球网版权归原作者所有,如有侵权请及时联系据环球网:美国企业家埃隆·马斯克的母亲梅耶·马斯克3月27日在社交平台X上发帖,分享自己在长城游览的视频。梅耶·马斯克当天在帖子中称,此次旅
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

