英伟达Blackwell架构:AI推理成本骤降90%,仅为十分之一
IT之家2月13日获悉,英伟达昨日(2月12日)发布官方博文,宣布在AI推理领域的"token经济学"方面取得突破性进展,其Blackwell架构实现了里程碑式的技术跨越。
英伟达在文中强调,通过推行"极致软硬件协同设计"策略,该架构显著提升了硬件处理复杂AI推理任务时的效率,有效化解了因模型参数量激增带来的算力成本压力。数据显示,相较于前代Hopper架构,Blackwell平台将单位Token生成成本大幅降低至十分之一。

英伟达Blackwell架构实现AI推理成本压缩至十分之一
产业应用层面,包括Baseten、DeepInfra、Fireworks AI及Together AI在内的多家推理服务商已开始利用Blackwell平台托管开源模型。
据IT之家引述博文内容,英伟达指出通过整合前沿开源智能模型、Blackwell的硬件优势以及各厂商自研的优化推理栈,这些企业成功实现了跨行业的成本缩减。

英伟达通过整合开源前沿智能模型助力企业实现跨行业成本缩减
以专注多智能体工作流的Sentient Labs为例,其成本效率相较Hopper时代提升了25%至50%;而游戏领域的Latitude等公司也借此实现了更低延迟和更可靠的响应性能。

Sentient Labs成本效率相比Hopper时代提升25%至50%
Blackwell架构的高效能核心在于其旗舰系统GB200 NVL72。该系统采用72颗芯片互联配置,并配备了高达30TB的高速共享内存。这种设计完美契合当前主流的"混合专家"架构需求,能够将Token批次高效拆分并分散到各个GPU上并行处理。

GB200 NVL72系统采用72颗芯片互联配置
在Blackwell大获成功的同时,英伟达已将目光投向下一代代号为"Vera Rubin"的平台。据悉,Rubin架构计划通过引入针对预填充阶段的CPX等专用机制,进一步推高基础设施的效率天花板。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
美股芯片股重挫中概股普跌 理想汽车大跌超10%
美股三大指数高开后走势分化,道指微涨,纳指与标普500下跌。科技股表现不一,谷歌因巴菲特增持大涨,甲骨文、特斯拉下跌。存储芯片板块重挫,中概股普遍走低,理想汽车跌超10%。大宗商品中金银反弹,油价下跌。市场担忧持续,十年期美债收益率升至高位,中东局势与利率变化受关注。
宝马K1800概念旅行车发布六缸引擎与空气动力学设计引领未来摩旅风潮
宝马VisionK1800概念车亮相,主打长途旅行场景。车身采用流线型设计,手工铝制材料呈现独特质感。经典六缸发动机排量提升至1800cc,动力更充沛。配置包括可调悬架、主动冷却大灯及透明整流罩,兼顾舒适性、安全性与视野。该车展示了宝马对未来旅行摩托车的技术探索方向。
日野M112 AMT变速箱亮相适配多场景运输降本增效
日野发布全新M112十二速自动变速箱,适配中重型卡车。其优化齿比与智能换挡策略,可提升城市运输燃油经济性,降低换挡冲击。针对长途运输,绵密齿比有助于维持发动机高效运转,实测油耗降低5%至8%。该变速箱采用电控液压与双中间轴设计,换挡迅捷,计划2027年在亚洲量产。
Brabus千匹V12黑武士Bodo限量77台致敬经典
巴博斯推出限量77台的千匹V12超跑Bodo,搭载5 2升双涡轮发动机,功率达1000马力。新车采用全黑碳纤维设计,融合复古与攻击性线条,并兼顾长途驾驶实用性。在电动化主流趋势下,它以传统大排量燃油动力和特立独行的美学,致敬品牌经典,为超跑市场注入独特活力。
华硕电脑护航上海国际电影节AI片场开启智能创作新篇章
上海国际电影节设立“AI片场”单元,聚焦AI影像创作全过程。该单元采用“创作者+AI”合作模式,完整记录从创意到成片的流程,探讨AI工具如何融入影视生产并保障创作者主体性。华硕电脑提供算力支持。活动包括影片首映、工作坊等,旨在为行业提供实践样本。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

