英伟达Blackwell架构将AI推理成本暴降90%,压缩至十分之一
IT之家2月13日消息,英伟达近日发布官方博文,宣布在AI推理领域的"token经济学"研究取得突破性进展,其Blackwell架构实现了里程碑式的性能飞跃。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
英伟达在文中指出,通过实施"极致软硬件协同设计"策略,该架构显著优化了硬件处理复杂AI推理任务时的能效表现,有效解决了模型参数膨胀导致的算力成本激增问题。数据显示,与上一代Hopper架构相比,Blackwell平台将单位Token生成成本降低至十分之一。

在行业落地方面,包括Baseten、DeepInfra、Fireworks AI及Together AI在内的多家推理服务商已开始利用Blackwell平台托管开源模型。
IT之家援引博文介绍,英伟达强调通过结合前沿智能开源模型、Blackwell的硬件优势以及各厂商自研的优化推理栈,这些企业成功实现了跨行业的成本缩减。

以专注多智能体工作流的Sentient Labs为例,其成本效率较Hopper时代提升了25%至50%;而游戏领域的Latitude等公司也借此实现了更低的延迟和更可靠的响应性能。

Blackwell架构的高效能核心在于其旗舰级系统GB200 NVL72。该系统采用72颗芯片互联配置,并配备了高达30TB的高速共享内存。这种设计完美契合当前主流的"混合专家"架构需求,能够将Token批次高效拆分并分散到各个GPU上并行处理。

在Blackwell大获成功的同时,英伟达已将目光投向下一代代号为"Vera Rubin"的平台。据悉,Rubin架构计划通过引入针对预填充阶段的CPX等专用机制,进一步推高基础设施的效率天花板。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
前Meta总监田渊栋创业获谷歌英伟达投资研发自我进化AI
前Meta FAIR研究科学家总监田渊栋近日在社交平台X上正式宣布,其创立的新公司Recursive_SI已正式亮相。这家聚焦递归超级智能的初创企业,自成立之初便备受业界瞩目。 Recursive_SI的起步堪称梦幻。公司成立仅数月,在产品尚未正式发布的情况下,便已完成超过6 5亿美元的巨额融资,估
Joby与Skyports合作完成纽约首批eVTOL点对点飞行
纽约的天空,正迎来一场静悄悄的变革。就在不久前,垂直起降机场开发与运营公司Skyports Infrastructure与Joby A viation合作,在“2026电动天空之旅”纽约市飞行活动期间,完成了一系列具有里程碑意义的飞行。活动从4月23日持续至5月1日,多架次点对点的电动垂直起降(eV
索尼PlayStation利用AI技术革新游戏开发流程
索尼将AI定位为游戏开发的效率工具,旨在辅助而非取代人类创意。其AI工具可自动生成面部动画,大幅缩短制作时间,已应用于《地平线》等游戏。索尼强调创意核心始终在人,AI主要用于自动化重复流程、加速建模测试。公司亦探索生成式AI在视频制作中的应用,同时承认该技术在一致性与可控性上仍。
穆巴达拉携手Core42与Solutions+共建主权AI基础设施
Core42与Solutions+达成战略合作,共同推进阿联酋主权AI基础设施建设。Core42提供主权云与AI算力,Solutions+负责实施与数据服务,双方构建端到端交付模式,服务于穆巴达拉集团及政府机构,确保数据驻留境内,支撑国家数字化战略与经济韧性。
Yum Brands技术负责人详解如何构建餐饮业AI骨干平台
编者按:本文内容源自CIO Dive与CX Dive于今年5月举办的线上研讨会,相关精彩内容现已开放按需回看。 谈及餐饮巨头与科技的深度融合,Yum Brands(百胜餐饮集团)无疑是行业先行者。早在三十二年前,其旗下品牌必胜客便通过PizzaNet平台,成功完成了全球首笔餐厅在线订单交易,开创了餐
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

