英伟达Vera Rubin AI平台发布:单Token成本降至1/10
来源:环球网
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
【环球网科技综合报道】3月17日消息,据Investing报道,在今年的GTC大会上,英伟达正式发布了Vera Rubin AI平台,专为智能体AI发展量身打造。该平台被视为英伟达在AI基础设施领域的一次重大飞跃,也标志着其开启了史上最大规模的AI基建布局,全面覆盖从大规模预训练到实时智能体推理的AI全生命周期,为智能体AI技术发展提供强大的算力与技术支撑。

英伟达创始人兼首席执行官黄仁勋表示,Vera Rubin AI平台在核心算力、推理加速、数据存储等多个维度实现技术突破,从底层基础设施层面优化AI全流程运算效率,助力智能体AI的规模化落地。
在核心算力层面,平台搭载的新一代NVL72机架实现效率突破性提升,通过NVLink 6完成72块Rubin GPU与36块Vera CPU的连接。相较于上一代Blackwell平台,该系统完成混合专家大模型训练仅需四分之一的GPU,每瓦推理吞吐量提升10倍,成功将单Token成本降至原来的十分之一,大幅降低了AI模型训练与推理的成本。同时,专为验证AI模型结果设计的Vera CPU机架集成256块液冷CPU,运行效率达到传统CPU的两倍,运算速度提升50%,进一步提升AI模型验证环节的效率。
针对智能体系统低延迟、长上下文的核心需求,英伟达同步推出Groq 3 LPX推理加速机架。该系统配备256个LPU处理器,与Vera Rubin平台结合后,每兆瓦推理吞吐量最高可提升35倍,有效解决智能体AI运行过程中的延迟问题,适配长上下文的运算需求。
数据存储环节的技术升级同样亮眼,全新BlueField-4 STX机架构建起AI原生存储基础架构。依托全新的DOCA Memos框架,该系统能高效处理大型语言模型生成的海量键值缓存数据,在显著降低能耗的同时,将推理吞吐量最高提升5倍,让AI多轮交互的响应速度大幅加快,更好地匹配智能体AI的实际应用场景。(纯钧)
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
申通快运与宁德时代达成战略合作,加速物流新能源转型
人民财讯3月28日电,3月26日,申通快递与宁德时代正式签署战略合作协议,双方将围绕绿色物流、车辆电动化、充换电设施、电池全生命周期管理等领域展开深度协同,助力快递行业低碳转型与高质量发展。
NASA阿尔忒弥斯2号开启绕月之旅,4月20日发射在即
IT之家 3 月 28 日消息,美国国家航空航天局(NASA)正在为“阿耳忒弥斯 2 号”载人绕月任务做最后准备,计划最早于美东时间 4 月 1 日 18:24(IT之家注:北京时间 4 月 2 日
苹果设高额奖金防挖角,Claude新模型与小米汽车改名
NeurIPS 道歉:禁止中国机构投稿系「沟通误解」,已更新规则防止人才被挖,苹果向设计师发放高额奖金Gemini 推出记忆导入功能Claude 新模型曝光,最新称「将带来前所未有的安全风险」索尼
斯坦福团队新研究:合成数据助力RAG训练效果反超,成本大降
在大模型商业化落地的进程中,医疗、金融等高精尖垂直领域,始终面临着一个核心难题:既要严控回答准确率、杜绝AI幻觉,又要控制部署成本,适配更多实际应用场景。长期以来,业内早已形成定论,检索增强生成(R
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

