面包屑图标 当前位置: 首页
AI资讯
热点详情

NVIDIA刷新AI推理纪录 推出企业级A30/A10 GPU

AI热点日报
AI热点日报时间:2026-07-03
热点解读

NVIDIA AI平台这次又在MLPerf基准测试中刷了波存在感——从数据中心到边缘计算,所有类别的成绩都相当亮眼。 事情是这样的:2021年4月21日,NVIDIA正式宣布,其AI推理平台在最新一轮的MLPerf基准测试中,所有类别的性能都创下了新纪录。同时,他们还推出了两款新的GPU——A30和

NVIDIA AI平台这次又在MLPerf基准测试中刷了波存在感——从数据中心到边缘计算,所有类别的成绩都相当亮眼。

NVIDIA刷新AI推理纪录,推出面向企业级服务器的A30和A10 GPU

事情是这样的:2021年4月21日,NVIDIA正式宣布,其AI推理平台在最新一轮的MLPerf基准测试中,所有类别的性能都创下了新纪录。同时,他们还推出了两款新的GPU——A30和A10,目标很明确:让AI加速能覆盖到主流服务器市场。

MLPerf是什么?说白了,它就是业界公认的AI“体能测试”,涵盖了计算机视觉、医学影像分析、推荐系统、语音识别、自然语言处理等一系列常见工作负载。能在这个榜单上拿第一,含金量还是相当足的。

这次也是A30和A10的MLPerf首秀。这两款GPU的设计思路很清晰:既要性能,也要控制功耗。它们瞄准的正是企业在AI推理、训练、图形处理乃至传统企业级计算中的主流需求。从今年夏季开始,思科、戴尔科技、慧与、浪潮、联想这些大厂预计就会把它们装进自家最高容量的服务器里。

说到底,NVIDIA这次能拿下这么多纪录,靠的是整个AI平台的广度——从硬件到软件,一整套生态。软件层面的TensorRT和Triton推理服务器是关键,微软、Pinterest、Postmates、T-Mobile、USPS、微信这些头部企业都已经在用。

NVIDIA加速计算部门总经理Ian Buck的评价也挺直接:“AI正在改变各行各业,MLPerf也变成了企业做IT投资决策时的重要参考。现在,所有主要OEM厂商都提交了MLPerf测试结果,NVIDIA和伙伴们不只追求全球领先的AI性能,也在想办法——通过即将上市的A30和A10服务器——让AI变得更普及。”

MLPerf结果

先看点硬核数字。NVIDIA是唯一一家同时针对数据中心和边缘计算每项测试都提交了结果的公司。而且,在所有MLPerf工作负载中,NVIDIA都跑出了顶级性能,没留什么悬念。

值得注意的是,很多测试结果是基于Triton推理服务器提交的。Triton这个工具的好处在于,它支持所有主流框架的模型,既能在GPU上跑,也能在CPU上跑,而且针对批处理、实时、串流传输等不同的查询类型都做了优化。说白了,它能大大简化AI部署的复杂度。在配置相当的情况下,采用Triton提交的成绩,几乎逼近了最优化的原生GPU或CPU实现。

还有一个亮点值得单独拎出来:NVIDIA首次用Ampere架构的多实例GPU(MIG)特性,在一个GPU上同时开启7个MIG实例,把所有7项MLPerf离线测试同时跑了一遍。结果呢?每个实例的独立性能几乎和单跑时一模一样。

这个测试展示的是MIG的通用性——基础设施经理可以根据具体应用需求,精确配置GPU算力,让每块数据中心GPU的利用率都拉到最高。

除了NVIDIA自己提交的结果,还有一大波合作伙伴提交了总计360多项基于NVIDIA GPU的测试数据,包括阿里云、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、超微,阵容确实够齐。

NVIDIA不断拓展的AI平台

A30和A10只是NVIDIA AI平台的新成员。整个平台包括Ampere架构GPU、Jetson AGX Xa vier、Jetson Xa vier NX,以及一整套经过AI加速优化的软件栈。

A30这卡定位很明确——给行业标准服务器提供通用的AI加速能力,适合推荐系统、对话式AI、计算机视觉这些主流企业级工作负载。

A10则更偏向混合场景:既能加速深度学习推理,也能搞定交互式渲染、计算机辅助设计和云游戏。通过搭配NVIDIA虚拟GPU软件,它还能帮企业更好地管理设计师、工程师、艺术家和科学家的虚拟桌面,提升利用率、简化配置。

至于边缘侧,NVIDIA Jetson平台靠的是Xa vier系统级模块,能在功耗不到30W的情况下提供服务器级的AI性能。机器人、医疗健康、零售这些领域的创新应用,很多就靠它来跑。

供货

NVIDIA A100 GPU目前已经在主流服务器制造商的服务器、各大云服务商的云端,以及NVIDIA DGX系列产品(包括DGX Station A100、DGX A100和DGX SuperPOD)中供货。

A30和A10(功耗分别为165W和150W)预计从今年夏天开始,就会出现在各类服务器里——包括经过严格测试、确保在多种工作负载下都能保持高性能的NVIDIA认证系统。

Jetson AGX Xa vier和Jetson Xa vier NX系统级模块,全球经销商那里已经能买到了。

至于软件,Triton和TensorRT现在都可以通过NVIDIA的NGC软件目录获取。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:NVIDIA刷新AI推理纪录 推出企业级A30/A10 GPU要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://m.elecfans.com/article/1584940.html
企业级服务

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 09:10
小米MiMo-V2系列模型2026年6月30日下线,Pro版已自动切换至V2.5

小米MiMo开放平台宣布,MiMo-V2系列的四款模型将于2026年6月30日正式下线,平台已推动开发者向V2 5系列迁移。具体涉及mimo-v2-pro、mimo-v2-omni、mimo-v2-flash和mimo-v2-tts模型。平台设置了系统替换时间作为缓冲:pro和omni模型于2026

AI热点2026-07-04 09:10
款长安猎手K50重庆车展上市14.19万起

2026重庆车展上,2026款长安猎手K50正式上市,共推出10款车型,售价14 19万至17 89万元。新车主要针对续航、电池和动力进行升级,搭载2 0T增程系统与双电机,纯电续航超180公里,快充仅需16分钟。全系标配30kW外放电功能,储备电量达239kWh,并新增山地与涉水模式,提升通过性。

AI热点2026-07-04 09:10
上期所与普陀区签战略协议深化金融区域联动

上海期货交易所与上海市普陀区人民政府于6月12日签署战略合作协议,旨在建立长期共赢的合作机制,共同服务上海国际金融中心与国际贸易中心的联动发展。双方高层领导均出席签约仪式,彰显了对此次合作的高度重视。协议聚焦于发挥期货市场专业资源与区域发展综合优势,深化务实合作,探索金融创新与实体经济深度融合,以期

AI热点2026-07-04 09:09
世纪华通平价大宗交易成交757万股 金额1.09亿元

6月12日,世纪华通发生一笔大宗交易,以每股14 37元的价格成交757 24万股,成交总额为1 09亿元。值得注意的是,该成交价与当日市场收盘价持平,属于平价交易。此次交易额占该股当日总成交额的1 51%。市场分析认为,平价成交反映了买卖双方对当前股价水平的共识,交易行为相对平稳,未对市场预期造成

延伸阅读