Graphcore首次MLPerf结果公布,AI性能保持领先
最近,AI行业最权威的基准测试MLPerf放榜了。Graphcore(拟未科技)首次提交就交出了一份相当亮眼的成绩单:在IPU-POD64系统上,BERT训练时间仅9分多钟,ResNet-50训练时间也只有14 5分钟——这个性能已经达到超级计算机级别。更关键的是,MLPerf还对比了Graphco
最近,AI行业最权威的基准测试MLPerf放榜了。Graphcore(拟未科技)首次提交就交出了一份相当亮眼的成绩单:在IPU-POD64系统上,BERT训练时间仅9分多钟,ResNet-50训练时间也只有14.5分钟——这个性能已经达到超级计算机级别。更关键的是,MLPerf还对比了Graphcore系统和NVIDIA最新产品的“每美元性能”,结果显示Graphcore在这一指标上稳居领先。对客户来说,这项由第三方验证的测试,确认了Graphcore系统不仅在新一代AI模型上表现优异,即使是在当前主流的应用场景里,也跑得更快、更划算。
MLPerf基准测试
Graphcore首次提交MLPerf训练版本1.0,聚焦在两类最核心的应用上:图像分类(ResNet-50 v1.5)和自然语言处理(BERT-Large)。图像分类用的是ImageNet数据集,自然语言处理则选取了BERT-Large中一个代表性片段(约占总训练计算量的10%),基于维基百科训练。为什么选这两个?不少客户和潜在客户最常跑的就是这些模型,他们的实际需求驱动了这次提交。测试结果也证明了,Graphcore系统完全能扛住当今AI计算的要求。
参与测试的两套系统——IPU-POD16和IPU-POD64——都已经在生产中交付给了客户。
- IPU-POD16:紧凑的5U系统,标价149,995美元。由4个1U的IPU-M2000加一台双CPU服务器组成,提供4 PetaFLOPS AI处理能力。适合刚开始搭建IPU计算能力的企业。
- IPU-POD64:纵向扩展版本,包含16个IPU-M2000和数量灵活的服务器。Graphcore的架构实现了服务器与AI翻跟斗的解耦,客户可以根据工作负载自定义CPU与IPU的配比。比如计算机视觉任务对服务器需求更高,而自然语言处理则相对较低。本次MLPerf提交中,BERT测试用了1台服务器,ResNet-50用了4台,每台服务器均由2颗AMD EPYC CPU驱动。
MLPerf的提交分为封闭分区和开放分区。封闭分区要求所有提交者使用完全相同的模型实现、优化器方法、超参数和训练轮次——可以说是“开箱即用”的硬指标。开放分区则保证同等模型精度,但在实现上更灵活,允许针对特定硬件做优化。对于Graphcore IPU这种创新架构,开放分区显然更能发挥优势,但Graphcore在封闭和开放两个分区都做了提交,而且结果都不错。封闭分区表现出色,而开放分区则通过优化部署,把IPU和系统的潜力充分释放出来。这更贴近真实应用场景——客户在实际部署中完全可以持续优化,不断提升性能。

“每美元性能”指标
MLPerf虽然叫“比较基准”,但直接比较其实挺复杂。如今的处理器和系统架构千差万别,有的是简单硅片,有的是带昂贵内存的复杂堆叠芯片。哪种更划算?从“每美元性能”角度看,往往最说明问题。
Graphcore的IPU-POD16,5U机箱,标价约15万美元。它由4个IPU-M2000翻跟斗和标准服务器组成,每个IPU-M2000内部有4个IPU处理器。对比一下,MLPerf中使用的NVIDIA DGX-A100 640GB是6U机箱,标价约30万美元(基于市场情报和经销商定价),有8个DGX A100芯片。IPU-POD16的价格刚好是它的一半。进一步看,一个IPU-M2000的价格大致相当于一个DGX A100 80GB,而单个IPU的价格则只有其四分之一。
Graphcore在MLPerf对比分析中,采用了严格监管的封闭分区结果,并针对系统价格做了归一化。无论是ResNet-50还是BERT,Graphcore系统的每美元性能都优于NVIDIA产品。具体来说:在IPU-POD16上跑ResNet-50,每美元性能是NVIDIA的1.6倍;跑BERT,则是1.3倍。这样的经济性,可以帮助客户用更少的预算实现AI计算目标。更重要的是,由于IPU专为AI构建的架构特点,它还能解锁下一代模型和技术——这是很多通用芯片做不到的。
Graphcore高级副总裁兼中国区总经理卢涛表示:“首次提交MLPerf就获得如此出色的成绩,我们感到非常自豪。这次测试还会带给Graphcore客户更多价值,因为我们在准备阶段所做的所有改进和优化都会反馈到Graphcore软件栈中。全球范围内的Graphcore用户都会从MLPerf测试中受益匪浅,不仅局限于BERT和ResNet-50模型。我们将继续参与包括训练和推理在内的MLPerf测试,为追求更优性能、更大规模和添加更多模型,贡献Graphcore的所有智慧和力量。”
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Graphcore首次MLPerf结果公布,AI性能保持领先要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。
Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。
SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。
IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。
- 日榜
- 周榜
- 月榜
热点快看
