Graphcore首次MLPerf结果公布，AI性能保持领先

AI热点日报时间：2026-07-03

热点解读

最近，AI行业最权威的基准测试MLPerf放榜了。Graphcore（拟未科技）首次提交就交出了一份相当亮眼的成绩单：在IPU-POD64系统上，BERT训练时间仅9分多钟，ResNet-50训练时间也只有14 5分钟——这个性能已经达到超级计算机级别。更关键的是，MLPerf还对比了Graphco

最近，AI行业最权威的基准测试MLPerf放榜了。Graphcore（拟未科技）首次提交就交出了一份相当亮眼的成绩单：在IPU-POD64系统上，BERT训练时间仅9分多钟，ResNet-50训练时间也只有14.5分钟——这个性能已经达到超级计算机级别。更关键的是，MLPerf还对比了Graphcore系统和NVIDIA最新产品的“每美元性能”，结果显示Graphcore在这一指标上稳居领先。对客户来说，这项由第三方验证的测试，确认了Graphcore系统不仅在新一代AI模型上表现优异，即使是在当前主流的应用场景里，也跑得更快、更划算。

MLPerf基准测试

Graphcore首次提交MLPerf训练版本1.0，聚焦在两类最核心的应用上：图像分类（ResNet-50 v1.5）和自然语言处理（BERT-Large）。图像分类用的是ImageNet数据集，自然语言处理则选取了BERT-Large中一个代表性片段（约占总训练计算量的10%），基于维基百科训练。为什么选这两个？不少客户和潜在客户最常跑的就是这些模型，他们的实际需求驱动了这次提交。测试结果也证明了，Graphcore系统完全能扛住当今AI计算的要求。

参与测试的两套系统——IPU-POD16和IPU-POD64——都已经在生产中交付给了客户。

IPU-POD16：紧凑的5U系统，标价149,995美元。由4个1U的IPU-M2000加一台双CPU服务器组成，提供4 PetaFLOPS AI处理能力。适合刚开始搭建IPU计算能力的企业。
IPU-POD64：纵向扩展版本，包含16个IPU-M2000和数量灵活的服务器。Graphcore的架构实现了服务器与AI翻跟斗的解耦，客户可以根据工作负载自定义CPU与IPU的配比。比如计算机视觉任务对服务器需求更高，而自然语言处理则相对较低。本次MLPerf提交中，BERT测试用了1台服务器，ResNet-50用了4台，每台服务器均由2颗AMD EPYC CPU驱动。

MLPerf的提交分为封闭分区和开放分区。封闭分区要求所有提交者使用完全相同的模型实现、优化器方法、超参数和训练轮次——可以说是“开箱即用”的硬指标。开放分区则保证同等模型精度，但在实现上更灵活，允许针对特定硬件做优化。对于Graphcore IPU这种创新架构，开放分区显然更能发挥优势，但Graphcore在封闭和开放两个分区都做了提交，而且结果都不错。封闭分区表现出色，而开放分区则通过优化部署，把IPU和系统的潜力充分释放出来。这更贴近真实应用场景——客户在实际部署中完全可以持续优化，不断提升性能。

“每美元性能”指标

MLPerf虽然叫“比较基准”，但直接比较其实挺复杂。如今的处理器和系统架构千差万别，有的是简单硅片，有的是带昂贵内存的复杂堆叠芯片。哪种更划算？从“每美元性能”角度看，往往最说明问题。

Graphcore的IPU-POD16，5U机箱，标价约15万美元。它由4个IPU-M2000翻跟斗和标准服务器组成，每个IPU-M2000内部有4个IPU处理器。对比一下，MLPerf中使用的NVIDIA DGX-A100 640GB是6U机箱，标价约30万美元（基于市场情报和经销商定价），有8个DGX A100芯片。IPU-POD16的价格刚好是它的一半。进一步看，一个IPU-M2000的价格大致相当于一个DGX A100 80GB，而单个IPU的价格则只有其四分之一。

Graphcore在MLPerf对比分析中，采用了严格监管的封闭分区结果，并针对系统价格做了归一化。无论是ResNet-50还是BERT，Graphcore系统的每美元性能都优于NVIDIA产品。具体来说：在IPU-POD16上跑ResNet-50，每美元性能是NVIDIA的1.6倍；跑BERT，则是1.3倍。这样的经济性，可以帮助客户用更少的预算实现AI计算目标。更重要的是，由于IPU专为AI构建的架构特点，它还能解锁下一代模型和技术——这是很多通用芯片做不到的。

Graphcore高级副总裁兼中国区总经理卢涛表示：“首次提交MLPerf就获得如此出色的成绩，我们感到非常自豪。这次测试还会带给Graphcore客户更多价值，因为我们在准备阶段所做的所有改进和优化都会反馈到Graphcore软件栈中。全球范围内的Graphcore用户都会从MLPerf测试中受益匪浅，不仅局限于BERT和ResNet-50模型。我们将继续参与包括训练和推理在内的MLPerf测试，为追求更优性能、更大规模和添加更多模型，贡献Graphcore的所有智慧和力量。”

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：Graphcore首次MLPerf结果公布，AI性能保持领先要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://m.elecfans.com/article/1649298.html

ai 处理器

上一篇：贸泽备货Xilinx Kria KV260视觉AI入门套件，加速视觉应用开发

下一篇：MCP协议在AI大模型中的致命缺陷

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周AI驱动的员工英语口语教练Lucida 02 / 本周Screenshot2Code：截图转代码工具 03 / 本周SpeakStruct 语音转结构化数据可自定义模板 04 / 本周AI驱动语音治疗应用 IzzyAI 05 / 本周Grammar AI人工智能雅思备考工具

01 / 本月AI驱动的员工英语口语教练Lucida 02 / 本月Screenshot2Code：截图转代码工具 03 / 本月SpeakStruct 语音转结构化数据可自定义模板 04 / 本月AI驱动语音治疗应用 IzzyAI 05 / 本月Grammar AI人工智能雅思备考工具

热点快看

07-03 20:42AI驱动的员工英语口语教练Lucida 07-03 20:42Screenshot2Code：截图转代码工具 07-03 20:42SpeakStruct 语音转结构化数据可自定义模板 07-03 20:41AI驱动语音治疗应用 IzzyAI 07-03 20:41Grammar AI人工智能雅思备考工具

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别