当前位置: 首页
AI资讯
Meta第二代自研AI芯片性能提升三倍以上

Meta第二代自研AI芯片性能提升三倍以上

热心网友 时间:2026-05-28
转载

不久前,Meta宣布将斥资150亿美元采购60多万块GPU,这还不算系统成本。就在大家以为Meta准备把所有筹码押在GPU上时,它悄然放出了下一代自研AI芯片——MTIA v2。

基于5nm打造,性能三倍以上

相比上一代MTIA v1,MTIA v2的工艺从台积电7nm升级到了5nm,主频也从800MHz提升至1.35GHz。得益于工艺改进,尽管晶体管数量大幅增加,芯片面积仅增加了12%。

MTIA v2芯片 / Meta

性能提升的核心在于算力。根据Meta给出的数据,其GEMM算力达到354TFLOPS/s(INT8),SIMD算力达到11.06TFLOPS/s(INT8),相较上一代均提升了3倍以上。接口也从8x PCIe 4.0升级到8x PCIe 5.0,带宽直接翻倍。算力的飞跃除了工艺升级,很可能也与内核迭代有关。结合晶心科技与Meta合作开发数据中心AI处理器的消息来看,MTIA v1很可能采用了晶心科技的首个商用RISC-V矢量处理器内核NX27V,而MTIA v2则大概率用上了最新的AX45MPV内核——三倍以上的性能提升幅度与MTIA的算力提升吻合,当然,这目前还只是推测。

值得注意的是,与同期发布的英特尔Gaudi 3不同,MTIA v2在内存配置上依然没有选择HBM。片上内存只有256MB,片外内存选用了LPDDR5。虽然片上内存带宽高达2.7TB/s,但这注定了MTIA v2很难高效承载大模型应用。在硬件堆料之下,MTIA v2的功耗也来到了90W,相比MTIA v1的25W有较大幅度增加。不过与H100的能耗比相比,MTIA v2仍有明显优势。这也意味着上一代的服务器方案可能不再适用,Meta为此为新翻跟斗打造了全新的机柜系统。单个机架由三个底盘构成,每个底盘塞进12块板卡,每块板卡集成2个翻跟斗——也就是说,单个机架共有72个MTIA v2翻跟斗,单机柜至少需要6000W的电源供应。若要实现多机架扩展,还可以加入RDMA NIC。

Meta表示,这样的性能成绩离不开硬件本身的提升,也归功于在优化内核、编译器和运行时上的持续投入。随着后续开发生态进一步成熟,针对特定模型进行优化的时间会进一步缩短,而且未来还有不少空间可以继续挖掘芯片的效率潜力。

软件栈引入新的编译器

伴随新硬件的发布,Meta也在软件栈上加大了投入。作为PyTorch的开发者,MTIA的软件栈从设计之初就实现了与PyTorch 2.0的完全集成,并支持TorchDynamo和TorchInductor等新特性。与此同时,为了简化应用开发者的工作,为MTIA v1开发的代码也能向下兼容新的MTIA v2硬件。Meta透露,由于已将全部软件栈集成在新芯片内,发布之际,他们已经在自己的服务器上用MTIA v2跑了一段时间了。正是因为有这种兼容的软件栈方案,Meta可以在九个月内让商用模型运行在16个地区的服务器上。

为了为全新的MTIA硬件生成更高性能的代码,Meta还打造了一套新的Triton-MTIA编译器。Triton是由OpenAI开发的开源语言和编译器,用于编写高效的ML计算内核。它极大地提高了开发者编写GPU代码的速度,而Meta发现Triton同样适用于MTIA这类非GPU的硬件架构。

写在最后

从MTIA v2的性能来看,这款翻跟斗不会替代Meta购置的大量GPU用于大语言模型,而是追求算力、内存带宽和内存容量之间的平衡,主攻排名和推荐类的大模型。这样一来,大容量的SRAM依然留给GPU,而Meta最大的收入来源——广告业务,则可以通过MTIA这类翻跟斗来降低成本。除了投资定制AI芯片和下一代GPU这样的计算芯片,Meta也强调会继续投资内存带宽、网络和容量相关的下一代硬件系统。不仅如此,Meta还在探索扩大MTIA的应用范围,未来可能会支持GenAI负载。

来源:https://m.elecfans.com/article/2698859.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程