当前位置: 首页
科技数码
AWS发布Trainium3 AI芯片:性能飙升,成本大降,加速下一代模型训练

AWS发布Trainium3 AI芯片:性能飙升,成本大降,加速下一代模型训练

热心网友 时间:2025-12-03
转载

在近期举办的全球云计算年度峰会上,亚马逊云科技(AWS)正式推出新一代自研AI训练芯片Trainium3,并同步发布了基于该芯片的Trainium3 UltraServer服务器。这款创新硬件组合通过架构革新与制程升级,为生成式AI模型的训练与推理提供了全新解决方案,标志着AWS在垂直整合计算资源领域迈出关键一步。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

根据技术规格披露,Trainium3芯片采用台积电3纳米制程工艺,单芯片集成144GB HBM3E内存,内存带宽高达4.9TB/s,在FP8精度下可提供2.52 PFLOPS的算力性能。其计算效率较前代产品实现四倍提升,能效比与内存带宽同步获得近四倍优化。通过新一代Neuron网络架构,芯片间通信延迟被压缩至10微秒以内,配合NeuronSwitch-v1技术实现的双倍内部带宽,有效解决了分布式训练中的通信瓶颈问题。

UltraServer服务器将硬件集成度推向新高度。单台设备最多可容纳144颗Trainium3芯片,形成20.7TB HBM3E内存池与706TB/s总带宽的超强计算单元,FP8算力峰值达362 PFLOPS。实测数据显示,该系统运行GPT-OSS开源模型时,单芯片吞吐量提升300%,推理响应速度加快4倍,显著降低企业应对流量峰值的硬件投入成本。目前Amazon Bedrock服务已率先在生产环境部署该硬件平台。

在应用场景方面,这套硬件组合展现出显著优势。对于千亿参数级模型训练,其可将训练周期从数月压缩至数周;面对智能对话、视频生成等高并发推理需求,能以微秒级延迟服务百万级用户。多家合作伙伴已验证其成本效益:Decart公司借助Trainium架构将实时视频生成速度提升4倍,同时将单位推理成本削减50%;生物科技企业Metagenomi则通过硬件优化将基因序列分析效率提升3.5倍。

为满足超大规模计算需求,AWS同步推出EC2 UltraCluster 3.0架构。该集群通过高速互联技术可连接数千台UltraServer,形成百万级芯片计算矩阵,较上一代规模扩大十倍。这种扩展能力使得在万亿token数据集上训练多模态模型成为可能,同时可为千万级用户提供实时推理服务,为自动驾驶、气候模拟等前沿领域提供基础设施支撑。

市场布局方面,AWS正面临双重挑战。一方面需应对谷歌TPU在AI芯片市场的持续渗透,特别是Anthropic等战略客户近期宣布将采购百万级谷歌芯片;另一方面要巩固与现有合作伙伴的关系——这家生成式AI公司仍计划年底前部署超百万颗Trainium2芯片,其中近半数将运行于Project Rainier超级计算机。为保持竞争力,AWS同步披露下一代Trainium4研发进展,新芯片在FP4精度下性能将提升六倍,FP8性能提升三倍,并首次引入NVIDIA NVLink Fusion技术实现异构计算协同。

这项技术整合计划引发行业关注。通过将Trainium4与Graviton处理器、EFA网络适配器部署在统一MGX机架,AWS旨在构建兼具成本优势与性能弹性的AI基础设施。这种模块化设计既支持纯CPU计算场景,也可灵活扩展GPU与Trainium混合架构,为不同规模的AI工作负载提供定制化解决方案。随着软硬件协同优化的持续推进,AI训练与推理的成本门槛有望进一步降低。

来源:https://www.itbear.com.cn/html/2025-12/1038348.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
训练AI只需要跑完前10%,剩下的90%都能在小模型上跑

训练AI只需要跑完前10%,剩下的90%都能在小模型上跑

训练AI模型如何避免“先膨胀后压缩”?全新方法实现边学习边瘦身 (来源:麻省理工科技评论) 训练大规模人工智能模型究竟需要付出多少成本?不仅仅是高昂的资金投入,时间、能源以及稀缺的计算资源,每一项都构成了巨大的挑战。 要获得一个更轻量、更高效的AI模型,传统策略通常面临两种选择:要么不计代价地训练一

时间:2026-04-14 19:02
深蓝汽车彭钱磊:2030年新能源规模或达1700万 共促行业健康发展

深蓝汽车彭钱磊:2030年新能源规模或达1700万 共促行业健康发展

聚焦智能电动汽车未来,一场高层论坛释放了哪些信号? 近日,北京国家会议中心二期举办了一场备受瞩目的智能电动汽车发展高层论坛。论坛以“推进新能源汽车智能化、绿色化、融合化、国际化发展”为核心议题,汇聚了行业众多领军人物,共同探讨产业未来的发展方向与核心路径。 深蓝汽车全球市场总经理彭钱磊在论坛上的发言

时间:2026-04-14 19:01
梦想照进现实?这戏码换得有点快 | 2026智·跃迁

梦想照进现实?这戏码换得有点快 | 2026智·跃迁

不一样的繁花,不一样的医博会 文 陈岩鹏 两年前在CMEF中国国际医疗器械博览会的现场见闻,曾催生一篇题为《不一样的繁花,不一样的医博会》的行业观察。彼时是2024年,国内被称为“AI医疗四小龙”的创新企业正全力从软件算法向硬件设备艰难转型,以应对GE医疗、佳能医疗等国际巨头“高端硬件+深度AI”的

时间:2026-04-14 19:01
从“一步到位”到“退后一步”,欧美电动化要从增程开始“补课”

从“一步到位”到“退后一步”,欧美电动化要从增程开始“补课”

欧美车企“回潮”增程技术,一场全球电动化的“时间差” 面对政策风向的波动与消费者对续航里程、充电便利性的持续焦虑,欧美汽车产业正出现一个值得关注的趋势。据《金融时报》报道,雷诺、Stellantis、大众等传统汽车巨头正重新评估并押注增程式电动汽车,将其视为电动化转型过程中的关键“过渡方案”。 车企

时间:2026-04-14 19:00
国内首款“养虾本”来了

国内首款“养虾本”来了

2026 04 14 一个核心趋势是:未来的商业竞争,本质上是用户注意力资源的争夺战。谁能更精准、高效地连接信息与用户需求,谁就能在市场中赢得关键优势。 本文配图深刻揭示了这种高效连接的底层逻辑与完整工作流。它系统展示了从数据采集到价值交付的闭环链路,每个环节都紧密耦合。实践证明,其中任一节点的效率

时间:2026-04-14 18:59
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程