亚马逊部署Cerebras芯片方案,极速推理驱动AI变革
亚马逊云服务与芯片初创公司Cerebras宣布达成多年合作协议,将在其数据中心部署Cerebras芯片,用于AI推理计算。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
3月13日周五,根据双方公布的协议,亚马逊云服务将把Cerebras芯片与自研Trainium芯片组合部署,以提供更高速的推理计算服务。
这也是继今年1月OpenAI与Cerebras签署逾百亿美元合作协议之后,这家初创公司再度获得大型科技巨头背书。
Cerebras将其芯片标榜为"极速推理解决方案",并表示它们可以处理被称为"解码"的复杂任务,即推理计算阶段,人工智能模型在此阶段对用户查询做出响应,速度比英伟达的GPU快25倍。
此次合作对Cerebras的商业版图具有重要意义。Cerebras首席执行官Andrew Feldman表示:
越来越多人开始使用人工智能,使用频率也越来越高,并且用它来解决更复杂的问题。这使得Cerebras-Trainium解决方案能够接入最大的云平台,让我们有机会接触到大量的客户。
推理市场崛起,GPU主导地位受压
AI行业算力需求的重心正悄然转移。
随着AI工具和智能体的用户规模迅速扩张,训练阶段的算力需求趋于饱和,推理计算的重要性日益凸显。企业普遍认识到,GPU虽在模型训练中表现出色,但在要求极致响应速度的推理工作负载上并非最优选择,这促使各方加快多元化供应商布局。
AWS作为全球最大的云服务提供商,此前主要依赖旗下Annapurna Labs半导体业务设计的Trainium芯片为数据中心提供算力支持。
此次引入Cerebras芯片,意在弥补Trainium在高速推理场景下的局限,并在推理产品线上提供分层定价方案,速度较慢的纯Trainium服务将以更低价格提供,而Cerebras与Trainium的组合方案则定位高端。
AWS联合创始人、副总裁Nafea Bshara表示,该公司的目标是"持续推进速度提升并降低价格"。Feldman则直言:
如果你希望获得快速token输出,如果速度对你至关重要,如果你在从事代码或智能体工作,我们不仅是绝对最快的,而且我们意在设定行业标准。
英伟达压力加剧,定制芯片势力扩张
这笔交易是英伟达面临日益激烈竞争的缩影。
定制处理器设计商正以专项场景突破的方式蚕食英伟达的市场份额,客户对更快速度和更低成本的诉求也在倒逼芯片巨头加速产品迭代。
据报道,英伟达去年12月与芯片初创公司Groq签署了一项价值200亿美元的授权协议,并计划于近期发布采用Groq技术、专门面向推理场景的新型处理系统。
对Cerebras而言,与AWS的合作发生在其业务高速扩张的关键节点。
今年2月,Cerebras宣布完成10亿美元新一轮融资,累计融资总额升至26亿美元,投后估值约为230亿美元。
今年1月,ChatGPT开发商OpenAI签署了一项价值逾百亿美元的协议,部署Cerebras芯片为其旗舰聊天机器人提供算力支持,OpenAI计划使用Cerebras芯片部署最高750兆瓦的算力。
这家初创公司背后汇聚了富达管理、Atreides Management、Benchmark、Tiger Global和Coatue等一线机构投资者的支持,但此前曾一度面临融资困难。
Cerebras曾于2024年9月提交IPO申请,但约一年后撤回了上市文件。上市计划何时重启,目前尚无定论。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
探秘第四代高能同步辐射光源HEPS限时打卡指南
在粒子物理与核探测技术领域,要捕捉并解析那些瞬息即逝的基本粒子和高能射线,必须依赖一种特殊的“感知之眼”——粒子探测器。而构成这双“眼睛”最核心的感光部件,往往是一块块高度纯净、性能卓越的人工闪烁晶体。这类晶体能够将高能粒子或射线所携带的能量,高效转换为可供记录与分析的光信号,从而成为现代高能物理实
杭州街道遭电商抵制背后:无理由退货引发的规则博弈
近期,杭州萧山区盈丰街道被国际奢侈品牌圣罗兰列入“发货黑名单”的消息,在电商圈内引发广泛关注。业内人士分析,这很可能是商家针对特定区域恶意退货率持续偏高所采取的无奈之举。事实上,将某个地区甚至具体街道设置为限制发货区域,在技术层面已十分成熟,且近期类似操作已在全国多地悄然出现。 有电商经营者透露,尽
莫氏鸡煲为何开业仅一月就客流锐减无人排队
流量时代的风口,生命周期往往短得惊人,能撑过三个月都算幸运儿。这背后,是注意力经济的残酷法则。 不知道各位还记不记得,一个月前全网刷屏的那家“最不想火的鸡煲店”?当时,老板老莫对着镜头直言味道一般,劝大家别跟风,甚至贴出告示提醒“喝汤可能拉肚子”。结果呢?这股“爱来不来”的桀骜劲儿,反而引爆了网络,
谷歌披露黑客利用AI开发零日漏洞攻击工具
谷歌安全团队近期披露了一起具有里程碑意义的网络攻击事件:一个网络犯罪组织利用人工智能技术,成功开发出一款能够自动探测并试图利用某款主流系统管理软件中未知安全漏洞的黑客工具。 这起事件的性质远超普通网络攻击。根据谷歌发布的详细报告,这是全球首次有确凿证据证实,人工智能被直接用于生成针对“零日漏洞”的自
2030年车企生死线:300万辆销量成行业新基准
当北京车展的聚光灯聚焦于新车发布时,一场关于未来生存法则的深度思考,正在行业内部引发广泛共鸣。 就在许多车企仍在为年度销量目标奋力冲刺之际,长安汽车已将战略视野投向了更具决定性的2030年。在中国长安汽车集团总裁赵非看来,那并非一个遥远的未来,而是一道严峻的行业“分水岭”。他近期明确提出了判断车企生
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

