面包屑图标 当前位置: 首页
AI资讯
热点详情

卡帕西李飞飞辛顿投资的Transformer芯片签10亿美元大单

AI热点日报
AI热点日报时间:2026-07-01
热点解读

一家专注Transformer专用芯片的初创公司Etched成功流片,获8亿美元融资及10亿美元订单。其自研低电压推理与集群内存技术,实现万亿参数大模型高效推理,性能远超传统GPU,首批机柜计划今夏出货。

一家专注于研发Transformer专用芯片的AI芯片初创公司,近日成功完成了流片,并同步宣布了一系列重大进展:不仅成功筹集了高达8亿美元的资金,还欣喜地拿下了价值10亿美元的客户大单。备受关注的行业大佬卡帕西、李飞飞、辛顿,均是这家公司的投资人。

这家备受瞩目的公司就是Etched

它成立于2022年,当其他AI芯片创业公司纷纷强调兼容性、通用性和生态系统时,Etched从创立之初便一心一意地投入到Transformer专用芯片的研发中。在很长一段时间里,Etched并未太多公开露面。然而,在六月的最后一天,它突然高调宣布走出隐身模式,一次性公布了多项成果。Transformer专用芯片成功流片、巨额融资到账、大客户订单也随之而来。

公司的官方账号还透露,基于目前的进度,他们已经制造出了第一批机柜。“早期客户测试表明,我们在推理工作负载方面实现了最先进的吞吐量、延迟和能效表现。” 古人云“不鸣则已,一鸣惊人”,大概说的就是这种情形。

作为重要资方之一的卡帕西也难掩激动之情:

Etched突然高调亮相,干了一票大的

在Etched官方推特账号突然高调发声之前,外界对它的印象,大多还停留在“一家只为Transformer做AI芯片的初创公司”。这一次,它冷不丁地宣布了一大堆进展,表明如今它的业务早已超越了单一芯片的范畴。

综合目前的信息来看,Etched正从芯片、机柜、软件到制造方法进行一体化设计,致力于打造一套面向前沿模型推理的完整集群系统。

首先是芯片和机柜。官网信息显示,今年早些时候,Etched的A0版芯片已经从台积电的N4P工艺流片并成功回片。如今推出首款机柜产品,主要是为了满足那笔10亿美元大单的需求。公司明确表示第一批机柜计划于今年夏天开始出货,这意味着Etched的商业化进程已经正式提上日程。

至于软件与制造方法层面——根据官方说法,其推理系统是为前沿模型量身打造的,能够覆盖万亿参数级别的MoE(混合专家模型)、长上下文以及Agent工作负载。为了高效运行这些复杂任务,Etched协同设计了全新的芯片、封装、PCB、冷板、互连等核心组件。

此外,Etched还引入了低电压推理(LVI)技术,特别适用于高吞吐量工作负载。这里有一个技术背景:AI芯片如果不进行热节流,其浮点运算能力将难以扩展。随着浮点运算能力的提升,芯片会消耗更多电力,并导致时钟频率降低。这通常会导致芯片持续的推理吞吐量,远低于其峰值浮点运算能力的一半。

针对这一痛点,Etched设计了一种全新的架构,使得芯片的数学模块能够在不到大多数AI芯片一半电压的条件下稳定运行。

这一设计使得芯片的浮点运算密度,相比当前的AI芯片提升了数倍。

官方推特称,这套设计能够让万亿参数级别的稀疏MoE模型,在80%以上的峰值FLOPs下运行,同时避免出现热降频现象。要实现这一点,必须从晶体管到token层面进行全局统筹设计,这包括了可拆分数学阵列、电路技术、tiling和调度算法、供电网络、VRM架构、高级封装以及冷板设计等一系列创新。

与此同时,Etched还推出了适用于低延迟工作负载的集群规模内存(CSM,Cluster-Scale Memory)。当前采用HBM的AI芯片,受限于内存子系统和互连瓶颈,很难达到接近SRAM的解码速度;而纯SRAM架构的芯片虽然延迟很低,但往往在浮点运算密度和内存容量上存在局限,难以兼顾高吞吐量。通常,我们不得不在两者之间做出取舍:要么以较慢的速度提供推理服务,要么缩小批量运行规模,从而承受更高的成本。

在运行巨型MoE模型时,token需要在不同的专家之间进行路由,数据必须穿过多层内存体系与网络交换网络才能抵达目标专家。每增加一层内存层级,延迟就会增加一分;因此,从延迟优化的角度来看,最好的内存层级,某种意义上就是“少一层是一层”

为此,Etched团队设计了一种新架构,在整个scale-up域内构建了一个共享的低延迟内存池。他们采用了专有的超低延迟、高带宽互连技术,大幅提升了跨芯片的内存访问速度。这种基于HBM/SRAM的混合设计方案,同时解决了容量和内存间延迟(mem2mem)的问题,使得高吞吐与强交互性得以兼得。

“CSM不仅显著改善了延迟表现,同时也避免了当前纯SRAM芯片、3D DRAM芯片或光互连方案在成本、可靠性、良率、散热及算力方面的种种权衡取舍。”

这家公司究竟有何来头?

公司还透露,目前团队已拥有超过400名工程师,他们分别来自英伟达、谷歌TPU、博通、SK海力士、台积电等行业巨头。说到团队,我们来详细介绍一下创始“三剑客”。

这个团队身上的标签,非常符合人们刻板印象中的“硅谷范儿”。毕竟,“哈佛辍学生创业团队”是他们最为醒目的身份标签。

CEO名叫Gavin Uberti(下文简称G哥),是“为Transformer制造专用AI芯片”这一理念的最早推动者。本科阶段他考入哈佛大学,一边深入学习数学与计算机相关课程,一边开始接触AI编译器优化与系统层面的问题。在2020年到2022年期间,G哥先后在多家公司实习,包括一家专注于端侧AI和低功耗计算的初创公司(后被苹果收购)、一家从事高等教育学术运营管理软件的公司,以及一家致力于机器学习模型部署与推理基础设施的公司。他的工作经历涵盖了编译器优化、算法开发以及后端工程。

2022年,Etched的雏形诞生。在研究Transformer推理过程时,G哥逐渐形成了自己的判断:推理性能的瓶颈,根源在于底层计算架构与Transformer工作负载之间的不匹配。因此,他的思路从“优化模型”转向了“重构计算系统”。G哥后来在接受采访时多次回忆道,“正是对Transformer未来发展趋势的判断,推动着我和团队押注于专用芯片的研发”。

另外两位联合创始人Chris Zhu和Robert Wachen同样也是哈佛校友(辍学版)。想要创业的G哥,随即拉上了校园里的合作伙伴Chris一同退学创业,媒体普遍评价这位联合创始人“更侧重于工程实现与系统落地”。到了2023年,当两人明确要走芯片路线后,他们成功获得了约550万美元的种子轮投资,并顺势拉拢了Wachen入伙。Wachen的背景同样聚焦于计算机方向,在校期间,他重点关注计算机系统基础、软件与硬件之间的抽象关系理解,以及工程实现思维这三个维度。

创业的第二年,兄弟三人共同入选了2024届Thiel Fellowship(蒂尔奖学金)。Thiel Fellowship是由彼得·蒂尔(Peter Thiel)创办的一个奖学金/创业扶持项目,面向22岁以下的年轻人,鼓励他们暂停或放弃大学学业,直接投身创业、研究或项目实践。怪不得能成为Etched创业核心“三剑客”,一个创始团队所有成员同时入选同一届Thiel Fellowship的情况,确实相当罕见。

00后、哈佛、哈佛辍学创业、AI、Transformer专用芯片……听下来,是不是觉得这个团队身上的硅谷范儿标签烙印得更深了?

公开的融资记录显示,Etched在2023年完成了种子轮融资,金额大约在536万到540万美元之间。2024年6月,Etched对外宣布完成了1.2亿美元的A轮融资,并同步推出了首款芯片,强调这是首款专为Transformer模型设计的ASIC(专用集成电路),主打高吞吐量推理。当时给出的宣传语是:

一台搭载8颗芯片的服务器,在运行Llama 70B模型时,其token吞吐量可以远超8卡H100的配置。

不过,当时这些都还停留在理论阶段,直到今天才正式宣布流片成功。

同年10月,他们又与Decart合作,公开发布了名为“Oasis”的项目,号称是“首个可玩的AI生成游戏”。这是一个“可以用键盘操控,但整个世界由模型逐帧生成”的交互式生成系统。在合作中,Decart负责世界模型本身的训练、架构设计以及“利用Transformer实现实时视频生成”的核心算法。而Etched则负责推理侧优化和系统层面,重点在于如何让扩散Transformer在H100级别的GPU上达到接近实时的帧率,并将这种能力无缝映射到他们未来的专用芯片上。这可以说是Etched迄今为止最会“讲故事”的一次产品演示了。

之后,Etched进入了一段相对低调的潜伏期,只在去年年末、今年年初时,有消息曝出他们又完成了一轮5亿美元的融资,投后估值达到50亿美元。既然官方已经宣布第一批机柜将于今年夏天对外发售,走到这一步,故事显然已经不能仅靠“天才休学生创业”这种标签来支撑了。客户的机房部署、实际负载的稳定运行、以及真金白银的验收,才是Etched接下来要打的硬仗。

[1]https://x.com/Etched/status/2071972062202343590?s=20
[2]https://x.com/patrick_oshag/status/2071972025896489452?s=20
[3]https://x.com/karpathy/status/2072061140943921550?s=20

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:卡帕西李飞飞辛顿投资的Transformer芯片签10亿美元大单要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.qbitai.com/2026/07/441183.html
芯片

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-01 21:45
KwalAI Chrome插件 专业高效实用AI智能浏览器在线助手工具

在招聘这个行业中,数据录入的繁琐程度相信大家都有切身体会。每天需要从各类网页、社交平台、招聘站点中搜寻候选人信息,再手动一条条录入系统,既耗时费力又容易出错。今天要介绍的这款Kwal Chrome插件,正是为了彻底解决这一痛点而设计的。什么是 Kwal Chrome 扩展程序 插件?该插件的定位十分

AI热点2026-07-01 21:45
Twinning AI创建AI克隆与粉丝聊天获利

网红经济正在进化——Twinning AI带来的玩法是:粉丝可以直接跟你的人工智能分身聊天,而你,每次互动都能收到真金白银。它集成了专业的声音克隆、文本和语音消息,以及数据分析能力,让粉丝互动变得既有趣又能变&现。 什么是Twinning AI? 简单来说,Twinning AI允许网红创建一个属于

AI热点2026-07-01 21:45
Invoicemint人工智能发票与财务管理软件

在跨境电商和全球业务快速发展的今天,发票与财务管理工具的重要性日益凸显。AI技术的加入,让这些原本繁琐的流程实现了质的飞跃。Invoicemint 正是这样一款专注全球企业的智能发票与财务管理软件——它不只是一个简单的发票生成器,而是一套覆盖从开票、对账到税务合规、催款的全链路解决方案。 什么是In

AI热点2026-07-01 21:45
MyWhy实时AI语音心理治疗师

想象一下,你随时都能找到一个倾听者——不带任何偏见,不会感到疲惫,而且完全匿名。这听起来像科幻小说里的情节,但现在已经成为现实。MyWhy 就是这样一款 AI 心理治疗应用,它将专业的情感支持装进你的口袋,让心理健康服务不再是奢侈品,而是像打开手机一样触手可及。什么是MyWhy?简单来说,MyWhy

延伸阅读