谷歌TPU追赶英伟达:成本降70%,性价比已持平
在AI资本开支保持高位运行、但商业化压力日益凸显的当下,市场关注的焦点正经历一场静默却深刻的转变:大型模型还能否延续“无视成本地奔跑下去”的势头?
据知情交易渠道透露,高盛最新发布的AI芯片研究报告,并未延续市场熟悉的“算力、制程、参数规模”对比框架,而是从更贴近商业现实的角度切入——聚焦推理阶段的单位成本。通过构建一条“推理成本曲线”,高盛试图回答一个对AI产业至关重要的问题:当模型进入高频调用阶段后,不同芯片方案在折旧、能耗和系统利用率等多重约束下,每处理一百万个token究竟需要付出多少真实代价。
研究结论指向了加速演进的行业变局:Google/Broadcom的TPU正在迅速缩小与英伟达GPU在推理成本上的差距。从TPU v6升级至TPU v7,单位token的推理成本下降约70%,使其在绝对成本层面已与英伟达GB200 NVL72基本持平,部分测算情形下甚至略具优势。
这并不意味着英伟达的领先地位被动摇,但它清晰地表明,AI芯片竞争的核心评价体系,正从“谁算得更快”,转向“谁算得更便宜、更可持续”。当训练逐渐成为前期投入,而推理成为长期现金流来源,成本曲线的斜率,正在取代峰值算力,成为决定产业格局的关键变量。
一、从算力领先到成本效率,AI芯片的竞争标尺正在切换
在AI发展的早期阶段,训练算力几乎决定了一切。谁能更快训练出更大的模型,谁就拥有技术话语权。然而,随着大模型逐步进入部署与商业化阶段,推理负载开始远超训练本身,成本问题被迅速放大。
高盛指出,在这一阶段,芯片的性价比不再仅由单卡性能决定,而是由系统层面的效率共同塑造,包括算力密度、互联效率、内存带宽以及能源消耗等多重因素。基于这一逻辑构建的推理成本曲线显示,Google/Broadcom TPU在原始计算性能和系统效率上的进步,已经足以在成本维度上与英伟达正面竞争。
相比之下,AMD和亚马逊Trainium在实际成本下降幅度上仍较为有限。从现阶段测算结果看,两者的单位推理成本仍明显高于英伟达和Google方案,对主流市场的冲击相对有限。
二、TPU成本跃迁的背后,是系统工程能力而非单点突破
TPU v7实现大幅降本,并非来自单一技术突破,而是系统工程能力的集中释放。高盛认为,随着计算芯片自身逐步逼近物理极限,未来推理成本能否继续下降,将越来越依赖“计算相邻技术”的进步。
这些技术包括:更高带宽、更低延迟的网络互联;高带宽内存(HBM)和存储方案的持续集成;先进封装技术(如台积电CoWoS);以及机架级解决方案在密度与能效上的提升。TPU在这些方面的协同优化,使其在推理场景中展现出明显的经济性优势。
这一趋势也与谷歌自身的算力部署高度一致。TPU在Google内部工作负载中的使用比例持续上升,已广泛用于Gemini模型的训练与推理。同时,具备成熟软件能力的外部客户也在加速采用TPU方案,其中最引人注目的案例是Anthropic向Broadcom下达的价值约210亿美元订单,相关产品预计将在2026年中开始交付。
不过,高盛同时强调,英伟达仍然掌握“上市时间”优势。在TPU v7刚刚追平GB200 NVL72之际,英伟达已推进至GB300 NVL72,并计划在2026年下半年交付未来架构产品。持续的产品迭代节奏,仍是其维持客户黏性的关键筹码。
三、投资含义再平衡:ASIC崛起,但英伟达的护城河尚未被击穿
从投资视角看,高盛并未因TPU的快速追赶而下调对英伟达的判断。该机构仍维持对英伟达及Broadcom的买入评级,认为二者最直接绑定AI资本开支中最具可持续性的部分,并将长期受益于网络、封装和系统级技术升级。
在ASIC阵营中,Broadcom的受益逻辑尤为清晰。高盛已将对其2026财年每股收益预期上调至约10.87美元,较市场一致预期高出约6%,并认为市场仍低估了其在AI网络与定制计算领域的长期盈利能力。
AMD和亚马逊Trainium当前仍处于追赶阶段,但高盛也指出,AMD的机架级方案存在后发优势的可能性。预计在2026年末,基于其MI455X的机架方案有望在部分训练与推理场景中实现约70%的推理成本下降,值得持续跟踪。
更重要的是,这份研报给出的并非“赢家通吃”的结论,而是一幅逐渐清晰的产业分工图景:GPU继续主导训练与通用算力市场,而定制化ASIC在规模化、可预测的推理负载中不断渗透。在这一过程中,英伟达的CUDA生态与系统级研发投入仍构成坚实护城河,但其估值逻辑也将持续接受“推理成本下行”的现实检验。
当AI真正进入“每一个token都要算回报”的阶段,算力竞争终究要回到经济学本身。TPU成本大幅下降,并非一次简单的技术追赶,而是一次对AI商业模式可行性的关键压力测试。而这,或许正是GPU与ASIC之争背后,市场最应认真对待的信号。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
奇瑞捷途F700皮卡申报图曝光 插电混动轴距达3350毫米
在工信部最新一期新车公示目录中,奇瑞旗下备受关注的“纵横F700”正式亮相。这款新车以皮卡形态申报,其产品类别明确为“插电式混合动力多用途货车”,标志着奇瑞正式进军新能源皮卡细分市场。 从申报信息来看,纵横F700拥有魁梧的车身尺寸。其长宽高分别为5495mm、2050mm和1985mm,轴距达到3
奔驰奥迪本田多款车型召回 国家市场监管总局发布最新公告
国家市场监督管理总局最新发布的召回公告,再次引发了广大车主对车辆安全性能的关注。此次涉及多个知名汽车与摩托车品牌,涵盖进口及国产车型,均因潜在安全隐患启动了主动召回。相关车主务必及时核查,这关乎您的行车安全。 奔驰G580:车轮螺栓的“极端”考验 梅赛德斯-奔驰(中国)汽车销售有限公司率先行动,宣布
国内外神经康复名家共议阿尔茨海默病非侵入神经调控新策略
在神经康复领域,一项前沿技术——经颅脉冲刺激,正为医生的“工具箱”带来革新,尤其为早期阿尔茨海默病的非药物干预提供了全新思路。2026年5月10日,由上海中医药大学附属岳阳中西医结合医院与中医智能康复教育部工程研究中心联合主办的“2026上海神经康复前沿科技国际论坛”盛大开幕。本次盛会汇聚了全球神经
图拉斯60W屏显充电器上架 圆形彩屏支持AVS协议售227.8元
图拉斯大眼仔屏显充电器新品现已登陆京东平台,即将于5月10日正式开启预约,并于5月13日启动首销。产品首发定价为338元,但首发期间到手价仅需227 8元,性价比优势显著。 外观设计上,这款充电器延续了大眼仔系列经典的圆柱造型,灵感源自家庭摄像头,提供黑色、白色与黄色三种时尚配色可选。其核心亮点在于
科技巨头股价飙升背后原因与市场影响分析
一则来自《华尔街日报》的重磅消息,在全球科技与半导体行业引发了广泛关注。据该报8日援引知情人士独家披露,苹果公司与英特尔正接近达成一项战略性合作协议,核心内容是由英特尔为苹果代工生产部分芯片。资本市场对此反应迅速:消息公布后,英特尔股价在8日收盘时强势上涨近14%,苹果股价也同步上扬约2%。 报道进
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

