面包屑图标 当前位置: 首页
AI资讯
热点详情

AI算力争夺战下一个Cerebras是谁

AI热点日报
AI热点日报时间:2026-05-29
热点解读

推理云服务商GeneralCompute选用SambaNova专用芯片,解决芯片获取与部署难题,完成1500万美元种子轮融资,投后估值6000万美元,专注AI推理阶段的高速低成本算力服务。

AI模型对算力的需求仍在持续攀升,这是所有人都看得见的趋势。但要想真正参与这场游戏,绕不开两个核心障碍:一是拿到合适的芯片,二是把这芯片塞进数据中心,让它真正开始产生收益。

AI算力争夺战中,谁会成为下一个Cerebras?

General Compute就是这么一家新冒出来的推理云服务商,专注的正是AI模型完成训练后的推理阶段——也就是模型实时运转、响应请求的那一环。这家公司对上述两大问题给出了自己的解法,而这些解法也在某种程度上揭示了AI生态接下来可能走向何方。凭借这套思路,General Compute完成了一轮1500万美元的种子轮融资,投后估值6000万美元,领投方是FUSE VC,Carya Venture Partners和Village Global Ventures也跟了进来。

那么,什么才算得上“合适的芯片”?GPU的需求早就涨上天了,但业界正在慢慢形成一种共识:GPU未必是跑AI模型的最优解。AI在推理阶段——也就是模型主动生成响应的过程——需要的算力结构与训练阶段是两回事。专门为推理设计的新一代芯片正在崛起。英伟达去年年底砸了200亿美元收购Groq,上周Cerebras又完成了570亿美元的IPO,这些都是风向标。

不过,Groq和Cerebras的产能都已经绷得很紧了。General Compute的联合创始人兼CEO Finn Puklowski和CTO Jason Goodison于是另辟蹊径——他们选择了SambaNova的专用芯片。SambaNova是一家从英特尔体系里走出来的公司,专攻推理芯片,这几年在硅谷的存在感稍微弱了一些。

但情况可能很快会有变化。SambaNova今年推出了新一代芯片,架构灵活性明显更强,推理计算时内存容量更大,能存储更多上下文。公司宣称,其性能不仅碾压GPU,也比Groq、Cerebras等同类专用芯片更胜一筹。Puklowski透露,新芯片的Token生成速度能达到每秒600到700个,而GPU大概只有每秒250个。

General Compute已经下了价值3亿美元的订单,购买SambaNova的SN50芯片,并且声称将成为首家部署这款芯片的云服务商。

这块芯片还顺手解决了第二大难题——部署场所的问题。SN50用的是风冷,不是水冷,功耗也更低,直接装进现有的数据中心就行,不用额外砸钱搞基础设施改造。

Puklowski目前正在忙着拓展托管合作——也就是把自家的硬件设备部署到合作伙伴的场地。合作对象不光是数据中心运营商,还包括加密货币矿工。原因很简单:比特币生产成本长期高于币价,这些矿工正愁手里的基础设施怎么转型再利用。

General Compute上周已经正式上线了云服务,并且宣称是目前跑MiniMax 2.7——一个很强大的开源大语言模型——速度最快的服务商。

风险投资人Joe Hassleman早在2021年就投了Groq,算是赶上了推理算力浪潮的早班车。今年他设立了专注于AI的新基金Evercrest Partners,第一个投资标的就选了General Compute。在他看来,SambaNova和General Compute的合作关系,有点像Corewea ve和英伟达的深度绑定,也类似Groq在芯片制造和它的前云服务之间的互动模式。

“他们确实得找到一批优质的客户,把芯片部署到高速增长的应用场景里去,”Hassleman说,“General Compute在赌SambaNova,SambaNova也在赌General Compute,这就是个互相反赌的局面。”

说到底,最核心的问题还是:在AI的未来图景里,哪种计算架构能成为最大的价值收割者?推理云服务的崛起,本质上是对一个多模型、多智能体并存世界的隐性押注——在那个世界里,没有哪家供应商能一家独大,推理的速度和成本才是决定胜负的关键。这周OpenRouter完成的1.13亿美元B轮融资,就是一个有力的印证——这家公司帮客户接入多个模型,优化Token使用成本。

在这个逻辑下,速度就是一切。速度快,直接决定了价格和性能的上限。Puklowski希望把编程智能体原本需要一小时才能完成的任务压缩到五到十分钟,同时让用在客服场景的语音智能体变得更经济实惠——这类智能体的对话流畅度高度依赖推理速度。“如果ChatGPT能给你每秒50个Token的输出速度,已经比人类阅读速度快多了,”Puklowski对TechCrunch说,“但现在场景已经进化到智能体之间互相协作,智能体要替我们去读信息、查数据库,它们需要更快。”

Q&A

Q1:General Compute到底是一家什么样的公司?主要做什么?

回答:General Compute是一家专门做AI推理阶段云服务的公司,说白了就是出租AI算力。推理阶段指的是模型训练完之后,实时响应用户请求的那一环。他们用的是SambaNova的专用推理芯片,主打高速、低成本的推理云服务。目前已经上线了云服务平台,并且声称是跑开源大语言模型MiniMax 2.7速度最快的服务商。

Q2:SambaNova的芯片比GPU和其他专用芯片强在哪?

回答:SambaNova新一代芯片在推理场景下的优势很明显:Token生成速度能达到每秒600到700个,是GPU(大约250个/秒)的两倍还多;架构更灵活,推理时上下文存储的内存也更大;而且用风冷、功耗低,不需要改造现有数据中心就能部署,能省下不少基础设施成本。SambaNova声称它的性能超过了GPU,也优于Groq、Cerebras等同类专用芯片。

Q3:为什么资本这么看重推理云服务这个方向?

回答:因为AI应用正在从单个模型回答问题,进化到多个智能体协同工作。智能体之间需要高速交互、实时读取数据,对推理性能的要求远超原来的人机交互场景。资本在押注一个多模型共存、没有单一供应商能通吃的AI生态——在这个生态里,推理云服务商很可能占据非常重要的价值节点。Groq、Cerebras的高估值,加上OpenRouter这周完成的1.13亿美元融资,都说明市场对这个赛道非常认可。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:AI算力争夺战下一个Cerebras是谁要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://ai.zhiding.cn/2026/0529/3188776.shtml
AI算力

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-06-07 22:49
智能知识库升级:从RAG到Agentic全文检索模式

今天接着聊AI智能知识库的话题。传统RAG模式是否还是最佳选择?相信不少朋友在实际使用中都有过类似的困惑:同一套大模型,为什么基于RAG搭建的知识库和通过AI辅助编程工具写出来的文章,在质量上有明显差异?之前我们聊过通过Cursor+Claude进行AI辅助写作的话题,也一直在思考这个关键问题——底

AI热点2026-06-07 22:49
Ubuntu本地部署MinerU完成文档解析

从实际部署经验来看,在Ubuntu系统上完成MinerU文档解析工具的安装配置,整体流程并不复杂。主要概括为三大步骤:先调整系统环境,接着安装MinerU本体,最后执行功能验证测试。 下面我们将每一步详细拆解,确保清晰易懂。好,直接开始操作。 1 系统环境配置 (1)检查CUDA环境和GPU状态 首

AI热点2026-06-07 22:49
走访近百家企业深度解析AI搜索营销五大关注问题

GEO(生成式引擎优化)正成为品牌在AI搜索时代的新战场,这篇文章将深度解析品牌最关注的五大问题,希望能帮助更多品牌提前布局、抢占先机。核心内容:1 GEO爆发的技术背景与行业痛点2 联网搜索带来的用户与企业双重价值3 品牌、产品、用户三大阵地的战略优先级走访了近一百家企业,行业涵盖了AI应用

AI热点2026-06-07 22:49
多智能体协作技术在运营商客户服务中的实践应用

走进行业,尤其是运营商领域,客户服务系统正经历一场由大模型与智能体技术推动的深刻变革。传统以规则引擎为核心的客服体系,在海量并发、跨系统联动和个性化服务需求面前,已经力不从心。接下来要探讨的,正是如何通过“多智能体协作”这一技术路径,来破解这些难题,并分享一些已经验证的实践经验。 背景:一场由需求驱

延伸阅读