面包屑图标 当前位置: 首页
AI资讯
热点详情

华人Token项目年入78亿暴涨38倍

AI热点日报
AI热点日报时间:2026-07-03
热点解读

领先的AI推理基础设施公司TogetherAI已获8亿美元融资,估值达83亿美元,年化收入11 5亿美元(约78亿元)。企业通过其创新平台以极低成本调用主流开源模型,推理成本下降6至20倍,月处理量超过400万亿token,过去两年间营收暴增38倍。

帮企业省token,正在变成一门炙手可热的生意

刚刚,Together AI完成了一笔8亿美元(约合软妹币54亿元)的融资。这让它的估值直接飙到了83亿美元(约合软妹币564亿元)。

它的核心逻辑并不复杂:帮企业以更低成本调用大模型,尤其是开源模型。

这一轮由沙特阿美旗下的Aramco Ventures领投,跟投名单里有Vista Equity Partners、General Catalyst、Emergence Capital,甚至英伟达和Salesforce Ventures也加入了。

上一次融资时,Together AI的估值还是33亿美元,现在已经翻了一倍还多。

更值得关注的是它的年化收入:11.5亿美元(约合软妹币78亿元)。

01 开源模型里的机会

Together AI成立于2022年,和ChatGPT同一年诞生。

创始团队技术积累深厚,亚裔面孔占了不小比例。

创始人兼CEO Vipul Ved Prakash,出生于印度新德里。他曾在德里圣史蒂芬学院学习数学、物理和计算机科学,随后退学投身软件开发。他联合创立过网络安全公司Cloudmark和社交媒体搜索公司Topsy。苹果收购Topsy后,他参与负责Siri的搜索和AI工作。

CTO张策2008年毕业于北大数学系,随后在威斯康星大学麦迪逊分校获得博士学位。他先后在苏黎世联邦理工学院和芝加哥大学任教,研究主线是让机器学习变得更便宜、更可信、更容易被广泛使用。

团队里还有几位大牛。

Chris Re是斯坦福大学计算机科学教授,也是连续创业者。他参与创办过SambaNova、Snorkel,以及被苹果收购的Lattice和Inductiv,在机器学习系统和AI基础设施领域很有分量。

Tri Dao(越南裔)是Together AI的首席科学家,也是普林斯顿大学计算机科学系的助理教授,曾在Chris Re门下读博。他是FlashAttention的主要作者之一,这项研究让Transformer在GPU上跑得更快、显存占用更少。

Percy Liang(华裔)是斯坦福基础模型研究中心主任,长期聚焦语言模型、开放模型和模型评测的工作。

Together AI的主要团队成员。(从左至右)上排依次是:普拉卡什、张策、克里斯·雷、特里·陶;下排是珀西·梁、首席产品官泽德莱夫斯基、首席营收官凯·马克、财务副总裁史美成。

ChatGPT爆火之后,市场的目光几乎都集中在闭源大模型上,但Together AI做出了不同的选择。

起初,它因为提供英伟达GPU访问权而受到关注,随后逐步扩展成一个帮助开发者构建、定制开源AI模型的平台。

客户留在Together AI,不是单纯为了GPU卡。他们需要一整套服务:模型选择、训练、微调、推理、部署、评估、GPU集群、专属端点、成本优化。

这才是Together AI真正的商业价值所在。

它卖的不是一个“更聪明的AI”,而是“更便宜、更稳定、更可控地使用AI”的能力。

02 调用token,年入11.5亿美元

Together AI最亮眼的数字不是8亿美元融资,而是11.5亿美元的年度化订单额。客户覆盖了Cursor、Cognition、Decagon等AI原生公司。

它的收入增长快得惊人。2024年2月,年化收入大约3000万美元;到2025年2月,这个数字超过了1亿美元。今年,已经达到了11.5亿美元。两年下来,暴增了约38倍。

它的赚钱路径是:在做大模型推理的过程中,把零散的开源模型,整合成企业愿意付费购买的生产系统。

具体模式包括几种——

第一,推理API。

企业调用模型,按tokens付费。不同的模型,100万tokens的收费也不同,比如DeepSeek V4 Pro、MiniMax M3、Kimi K2.7 Code等模型,都有各自的输入、缓存输入、输出价格。

第二,专属推理服务。

有些客户用量大,或者对延迟、稳定性、安全性要求更高,公共API就满足不了了。他们需要专属端点。Together AI的价格页明确指出,很多团队从API调用起步,规模大了之后会迁移到专属端点。

第三,微调。

企业不满足于通用模型。它们希望模型能理解自己的业务、客户、文档、产品和流程。Together AI提供Fine-Tuning服务,按训练和验证过程中处理的token量收费。不同模型规模、不同训练方式,价格也不同。

第四,GPU集群。

有些客户仍然需要自己训练、微调或部署模型。Together AI也提供按小时计费的GPU能力。价格页显示,它的GPU Clusters支持H100、H200、B200等硬件,按每GPU每小时收费。

这几项加起来,就构成了Together AI的商业模式:赚的是企业使用模型过程中的钱。

现在,Together AI每月处理超过400万亿个开放模型的推理token。一年前,这个数字只有大约300亿。调用量在一年内增长了大约1.3万倍。

这个生意之所以突然变大,是因为企业开始认真运用AI了。

客服机器人每天需要回复客户。AI编程工具每天要生成和修改代码。销售系统要自动写邮件。金融系统要读文件。医疗系统要总结病历。AI Agent还会反复调用模型:先理解任务,再查资料,再调用工具,再生成结果,再检查错误。

每一步都要花钱。

前段时间,硅谷传来一个消息:某家企业一个月在Claude上的支出,高达5亿美元——折合软妹币约33亿元,相当于每天烧掉超过1亿元。

开源模型的时机到了。

企业并不每个任务都需要最贵、最强的闭源大模型。很多时候,它们只需要一个足够好、足够快、足够便宜的模型。

在OpenRouter上,开源模型处理的tokens占比,从1月的34%升到了6月的65%。中国开源模型正在缩小与美国顶级模型的能力差距,同时也给了开发者更多定制和微调的自由。部分模型价格低至每百万tokens 18美分,而顶级模型平均约为4美元。

因此,Together AI的平台让企业可以在DeepSeek、MiniMax、Kimi等开放模型上训练和运行AI工作负载,成本低于封闭系统。

Together AI给出了一组很惊人的数字:企业使用开放模型通常能实现6倍到20倍的成本下降。Decagon迁移到Together AI后,推理成本下降了6倍。

推理不是一次性生意。客户一旦觉得能省钱,把业务流程接进去,就会持续产生账单。

03 最赚钱的AI赛道,英伟达巨头纷纷入场

Together AI并不是唯一一个被资本追逐的推理基础设施公司。

上周,铅笔道报道Baseten完成了15亿美元融资,估值达到130亿美元。而且,Baseten也特别提到,过去一年收入增长了20倍,原因是企业对“推理”的需求明显增加。

今年5月,Fireworks AI也在洽谈新一轮融资,目标估值可能达到150亿美元。

资本追逐它们,是因为资本发现:大模型应用开始商业化之后,真正持续产生账单的地方,是推理层。

这对中国公司很有启发意义。

金融、制造、政务、教育、医疗、客服、电商、办公软件,都存在大量AI推理需求。这些场景不一定需要最强模型,但需要可控、便宜、安全、能接入业务流程的模型服务。

这意味着机会将出现在推理云、模型路由、国产芯片适配、行业模型部署、AI成本管理、Agent调度、私有化交付和运维服务等领域。

最后,我们把目光投向投资方。Together AI和Baseten的投资方名单里,都出现了英伟达。

英伟达投这类公司并不奇怪。推理平台越多,GPU需求就越大。Together AI在2025年完成3.05亿美元融资时,就宣布要大规模部署英伟达Blackwell GPU。它还预计,未来五年计算能力和基础设施规模将扩大约50倍。

除了卖GPU的英伟达,Together AI和Baseten这类公司,正在演变为芯片、能源、电力设备、制造和企业软件巨头共同押注的基础设施入口。

Salesforce也有理由进场。作为企业软件巨头,它最关心的是AI能不能低成本、稳定地进入销售、客服、营销、办公和管理流程。投资Together AI,相当于提前卡位企业AI工作流背后的“算力水电煤”。

Aramco代表的是能源资本。AI推理看起来是软件生意,但背后需要大量电力、数据中心和算力资源。Schneider Electric是电气和数据中心基础设施相关公司,Pegatron则是电子制造和服务器供应链的重要玩家。

Together AI和Baseten的融资,不只是两家创业公司的事。它更像是一个产业信号:AI基础设施的竞争,已经转向比拼谁能更便宜、更稳定地承接海量调用。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:华人Token项目年入78亿暴涨38倍要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://36kr.com/p/3878418994376964
其他

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-03 20:42
AI驱动的员工英语口语教练Lucida

LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。

AI热点2026-07-03 20:42
Screenshot2Code:截图转代码工具

Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。

AI热点2026-07-03 20:42
SpeakStruct 语音转结构化数据 可自定义模板

SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。

AI热点2026-07-03 20:41
AI驱动语音治疗应用 IzzyAI

IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。

延伸阅读