当前位置: 首页
AI
揭秘微软SpaceX争相投资的AI初创公司背景与创始人

揭秘微软SpaceX争相投资的AI初创公司背景与创始人

热心网友 时间:2026-05-18
转载

扩散模型,这个在图像和视频生成领域大杀四方的技术,如今正强势闯入文本生成的核心战场。而一场围绕它的争夺战,已经在科技巨头之间悄然打响。

当前AI行业看似一片繁荣,但狂热之下,一个根本性的忧虑始终存在:大语言模型(LLM)是否已经触及天花板?下一代AI的王者,会不会诞生于一个全新的架构?

就在5月13日,一则外媒消息引爆了业界:微软正在与一家名为Inception的初创公司洽谈收购。巧的是,同一天,马斯克的SpaceX也被曝出在追求同一家公司。

一家种子轮融资仅5000万美元、由吴恩达和安德烈·卡帕西(Andrej Karpathy)天使投资的创业公司,如今估值竟被喊到超过10亿美元,溢价高达20倍。能让微软和SpaceX这两家万亿级巨头同时下场争抢的,显然不是一项成熟的业务,而是一支来自斯坦福的教授团队,以及一条几乎无人涉足的技术路线。

这家与诺兰电影《盗梦空间》同名的初创公司,究竟有何非凡之处?

三个教授与一个“异端”想法

Inception的故事,要从其创始人斯特凡诺·埃尔蒙(Stefano Ermon)说起。

埃尔蒙是斯坦福大学的计算机科学教授,但他更广为人知的身份是——扩散模型(Diffusion Model)的共同发明人。如今我们使用的Midjourney、Sora、Stable Diffusion,底层都运行着他参与开创的技术。他关于文本扩散的论文曾获得ICML 2024最佳论文奖。

2024年中,埃尔蒙从斯坦福休假,拉上了两位合作超过十年的老搭档——加州大学洛杉矶分校教授阿迪亚·格罗弗(Aditya Grover)和康奈尔大学教授弗拉基米尔·库列绍夫(Volodymyr Kuleshov),在帕洛阿尔托共同创立了Inception Labs。

这三个人怀揣着一个在当时看来相当“离经叛道”的想法:将扩散模型从图像领域“移植”到文本生成领域,彻底取代现有的自回归架构。

安德烈·卡帕西在Inception发布首个模型时,就在X平台上表达了浓厚兴趣。他指出,当今几乎所有大语言模型在核心建模方法上都是“克隆体”,遵循从左到右逐个预测词元(token)的模式。扩散模型则完全不同——它不是顺序生成,而是从一片噪声开始,通过逐步去噪,最终得到一个完整的词元序列。他认为这个模型“有潜力展现出全新、独特的能力特征”,并鼓励大家尝试。

卡帕西不只是说说而已。他与吴恩达都以天使投资人的身份,参与了Inception的种子轮融资。

2025年11月,Inception完成了5000万美元的种子轮融资,由Menlo Ventures领投,英伟达旗下的NVentures、微软旗下的M12、Snowflake Ventures以及Databricks的投资部门全部跟投。

当卡帕西和吴恩达同时押注一家公司,当英伟达和微软的战投基金同时出现在投资人名单上,这几乎构成了AI领域最顶级的信任背书。

快10倍,便宜10倍

要理解Inception为何如此受追捧,得先弄明白它的技术路线究竟有何不同。

如今我们使用的ChatGPT、Claude、Gemini,底层清一色是自回归模型。它们生成文本的方式,就像一个字一个字地书写:必须从左到右,串行输出。在生成下一个词之前,必须等待前面所有的词都生成完毕。

这种方法稳定可靠,但存在一个结构性的天花板——速度被串行生成的方式锁死了。你可以更换更强大的芯片,优化推理框架,或者压缩模型,但只要本质仍是逐词生成,速度就存在理论上限。

Inception选择了一条截然不同的道路。它利用扩散模型进行文本生成——不是逐字书写,而是先给出一个“粗略草稿”,然后通过神经网络反复精炼,同时修改多个词元,实现并行输出。

埃尔蒙的解释非常直白:“这是一种根本不同的方法。所有现有的大语言模型都是自回归的,一个接一个地从左到右生成文本或代码,这非常慢,因为你不能在生成前面所有内容之前生成后面的东西。”

实际效果如何?Inception推出的模型家族名为Mercury。根据第三方评测机构Artificial Analysis的测试,其于2026年2月发布的Mercury 2模型,输出吞吐量达到了每秒约1000个词元。作为对比,Claude 4.5 Haiku约为每秒89个词元,GPT-5 Mini约为每秒71个词元。速度优势达到了10到14倍。

在质量方面,Mercury 2的AIME 2025得分为91.1,GPQA得分为73.6,LiveCodeBench得分为67.3。这些分数与Claude 4.5 Haiku、GPT-5.2 Mini处于同一竞争区间,但吞吐量却是后者的10倍以上。

对此,埃尔蒙的态度也很坦诚——Mercury 2对标的是Haiku和Flash这个级别的模型,而非Claude Opus或GPT-4这样的旗舰产品。第三方分析也指出,在复杂推理任务上,扩散模型的质量大约是前沿自回归模型的85%-95%,但在结构化输出和翻译等任务上已基本持平。

而这恰恰是其想象力所在。如果扩散模型在质量上的差距仅有5%-15%,而速度优势却高达10倍,那么在对延迟极度敏感的大量场景中——如实时语音交互、代码自动补全、游戏对话、智能体(Agent)循环调用——扩散模型无疑是更实际的选择。

不仅如此,扩散框架还带来了几个自回归模型难以实现的结构性优势。

第一,输出可控性更强。扩散模型能天然遵循特定的模式(schema)和语义约束,生成符合指定格式的JSON输出,这在企业级应用中至关重要。

第二,天然支持多模态融合。扩散本就是图像和视频生成的底层范式,将其扩展到文本,意味着可以用一套统一的框架处理语言、图像、音频和视频,无需再拼接不同的架构。

第三,内置纠错能力。自回归模型一旦前面出错,后面很难修正;扩散模型则可以在精炼过程中反复调整,理论上能减少“幻觉”的产生。

当然,这条路线也伴随着明显的不确定性。一些AI研究者指出,扩散方法使得输出预测更加困难,其扩展定律(Scaling Law)尚未被充分验证。自回归模型“参数越多、数据越多、效果越好”的规律花了数年才被摸清,扩散模型是否遵循类似规律,还是需要完全不同的优化策略,目前尚无定论。

但正是这种不确定性,才让它有可能成为碘伏下一个时代的范式。

“后OpenAI时代”的军备竞赛

理解了Inception的技术价值,再来看微软和SpaceX为何同时争夺它,逻辑就清晰了。

2026年4月27日,微软与OpenAI官宣了对合作关系的重大调整。微软对OpenAI模型的IP授权从独家变为非独家,有效期延至2032年。微软不再向OpenAI支付收入分成。OpenAI可以在AWS、Google Cloud等任何云平台上提供服务。关于AGI(通用人工智能)的条款被彻底删除。

这段曾被称作“科技界最佳兄弟情”的关系,实质上已转变为“管理型竞争”。

微软在OpenAI身上投入了超过130亿美元的资金以及大量的Azure算力支持。但现在,OpenAI不再是微软的“独家武器”,而微软也在加速摆脱对OpenAI的依赖。据报道,微软正在开发自己的通用AI模型,目标是在2027年之前推出能与OpenAI、Anthropic正面竞争的前沿模型。

收购AI创业公司,正是这一战略的重要组成部分。

路透社的报道披露,微软今年春天首先看中了代码生成公司Cursor,但由于自身已拥有GitHub Copilot,内部担心反垄断审查无法通过,主动放弃了收购。随后,SpaceX立刻与Cursor签署了一份价值600亿美元的收购期权协议——即便收购不成,SpaceX也需支付100亿美元的合作费用。

在放弃Cursor后,微软转向了Inception。然而,SpaceX也同样盯上了Inception。目前,Inception已聘请投行操盘交易谈判,开价超过10亿美元。

SpaceX的介入让整件事变得更加有趣。

2026年2月,SpaceX以全股票交易方式收购了马斯克的xAI,合并后估值达到1.25万亿美元,成为有史以来估值最高的商业并购案之一。随后,SpaceX又启动了Terafab半导体工厂项目,与特斯拉和xAI联合建设。再加上对Cursor的收购期权和对Inception的追求,马斯克显然正以SpaceX为平台,系统性地构建一个从芯片、模型到应用的完整AI技术栈。

而微软这边,除了争夺Inception,也在同时与多家AI创业公司接触。路透社引述知情人士称,AI研究人员如今轻松就能拿到数千万美元的薪酬,创业公司估值在投资者的疯抢下飞速上涨。

Menlo Ventures合伙人蒂姆·塔利(Tim Tully)在Inception融资时说过一句话,放在今天的收购大战背景下格外应景。他说,Inception的团队证明了扩散式大语言模型不只是一个研究突破,而是“一个可以构建可扩展、高性能语言模型的基础,企业今天就能部署”。

这句话解释了一切——巨头们争抢的不仅仅是一家公司,更是一个可能改写游戏规则的技术范式,以及掌握这个范式核心密码的那几个人。

当微软与OpenAI的“婚姻”走向开放关系,当SpaceX从火箭公司变身AI收购机器,当一家种子轮公司被两家万亿巨头同时争抢——这场“后OpenAI时代”的军备竞赛,其实才刚刚拉开序幕。

而Inception的命运,无论最终花落谁家,都已经证明了一件事:在AI的世界里,真正稀缺的从来不是资本,而是敢于踏上不同道路的头脑与勇气。

来源:https://www.163.com/dy/article/KT78SFTF05119FMA.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
即梦AI服务器稳定性如何是否经常出现崩溃问题

即梦AI服务器稳定性如何是否经常出现崩溃问题

即梦AI服务异常未必是服务器崩溃,常与网络、账户配额或模型通道有关。建议先检查官方状态页与本地网络,确认账户资源充足。可尝试切换模型版本或服务节点,避免功能互斥与资源消耗过大的操作组合。如问题持续,启用客户端日志捕获并提交分析。

时间:2026-05-18 15:25
腾讯元宝与豆包AI大模型实测对比五大维度深度解析

腾讯元宝与豆包AI大模型实测对比五大维度深度解析

实测从五个维度对比了腾讯元宝与豆包。豆包在日常交互、内容创作、办公文档和多模态方面表现领先,尤其在非标准口语理解、平台化内容生成及多格式文档解析上优势明显。元宝响应速度快,侧重微信轻办公场景,在逻辑推理的特定模式下能力突出,但综合能力与场景适配性相对有限。

时间:2026-05-18 15:25
千问AI上下文对话能力深度测评与多轮交互解析

千问AI上下文对话能力深度测评与多轮交互解析

通义千问模型在多轮对话中展现出扎实的上下文管理能力。测试表明,它能有效处理长文档信息回溯、维持话题链、稳定记忆角色与格式要求,并在密集指代中保持精确绑定,为复杂连续交互提供了可靠支持。

时间:2026-05-18 15:25
豆包大模型在教育领域的十大应用场景解析

豆包大模型在教育领域的十大应用场景解析

豆包大模型深度融入教学,能动态生成教案、设计课堂活动并关联课标。它可精准归因错题,推送针对性练习,还支持跨学科创作交互式资源,适配各类教学硬件,提升备课、辅导与课堂效率。

时间:2026-05-18 15:25
DAG革新时间序列预测:开源代码、数据与排行榜

DAG革新时间序列预测:开源代码、数据与排行榜

华东师范大学团队提出DAG框架,通过构建时间与通道双维度相关网络,系统挖掘历史与未来、内生与外生变量间的深层关联,并将学习到的时间因果与变量相关模式迁移至预测过程,显著提升了预测精度。实验显示,该方法在多个数据集上优于主流基线。

时间:2026-05-18 15:24
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程