她们估值840亿，刚发了第一个AI成果

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

她们估值840亿，刚发了第一个AI成果

热心网友时间：2025-09-12

转载

刚刚，0产出估值就已冲破120亿美元的Thinking Machines，终于发布首篇研究博客。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

创始人、OpenAI前CTO Mira Murati亲自宣发，翁荔等一众公司大佬纷纷转推：

研究主题是“Defeating Nondeterminism in LLM Inference”，克服大语言模型推理中的不确定性。

主要讨论的内容就是，为什么大模型每次的推理结果总是难以复现？根源在于批次不变性。

不鸣则已，一鸣就是万字长文，并且，Thinking Machines还致敬了一波“连接主义”——

Mira和她的同事们认为，科学因分享而更加卓越。他们将保持对研究成果的分享，并与研究社区保持频繁、开放的联系。

而翁荔在转发推文中，还透露了Thinking Machines的第一代旗舰产品名为Connection Machine。

（CloseAI膝盖又中了一枪）

击败LLM推理中的非确定性

众所周知，LLM推理中，想要获取可复现结果相当困难，比如说多次向ChatGPT提出相同问题，但结果很有可能不同。

即使将采样温度降至0，原则上LLM会选择概率最高的token输出，但实际中此时不确定性仍然存在。

过去普遍认为这是因为浮点非结合性和并发执行之间的某种组合导致，即GPU在执行浮点数运算时会出现非结合性，比如(a+b)+c不一定等于a+(b+c)，然后在并行操作中则根据执行顺序的不同，产生不同的结果。

但其实这个说法并不完整，如果在GPU上对同一数据重复运行相同的矩阵乘法，却可以始终获得确定的同一结果。

于是Thinking Machine深入研究后发现，其实罪魁祸首应该是批次不变性。

首先浮点数计算存在数值差异的原因确实是浮点数非结合性。

因为浮点数本身在编码中，是通过 “尾数×10^指数” 的形式表示，精度有限，所以当两个不同指数的浮点数相加时，就必须调整指数并舍弃部分精度，从而导致一部分信息丢失，所以后续的相加顺序不同才会产生不同的结果，使其不满足结合律。

但浮点数为什么会以不同顺序相加呢？

究其根源，是因为现在的LLM推理缺乏批次不变性，单个请求的输出受到同一批次中请求数量的影响。

主要问题是：

实际部署中，服务器会随着负载动态调整大模型推理批次的大小，而现有的内核会因批次的变化而改变矩阵乘法、RMSNorm等关键操作的计算顺序或策略；

浮点运算的非结合性使不同计算顺序产生微小偏差，这种偏差在Transformer多层迭代中被放大，最终导致相同输入正在不同批次下输出不同，破坏了推理的一致性。

要解决这一问题，那就需要让RMSNorm、矩阵乘法、注意力机制分别具备批次不变性。

在RMSNorm中，重点就是要固定好每个批次元素的归约顺序而不受批次大小影响，则需要为每个内核分配一个批处理元素，让每次归约操作都能在单个核心中完成。

当批大小增大时，核心就会依次处理多个批次元素，而保持归约策略不变；当批大小较小时，则可以自动忽略一些并行性优化措施，虽然效率可能会随之降低，但能保障批次不变性。

而矩阵乘法在实际中也与批大小有关，所以可以通过将输出张量拆分为2D块，然后为每个块分配不同的核心。

其中每个核心计算都属于该块的点积，再在该核心中执行归约操作。

但要注重在批维度（M和N）过小时，可能会被迫沿着归约维度（K）进行分割，也就是Split-K矩阵乘法，这样做同样会影响归约顺序，另外不同的张量核心指令也会导致结果变化。

所以更简单的方法是为所有输入形状编译统一的内核配置，避免因批大小变化切换并行策略或张量核心指令。

尽管相较于CuBLAS，这样做可能会损失约20%的性能，但是可接受的。

而注意力机制则更加特殊，首先它需要更多的归约维度，需要沿着特征维度和序列维度双重归约，一些像分块预填充（chunked prefill）、前缀缓存（prefix caching）等推理优化也会改变序列处理方式。

所以在注意力内核执行前，首先要更新KV缓存和页表，确保无论序列是否拆分处理（预填充或解码阶段），KV的存储布局始终一致，从而保障归约顺序不变。

沿着KV维度拆分时，也不同于常规策略按照所需并行度均匀拆分KV维度，拆分数量随批大小变化，而是固定每个拆分块的大小（如固定为256），拆分数量随KV长度自适应，确保归约顺序不依赖批大小。

研究人员也对此进行了三种不同的实验验证，分别是推理确定性验证、性能验证和真实在线策略强化学习应用验证。

首先使用Qwen/Qwen3-235B-A22B-Instruct-2507模型，在相同条件下，判断1000个长度为1000 token的结果差异情况。

结果发现未使用批次不变性内核时，共生成80个不同结果，前102个token完全一致，但到第103个token则开始分化。

如果使用批次不变性内核，则1000个结果完全相同，实现了确定性推理。

而在性能上，统一使用单GPU部署Qwen-3-8B模型的API服务器，并处理相同问题。

结果发现，确定性推理虽存在性能损失，但性能在可接受范围之内，仍然具备实际应用价值。

由于训练与推理的数值差异会导致在线策略RL变为离线策略RL，一般需要引入重要性加权等离线校正项才能稳定训练。

所以通过比对校正前后的数据可以发现，缺乏重要性加权校正时，模型奖励将会在训练中途崩溃，KL散度也会大幅飙升，而校正后，训练变得稳定，KL散度可以维持在0.001左右，偶有波动情况出现。

确定性推理则全程保持稳定，KL散度始终为0，实现了真正的在线策略RL，无需离线校正。

大佬云集的Thinking Machine

再来说说ThinkingMachine这支AI梦之队。

虽然尚未有具体模型产品产出，但是人才和资本都非常豪华，小扎只能干看着，挖也挖不到。

掌舵人Mira Murati在2016年加入OpenAI，一路晋升至CTO，主导打造了GPT-3、GPT-4等一系列关键技术开发。

联合创始人及首席科学家John Schulman是PPO算法的开发者，在强化学习领域举足轻重，还主导了ChatGPT的研发工作。

Thinking Machine的CTO则是前OpenAI副总裁Barret Zoph，主导了ChatGPT的后训练。

联创Andrew Tulloch曾经在Meta待了11年，后来进入OpenAI，参与了OpenAI GPT-4o到o系列，和Mira Murati创办Thinking Machine后，面对小扎6年15亿美元的天价薪酬，也丝毫不动摇

此外，公司还聘请了GPT的开山一作Alec Radford、OpenAI前首席研究官Bob McGrew担任技术顾问。

△

更有北大校友、前OpenAI安全团队负责人翁荔加盟，可以说，这支团队约三分之二成员都来自OpenAI。

前段时间，还有蛛丝马迹表明清华姚班校友陈丹琦也加入了这支团队。

融资方面，今年6月，Thinking Machines完成了20亿美元的种子轮投资，由a16z领投，英伟达、Accel、ServiceNow、CISCO、AMD、Jane Street等各领域知名机构纷纷跟投。

以有史以来最大规模的种子轮融资刷新了AI圈的融资纪录。（虽然传闻中该公司的融资目标只有10亿美元）

这轮融资完成后，这家没模型没产品的初创公司估值也达到了120亿美元。

这次新研究发布后，翁荔还透露了第一个Thinking Machines产品名为Connection Machine，连接主义。

连接主义缘起于上世纪60年代，McCulloch和Pitts提出了人工神经元模型，如今的深度学习可以被视为连接主义的直接延续，当下人工智能中的“神经网络”就是连接主义的实现形式。

这下网友可坐不住了：先把公司Logo发出来。

参考链接：

[1]https://thinkingmachines.ai/blog/defeating-nondeterminism-in-llm-inference/

来源:https://36kr.com/p/3461975381268103

上一篇：张宏江演讲：中美AI算力储备差距大，Agent将改变人类组织构成

下一篇： Photoshop 又获一 AI 利器，本月将集成谷歌“最强 P 图模型”Nano Banana

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

传《糖豆人》将于10月停服官方迅速辟谣

米家扫地机器人滤网清理用什么工具

《刺客信条：影》4月8日更新追加升级版PSSR支持

比官方预告时间更早：消息称“超级小爱”PC 客户端正推送给小米笔记本 Pro 14

《洛克王国世界》异色精灵保底机制详解-异色保底次数与高效刷取方法

斯文·文克分享拉瑞安《神界》开发细节

《异种航员2》游戏后期技巧详解-后期攻略分享

OpenClaw 3.31 审批问题总结

旗舰配置 25000Pa 吸力 + 95℃ 自清洁：石头 A30 CE 洗地机 1278 元免费用 15 天

我国首台国产海上平台燃气轮机，中国航发“太行 7”进军国际高端市场

戴尔电脑恢复出厂设置方法：关键按键与操作解析

电脑睡眠后黑屏唤醒失败？5步教你有效解决重启问题

解压视频文件，电脑播放必备指南

电脑蓝屏解决全攻略：排查与修复系统崩溃教程

文件夹无法删除怎么办？4个强制删除方法

惠普战系列办公主机组装指南：打造高效办公电脑配置

解决鼠标滚轮失灵：3步自查与修复窍门【修复指南】

电脑误删文件恢复方法：4种实用方案找回数据

电脑截屏快捷键大全：快速截屏的3种高效方法

电脑多显示器设置指南：3步轻松扩展工作桌面

OpenAI急招安全负责人：年薪高达55.5万美元及股权

台积电3纳米芯片报价受AI热潮驱动，预计下月上涨

AI伪证呈堂被训诫：原告伪造带水印电子证据案

小米空气净化器十年领跑：线上销量第一，出货量破2500万台

蚂蚁阿福声明：问答结果无任何广告推荐与商业排名

AI机器人辅助精神科诊疗，潜在关联病例解析

我国AI地震监测达国际先进水平，核心技术实现实时预警

荣耀ROBOT PHONE真机体验：全球首款机器人手机亮相当下

全球首台30兆瓦纯氢燃气轮机投用，清洁能源新突破

一汽与零跑深化合作：共探中国新能源汽车新路径

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

墙世界公测时间是什么时候发布于 2026-04-07

《方舟：生存进化》孵化龙蛋方法发布于 2026-04-07

洛克王国世界开服奖励怎么领取-洛克王国世界开服奖励领取方法介绍发布于 2026-04-07

盛大原始传奇如何合成装备-盛大原始传奇合成装备的方法发布于 2026-04-07

燕云十六声开封南门大街万事知怎么做发布于 2026-04-07

魔兽世界12.0前夕熊T天赋怎么加点-魔兽世界12.0前夕熊T天赋加点方法发布于 2026-04-07

泰坦之旅2掠魂者怎么超爆流配装及加点发布于 2026-04-07

奇迹世界起源弓手怎么玩-奇迹世界起源弓手养成攻略发布于 2026-04-07

“高层没有吸取教训” 《巫师4》员工怒批新作或重蹈覆辙发布于 2026-04-07

PS Plus 4月会免阵容公布：《堕落之主》《刀剑神域碎梦边境》《古墓丽影1-3复刻版》免费领发布于 2026-04-07

《怪物猎人物语3》夏季免费更新详解 “怪物之王”全图登场发布于 2026-04-07

《龙之谷》4月17日“爽玩服”新服开启！四重畅爽，火力全开发布于 2026-04-07

海笋指的是哪种海洋生物-海笋是以下哪种海洋生物的指代发布于 2026-04-07

燕云十六声滹沱燕归板怎么拼-燕云十六声滹沱燕归板攻略发布于 2026-04-07

魔兽世界12.0前夕武器战天赋怎么加点-魔兽世界12.0前夕武器战天赋加点方法发布于 2026-04-07

DNF2026奶萝技能数据是怎样的-2026DNF奶萝技能数据详情发布于 2026-04-07

win10如何解决字体显示乱码_win10字体显示乱码完整指南一文搞懂发布于 2026-04-06

8GB显卡能再战十年！NVIDIA神经纹理压缩技术让显存需求爆降85%：从6.5GB降至970MB画质不变发布于 2026-04-07

开源压缩工具 PeaZip 11 发布：处理超 10 万文件的压缩包时间最高缩短 94% 发布于 2026-04-07

疯狂！Intel CPU今年将涨价30%：还好有AMD 发布于 2026-04-07

苹果产品迭代周期纪录刷新！HomePod mini发布超2000天：二代至今杳无音信发布于 2026-04-07

苹果遭遇内存荒！Mac mini/Studio发货严重延迟：最长要等将近半年发布于 2026-04-07

荣耀50关机能定时自动关机吗发布于 2026-04-07

华硕主板更新BIOS后VT选项消失了发布于 2026-04-07

博世洗衣机恢复出厂设置后要重新配网吗发布于 2026-04-07

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

鸣人的假期中文版下载-鸣人的假期游戏合集-鸣人的假期版本大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

她们估值840亿，刚发了第一个AI成果

击败LLM推理中的非确定性

大佬云集的Thinking Machine

极豆科技携手银联等四方全球首秀车载智能体“一句话下单”支付场景

极豆科技携手银联等四方全球首发车载智能体支付场景新体验

全新揽巡震撼上市，智驾安全双在线，七重礼遇助力开启精彩旅程

OpenClaw如何自定义SKILL

OpenClaw 是什么？OpenClaw 详细使用教程及中转 API 优缺点

她们估值840亿，刚发了第一个AI成果

击败LLM推理中的非确定性

大佬云集的Thinking Machine

极豆科技携手银联等四方 全球首秀车载智能体“一句话下单”支付场景

极豆科技携手银联等四方 全球首发车载智能体支付场景新体验

全新揽巡震撼上市，智驾安全双在线，七重礼遇助力开启精彩旅程

OpenClaw如何自定义SKILL

OpenClaw 是什么？OpenClaw 详细使用教程及中转 API 优缺点

极豆科技携手银联等四方全球首秀车载智能体“一句话下单”支付场景

极豆科技携手银联等四方全球首发车载智能体支付场景新体验