谷歌8月论文揭示o1原理,大模型软件无护城河
有网友因此发出感慨:

就在不久前,OpenAI 将 o1-mini 的推理速度提升了 7 倍,每日可用额度达到 50 条;而 o1-preview 则调整为每周 50 条。

计算量可节省 4 倍
谷歌 DeepMind 的这篇论文标题直击要害:优化大语言模型在测试时的计算资源,比单纯扩大模型参数量更高效。
这一思路颇具启发性。人类在应对复杂问题时,往往会投入更多思考时间以做出更优决策,那么大语言模型是否也能采用类似策略?换言之,面对一项复杂任务,能否让 LLM 在测试阶段更充分地利用额外计算资源,从而提升答案的准确性?
此前已有研究证实这一方向可行,但实际效果较为有限。因此,本次研究旨在探明:仅动用少量额外推理计算,模型性能究竟能提升到什么程度?
研究团队设计了一系列实验,使用 PaLM2-S* 在 MATH 数据集上进行了完整测试。重点分析了两种方法:一是迭代式自我修正——让模型对同一问题多次尝试作答,并在每次尝试后自动修正,逐步逼近正确答案;二是搜索方法——模型先生成多个候选答案,再从中筛选出最优解。

从结果来看,采用自我修正方法时,随着测试阶段计算量的增加,标准最佳 N 策略(Best-of-N)与计算最优扩展策略之间的差距逐步扩大。而在搜索方法下,计算最优扩展策略在初期优势显著,并且在一定条件下,能够以仅相当于最佳 N 策略四分之一的计算量,达到相同的效果。
接下来,团队还进行了 FLOPs 匹配评估:将采用计算最优策略的 PaLM 2-S* 与一个规模大 14 倍的预训练模型(不施加额外推理)进行对比。结果发现,使用自我修正方法时,当推理 token 数量远小于预训练 token 数量,测试时计算策略的效果优于单纯预训练。但随着这一比例增加或问题难度上升,预训练的优势又重新显现。
简而言之,问题难度才是决定不同测试时计算扩展方法能否奏效的关键因素。
研究进一步比较了多种 PRM 搜索方法,结果显示,前向搜索(图中最右侧)所需的计算资源最大。

在计算资源相对匮乏的情况下,采用计算最优策略最多可节省 4 倍的资源投入。

与 OpenAI 的 o1 模型进行对比,这篇研究得出的结论几乎完全吻合。o1 模型学会了不断优化自身的思考链条,尝试不同的策略,并识别自己的错误。而且,随着强化学习程度(训练时计算)和思考时间(测试时计算)的持续增加,o1 的性能也稳步提升。唯一的区别在于,OpenAI 抢先发布了模型,而谷歌这边使用的是 PaLM2,在 Gemini2 上尚未推出更新版本。
网友:护城河只剩硬件了?
这一新发现不禁让人回想起去年谷歌内部文件中提出的观点:各家研究进展都很快,没有人能确保自己始终领先。唯一的护城河,或许就只剩下硬件了。

(所以马斯克在疯狂建设算力中心?)
有网友表示,如今英伟达直接掌控着谁能够拥有更多算力。但如果谷歌或微软开发出性能更强的定制芯片,局势又将如何演变?

值得一提的是,近期 OpenAI 首颗芯片曝光,将采用台积电最先进的 A16 埃米级工艺,专为 Sora 视频应用打造。显然,大模型这场竞赛,单靠卷模型本身已经远远不够了。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
ARD协议解读:Agent行业拐点已至
谷歌联合微软等发布ARD开放规范,补齐了Agent资源发现的关键拼图,与MCP、A2A构成完整互联体系。加上安全、调度等基础设施加速成熟,Agent规模化落地前提条件已基本齐备,行业正从单体能力竞争转向生态互联,迎来规模化发展的拐点。
ControlNet Mac电脑的详细完整安装教程:Apple Silicon与Intel配置步骤详解
ControlNet是常用AI绘画控制插件,macOS安装需区分AppleSilicon与Intel环境,重点处理Python、WebUI、插件目录、模型文件和启动参数,配置前应做好备份并关注版本兼容。
Krita AI Diffusion 新手入门从下载安装到首次运行保姆级教程
KritaAIDiffusion适合在Krita中完成文生图、图生图和局部重绘。安装重点是确认Krita版本、导入插件、配置本地或远程后端、下载模型,并在首次运行前检查显存、路径和权限。
Krita AI Diffusion安装失败?常见报错日志排查与升级回滚方案
KritaAIDiffusion安装异常多与版本不匹配、压缩包结构错误、Python插件未启用、后台服务或模型下载失败有关。可通过日志定位原因,按步骤重装、升级或回滚,避免覆盖配置和模型文件。
Krita AI Diffusion插件安装全流程教程:浏览器、编辑器、扩展市场
KritaAIDiffusion可将生成式绘图能力接入Krita,适合草图细化、局部重绘和风格探索。安装需确认版本、下载插件、配置后端服务与模型路径,并注意显卡资源、来源安全和版权合规。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-07-05 14:40
2026-07-05 06:45
2026-07-05 06:44
2026-07-05 06:44
2026-07-05 06:44
2026-07-05 06:44
2026-07-05 06:44
2026-07-05 06:43
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

