当前位置: 首页
AI教程
谷歌8月论文揭示o1原理,大模型软件无护城河

谷歌8月论文揭示o1原理,大模型软件无护城河

热心网友 时间:2026-07-03
转载

有网友因此发出感慨:

就在不久前,OpenAI 将 o1-mini 的推理速度提升了 7 倍,每日可用额度达到 50 条;而 o1-preview 则调整为每周 50 条。

计算量可节省 4 倍

谷歌 DeepMind 的这篇论文标题直击要害:优化大语言模型在测试时的计算资源,比单纯扩大模型参数量更高效。

这一思路颇具启发性。人类在应对复杂问题时,往往会投入更多思考时间以做出更优决策,那么大语言模型是否也能采用类似策略?换言之,面对一项复杂任务,能否让 LLM 在测试阶段更充分地利用额外计算资源,从而提升答案的准确性?

此前已有研究证实这一方向可行,但实际效果较为有限。因此,本次研究旨在探明:仅动用少量额外推理计算,模型性能究竟能提升到什么程度?

研究团队设计了一系列实验,使用 PaLM2-S* 在 MATH 数据集上进行了完整测试。重点分析了两种方法:一是迭代式自我修正——让模型对同一问题多次尝试作答,并在每次尝试后自动修正,逐步逼近正确答案;二是搜索方法——模型先生成多个候选答案,再从中筛选出最优解。

从结果来看,采用自我修正方法时,随着测试阶段计算量的增加,标准最佳 N 策略(Best-of-N)与计算最优扩展策略之间的差距逐步扩大。而在搜索方法下,计算最优扩展策略在初期优势显著,并且在一定条件下,能够以仅相当于最佳 N 策略四分之一的计算量,达到相同的效果。

接下来,团队还进行了 FLOPs 匹配评估:将采用计算最优策略的 PaLM 2-S* 与一个规模大 14 倍的预训练模型(不施加额外推理)进行对比。结果发现,使用自我修正方法时,当推理 token 数量远小于预训练 token 数量,测试时计算策略的效果优于单纯预训练。但随着这一比例增加或问题难度上升,预训练的优势又重新显现。

简而言之,问题难度才是决定不同测试时计算扩展方法能否奏效的关键因素。

研究进一步比较了多种 PRM 搜索方法,结果显示,前向搜索(图中最右侧)所需的计算资源最大。

在计算资源相对匮乏的情况下,采用计算最优策略最多可节省 4 倍的资源投入。

与 OpenAI 的 o1 模型进行对比,这篇研究得出的结论几乎完全吻合。o1 模型学会了不断优化自身的思考链条,尝试不同的策略,并识别自己的错误。而且,随着强化学习程度(训练时计算)和思考时间(测试时计算)的持续增加,o1 的性能也稳步提升。唯一的区别在于,OpenAI 抢先发布了模型,而谷歌这边使用的是 PaLM2,在 Gemini2 上尚未推出更新版本。

网友:护城河只剩硬件了?

这一新发现不禁让人回想起去年谷歌内部文件中提出的观点:各家研究进展都很快,没有人能确保自己始终领先。唯一的护城河,或许就只剩下硬件了。

(所以马斯克在疯狂建设算力中心?)

有网友表示,如今英伟达直接掌控着谁能够拥有更多算力。但如果谷歌或微软开发出性能更强的定制芯片,局势又将如何演变?

值得一提的是,近期 OpenAI 首颗芯片曝光,将采用台积电最先进的 A16 埃米级工艺,专为 Sora 视频应用打造。显然,大模型这场竞赛,单靠卷模型本身已经远远不够了。

来源:https://www.aiagiai.com/3809.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
ARD协议解读:Agent行业拐点已至

ARD协议解读:Agent行业拐点已至

谷歌联合微软等发布ARD开放规范,补齐了Agent资源发现的关键拼图,与MCP、A2A构成完整互联体系。加上安全、调度等基础设施加速成熟,Agent规模化落地前提条件已基本齐备,行业正从单体能力竞争转向生态互联,迎来规模化发展的拐点。

时间:2026-07-05 14:40
ControlNet Mac电脑的详细完整安装教程:Apple Silicon与Intel配置步骤详解

ControlNet Mac电脑的详细完整安装教程:Apple Silicon与Intel配置步骤详解

ControlNet是常用AI绘画控制插件,macOS安装需区分AppleSilicon与Intel环境,重点处理Python、WebUI、插件目录、模型文件和启动参数,配置前应做好备份并关注版本兼容。

时间:2026-07-05 06:45
Krita AI Diffusion 新手入门从下载安装到首次运行保姆级教程

Krita AI Diffusion 新手入门从下载安装到首次运行保姆级教程

KritaAIDiffusion适合在Krita中完成文生图、图生图和局部重绘。安装重点是确认Krita版本、导入插件、配置本地或远程后端、下载模型,并在首次运行前检查显存、路径和权限。

时间:2026-07-05 06:44
Krita AI Diffusion安装失败?常见报错日志排查与升级回滚方案

Krita AI Diffusion安装失败?常见报错日志排查与升级回滚方案

KritaAIDiffusion安装异常多与版本不匹配、压缩包结构错误、Python插件未启用、后台服务或模型下载失败有关。可通过日志定位原因,按步骤重装、升级或回滚,避免覆盖配置和模型文件。

时间:2026-07-05 06:44
Krita AI Diffusion插件安装全流程教程:浏览器、编辑器、扩展市场

Krita AI Diffusion插件安装全流程教程:浏览器、编辑器、扩展市场

KritaAIDiffusion可将生成式绘图能力接入Krita,适合草图细化、局部重绘和风格探索。安装需确认版本、下载插件、配置后端服务与模型路径,并注意显卡资源、来源安全和版权合规。

时间:2026-07-05 06:44
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜