字节跳动发布专用形式化数学模型Seed Prover 1.5
12月24日消息,字节跳动Seed团队今日正式发布新一代形式化数学推理专用模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,其推理能力和推理效率均取得了显著提升。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
相较于上一代模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译验证的Lean证明代码,换算成绩为35/42,达到了此前IMO评分标准的金牌分数线。
针对北美本科级别数学竞赛Putnam,Seed Prover 1.5仅用时9小时,便对12道Putnam 2025赛题中的11道生成了可编译验证的Lean代码。
在更系统的评估中,Seed Prover 1.5在完整的Putnam历史评估集上解决了88%的问题。在代表硕士数学难度的Fate-H和代表博士生数学难度的Fate-X评估集上,则分别解决了80%和33%的题目,刷新了形式化数学推理模型在这几个测评集上的SOTA表现。

Seed Prover 1.5的技术报告已对外公开,最新后续将开放API,附链接如下:
技术报告:
https://arxiv.org/abs/2512.17260
Lean证明代码:
https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
ATaaS平台发布:如何构建日产能万亿的Token工厂
3月27日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。论坛汇聚院士、顶尖
海㡳AI开源新突破!甲子光年解析产业未来
从模型到基础设施,再到社区,开源在海淀意味着什么?作者|周悦编辑|王博“你心目中的AI社区是什么样的?”当主持人提出这一话题,来自AI公司的创业者、开发者、投资人、媒体人、AGI Bar老板,甚至一
华为AI深度布局:如何引领科技变革新格局
新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王
Claude限流,Altman紧急叫停Sora:AI竞争格局改变
新智元报道编辑:元宇【新智元导读】Sora应用关停,Claude却因太火而被限流:一个烧不起,一个供不上,算力墙面前,AI竞赛的胜负手突然变了。一夜之间,打工人突然发现:Claude开始限流了。An
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公
新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

