字节跳动发布专用形式化数学模型Seed Prover 1.5
12月24日消息,字节跳动Seed团队今日正式发布新一代形式化数学推理专用模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,其推理能力和推理效率均取得了显著提升。
相较于上一代模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译验证的Lean证明代码,换算成绩为35/42,达到了此前IMO评分标准的金牌分数线。
针对北美本科级别数学竞赛Putnam,Seed Prover 1.5仅用时9小时,便对12道Putnam 2025赛题中的11道生成了可编译验证的Lean代码。
在更系统的评估中,Seed Prover 1.5在完整的Putnam历史评估集上解决了88%的问题。在代表硕士数学难度的Fate-H和代表博士生数学难度的Fate-X评估集上,则分别解决了80%和33%的题目,刷新了形式化数学推理模型在这几个测评集上的SOTA表现。

Seed Prover 1.5的技术报告已对外公开,最新后续将开放API,附链接如下:
技术报告:
https://arxiv.org/abs/2512.17260
Lean证明代码:
https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
信创环境下可用的企业级AI工具盘点与选型指南
随着国产化替代进入深水区,企业数字化转型正面临关键一跃:寻找一个能在信创环境下真正“干活”的智能助手。这类助手,常被称为“企业AI智能体”或“数字员工”,它不仅是提升效率的工具,更是驱动核心业务创新的关键引擎。然而,信创环境对软件的兼容性、安全性和底层适配能力提出了严苛挑战。市场研究预测,到2025
人机融合辅助决策系统从执行工具到智能同事的演进
在数字化转型的深水区,依赖传统经验和直觉进行决策的模式已难以为继。面对信息过载与商业逻辑的快速迭代,企业亟需更智能的解决方案。“人机融合”正是破局的关键——它并非简单的人机协作,而是通过大模型、智能文档处理与自动化流程,将人类的经验智慧与机器的计算能力、持久耐力深度融合,构建一个全新的“智能决策大脑
企业如何实现AI龙虾端到端业务闭环深度解析
当前,以大模型为驱动的企业数字化转型正进入深水区。企业对AI智能体(文中以“龙虾”代指)的诉求,已从初期的对话与问答,全面升级为对复杂业务流程的自动化执行与闭环管理。观察市场可见,主流的企业级AI助理在形态上与智能体基本一致,普遍支持API集成、MCP协议调用及多技能组合,并采用多智能体协同架构。然
电商数据采集来源与全渠道整合方法详解
一、核心电商平台官方运营后台:第一手精准数据源 想在电商数据里淘金,第一步得找对矿脉。毫无疑问,各大平台的官方运营后台,就是那座最直接、最权威的“数据富矿”。麦肯锡在《2023全球零售数据驱动力报告》里也印证了这一点:超过85%的头部电商企业,其核心指标分析都高度依赖平台原生的数据接口。 具体怎么挖
电商活动运营如何实时调整策略数据驱动敏捷运营指南
在电商的世界里,大促活动的成败往往就在转瞬之间。无论是“618”还是“双十一”,那些能够根据实时战况迅速调兵遣将的团队,总能笑到最后。麦肯锡的一份报告就曾指出,具备敏捷运营能力的企业,其市场反应速度能比同行快上2到3倍,营销投资回报率平均能提升15%至25%。所以,电商活动运营如何实时调整策略?这早
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

