首页
AI
LeCun团队发布开源代码世界模型,首款能编程的LLM

LeCun团队发布开源代码世界模型,首款能编程的LLM

热心网友
转载
2025-09-26
来源:https://www.ithome.com/0/885/710.htm

Meta经过大规模人才招募后,终于在今日重磅推出最新人工智能研究成果!代码世界模型CWM作为此次发布的AI模型,开创性地将世界模型概念应用于代码生成领域。这款创新模型是否会重塑编程范式?让我们一探究竟。

Meta近期重金招揽AI人才后,终于交出了首份答卷!

据悉,Meta最新发布的代码世界模型(Code World Model,简称CWM)基于大语言模型架构,专门探索如何运用世界模型原理来提升AI代码生成能力。

LeCun

值得注意的是,AI领域泰斗Yann LeCun也在社交平台亲自转发支持这款新产品。

LeCun

CWM的主要创新亮点

这款32B参数规模的"小巨人"究竟有何独特之处?

CWM最具突破性的创新在于首次将世界模型理念引入代码生成任务。正如Yann LeCun所解释:模型在生成代码时,能够预先模拟代码执行可能产生的结果,据此规划出更符合开发者预期的代码方案,从而显著提升生成质量。

人类编程时通常会预想代码执行效果,而传统语言模型在这方面的能力相当有限。

CWM通过海量编程数据和定制化的Python、Bash脚本环境数据进行专项训练,使模型能够精准模拟Python程序在Bash环境下的执行过程以及与代理环境的交互情况。

LeCun

针对困扰众多大模型的"计算strawberry中有多少个r"这类问题,CWM以类似Python调试器pdb的工作方式展示了其解决方案:

LeCun

LeCun

目前Meta已公开发布三个不同版本的检测点(Checkpoint),满足各类应用需求。

LeCun

LeCun

CWM性能评测

让我们看看这款32B参数的"小"模型在实际编程评测中的表现。

在SWE-bench Verified测试中,CWM以65.8%的准确率位列开源模型第一梯队,虽略逊于Qwen3-Coder和Kimi-K2-Instruct,但与闭源的Gemini-2.5-Thinking旗鼓相当。

LeCun

其他核心测试指标如下: LiveCodeBench:68.6% Math-500:96.6% AIME 2024:76.0%

LeCun

CWM作为Meta的概念验证项目,主要探索世界模型对代码质量的提升效果。此次发布的32B参数模型可能只是前奏,更大规模的版本或许已在筹备中。

相关参考资料: https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/ https://x.com/syhw/status/1970960837721653409 https://x.com/AIatMeta/status/1970963571753222319 https://x.com/ylecun/status/1970967341052854748 https://x.com/alexandr_wang/status/1970973317227225433

本文来自微信公众号:新智元(ID:AI_era)

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

印尼铜矿停产加剧供应紧张,资金抢筹铜行业资产

全球第二大铜矿突发停产事件,令本就紧张的国际铜市供给形势进一步恶化。美国矿业巨头自由港麦克莫兰公司位于印尼的铜矿因泥浆溃涌事故被迫暂停生产,初步评估显示,该事件导致公司第三季度铜和黄金销售指引分别下

2025-09-26.

阿里CEO吴泳铭:3年投3800亿加码AI基建

9 月 24 日消息,今日,杭州云栖小镇迎来了一年一度的云栖大会。在开幕式上,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭发表了主旨演讲,吴泳铭在演讲中表示,实现 AGI 已是确定

2025-09-26.

谷歌报告:90%工程师日常工作使用AI技术

9 月 24 日消息,据 CNN 23 日报道,谷歌最新研究显示,绝大多数科技行业员工在工作中使用 AI 来编写或修改代码等任务。该研究由谷歌 DORA 研究部门完成,基于全球 5000 名技术专

2025-09-26.

阿里Qwen3-Max模型发布:正式版性能业界领先

阿里巴巴在人工智能领域再推力作,正式发布旗下迄今为止规模最大、性能最强的语言模型Qwen3-Max。这款被业界视为技术突破的模型,不仅在基础架构上实现全面升级,更在多维度能力测试中展现出超越同类产品

2025-09-26.

物联网窨井液位监测系统保障城市排水安全

城市地下管网作为现代城市的“生命线”,其运行状态直接影响着城市安全。窨井作为管网系统的关键节点,液位异常不仅可能导致道路积水、设施损坏,甚至可能引发城市内涝等严重问题。传统的人工巡检方式效率低、实时

2025-09-26.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
怒之铁拳
怒之铁拳 角色扮演 2025-09-26更新
查看
三国志大战九游
三国志大战九游 棋牌策略 2025-09-26更新
查看
航海王壮志雄心
航海王壮志雄心 角色扮演 2025-09-26更新
查看
见习猎魔团手游
见习猎魔团手游 角色扮演 2025-09-26更新
查看
进击的战场
进击的战场 飞行射击 2025-09-26更新
查看
企鹅努力飞
企鹅努力飞 休闲益智 2025-09-26更新
查看
命运战歌手游
命运战歌手游 棋牌策略 2025-09-26更新
查看
光年计划
光年计划 休闲益智 2025-09-26更新
查看
神庙逃亡2
神庙逃亡2 动作冒险 2025-09-26更新
查看
见习猎魔团
见习猎魔团 动作冒险 2025-09-26更新
查看