月之暗面:一年前就验证过长思维链,因成本高先搞了长文本
2 月 18 日上午消息:月之暗面研究员反思Long-CoT路径,披露k1.5背后思考
月之暗面研究员Flood Sung最近分享了团队对于k1.5模型的完整思考脉络。他特别提到,2024年9月12日OpenAI o1模型的发布,带来了不小的震撼,也直接引发了一场关于“长思维链”有效性的深度反思。说来有趣,这种Long-CoT的有效性,其实早在一年多前就被验证过——当时,月之暗面Kimi的联合创始人周昕宇就做过实验:用很小的模型,训练它进行几十位的加减乘除运算,然后将细粒度的计算过程一步步合成出来,变成很长的思维链数据来做监督微调,效果出奇地好。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

“当时看到那个效果的震撼感,我至今记得很清楚。”Flood Sung坦言。公司当时清醒地意识到了长上下文的重要性,因此战略重心率先放在了“把上下文搞长”这件事上。相比之下,对Long-CoT的重视程度就显得不足了。现在回头看,核心的考量点其实还是成本。道理很简单:拓展长上下文主要处理的是长文本输入,有预填充技术,也有Mooncake计算框架的加持,成本和速度都在可控范围内。而Long-CoT涉及的是长文本输出,成本要高出一大截,生成速度也会慢很多。在这种情况下,优先把输出搞长,自然就没能成为最高优先级的选项。
然而,后续的反思是深刻的。Flood Sung提出了一个根本性问题:还有什么比模型性能更重要呢?成本和速度有摩尔定律托底,未来一定会持续下降。只要能把性能做上去,其他问题都是可以解决的,至少不再是主要矛盾。所以,结论很明确:必须搞Long-CoT,必须对标o1。“归根结底,我们的目标就是训练模型能像人类一样思考,自由地思考。”Flood Sung总结道。
这一系列反思并非空谈。事实上,在月之暗面Kimi的官方网站上,Flood Sung已经刊发了一篇解密o1破解过程的万字长文。这清晰地预示了,公司不仅关注到了o1的方向,并且已经开启了实质性对标与研究的步伐。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Morise.ai : AI 助力 YouTube 创作者
需求人群 Morise ai 瞄准的目标,其实非常广泛。简单来说,但凡希望在 YouTube 上有所建树的创作者,不论你是单打独斗的个人博主,还是背后有团队的商业频道,它都能派上用场。这套工具的核心价值,在于把那些繁琐、耗时的“筹备工作”自动化处理掉,让创作者能把宝贵的时间和精力,真正聚焦在内容创作
如何用即梦AI重绘图片局部文字,不会设计1分钟也能学会修改图片
有朋友问,咱们生成的一些AI图片,部分内容是乱码,可以怎样快速改成自己想要呈现的文字。 就像上面这张图展示的,如果想要把门头上的文字准确地改成“锅头的店铺”,同时还得保证新文字的风格跟原图完全匹配,有没有靠谱的办法? 解决方案 答案是肯定的。其实,借助即梦AI的智能画布功能,用它的“局部重绘”特性,
1分钟教会你通过AI做PPT,用DeepSeek一键生成 PPT
当DeepSeek遇上Kimi:1分钟生成专业PPT的协同工作流 最近AI领域的热点,想必大家都注意到了:DeepSeek这款工具,仅仅用了七天时间,全球用户量就突破了一亿大关,堪称现象级产品。 那么,如果把这个“王炸”级工具,和另一个以长文本处理闻名的AI助手Kimi组合使用,会产生什么化学反应呢
IBM 企业级 AI开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型
IBM企业级AI平台迎来新成员:DeepSeek-R1蒸馏模型正式上线 技术圈又有新动态了。就在近日,IBM正式宣布,其企业级AI开发平台watsonx ai迎来了两位重量级新成员——DeepSeek-R1蒸馏版的Llama 3 1 8B与Llama 3 3 70B模型。这意味着,企业开发者现在可以
民警利用 AI 大模型找回 70 名失踪被拐儿童,其中 18 名童年时期无照片
民警利用AI大模型,将无童年照片的被拐36年男子“带回”家 科技的力量,有时就体现在它能让看似不可能的事情,生出希望的嫩芽。春节前夕,一则来自南昌铁路公安处庐山站派出所的消息,就为我们呈现了这样一个温暖的场景:民警汪挺通过AI大模型的助力,成功帮助与被拐离散长达36年的刘水泉一家人团聚。而这次寻亲的
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

