当前位置: 首页
科技数码
杨植麟详解Kimi K2.5:平台可分身百个Agents

杨植麟详解Kimi K2.5:平台可分身百个Agents

热心网友 时间:2026-01-27
转载


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

作者 | 王兆洋
邮箱 | wangzhaoyang@pingwest.com

没坐在实木茶几前,没坐在沙发里,背景也没有高雅的绿植映衬,月之暗面的CEO杨植麟在视频里站着就发布了Kimi最新的模型K2.5。

而且还是中英文双语的。

“Hi 大家好,我是植麟。”杨植麟说。“K2.5是我们目前最强大的模型,它是一个全能模型,不管是视觉还是文本,对话还是agent,思考还是非思考——所有这些能力,都集中在这一个模型里。重要的是,K2.5是一个开源模型。”

显然,一个疯狂的模型集体更新季到来了。

而即便如此,在诸多新发布的模型之间,月之暗面刚刚最新发布的Kimi K2.5依然区分度明显。

根据Kimi的数据,K2.5在包括HLE、BrowseComp 和 DeepSearchQA等极具挑战性的 agent 评测中取得了当前最佳表现。在编程能力测试上,它在 SWE-bench Verified 上拿到了 76.8 分,缩小了与顶尖闭源模型之间的差距。多项视觉理解评测上也实现了当前最佳效果。


在这些能力指标之外,更重要的是,K2.5是至今为止最能充分展现月之暗面特质的一代模型:

这家公司一直被寄予厚望的是它的算法研究和产品创新能力,而这代更全面的模型充分展示了这家公司在研究和产品设计上很强的少年气。

1

先看看K2.5的几个核心特点:

在模型具体单点的能力上,它终于有了视觉能力,可以基于视觉,包括图片和视频,进行理解和推理。同时它是一个all in one架构的模型,多模态和文本、思考和快速回答、代码和agent能力都统一于一个模型一身。

在月之暗面一直坚信的“模型即产品”思路之下,K2.5这次做了多个很有新意的功能封装。

它把视觉和编码能力结合,把模型追求的few shots甚至zero shot能力直接体现在Kimi的产品上,你可以用更简单的自然语言和更直观的视觉编辑的方式,比如直接给他一个你要的产品的视频,让它拆解后还原复刻,比如直接在生成的UI上圈圈改改,就能完成创作和开发以及修改。

最新给出的一个用视觉能力复刻项目的例子

除了前端设计,伴随K2.5,Kimi还推出了Kimi Code,可以在终端里直接运行,也能集成到 VSCode、Cursor 等主流编辑器中。你可以直接输入图片和视频进行编程辅助,而且它还可以自动发现并将你现有的Skills迁移到新的工作流中。

更亮眼的则是此次发布的但依然在beta阶段的多agent能力。Kimi直接通过产品把模型训练出来的“多agent平行与串行调度能力”封装提供了出来:

当你选择Agent集群模式,模型开始给你打造一个专业团队,100个agent集群可以同时并发,串行+并行来完成复杂任务。根据Kimi介绍,这些专项 agents 本质上都是 K2.5 的“分身”但各自承担不同的角色和子任务。

“没有任何预设的规则,所有的角色分配和任务拆解,都由 K2.5 现场即时决定。”依然是模型通用能力最终大过垂直打造工作流的产品思路。

目前Agent 集群功能正在进行 Beta 测试,部分 Kimi 会员可提前试用,接下来会逐渐推广。

而在这一切的底座上,在模型训练方法以及AI技术演进的方向上杨植麟继续完善着他scale to AGI的路线。

在训练上,Agent集群对模型提出新的要求,Kimi为此重构了强化学习的基建,专门优化了训练算法,以确保它能达到极致的效率和性能。

而从K1.5开始,每一代的模型其实都在Scale一个不同的方向,K1.5 是在 token上继续Scale,到了agent能力增强的K2,重点scale 思考的步骤,而K2.5 则是对agent的规模,也就是多agent的共同协作能力做Scale,进而保持scale的可延续。

“Scaling Out, Not Just Up.”

2

这次K2.5让Kimi变成一个全面的模型,更难得的,是这些背后都有它自己思路清晰的创新思考。

都说scaling law不持续,我就要给你延续下去,而且是一个又一个“新花样”的延续。

而且这些Scale的方向后来也都成为了模型研究界在那一阶段的主流。此次的多agent其实再次把agent swarm摆到了大家面前,这个“agent蜂巢”的概念提了很久,这次Kimi用一个模型来把它展示出来,接下来如何提高高并发、大批量、多样性以及智能“分身”的能力,会成为又一个各大厂商比拼的重点。

在此次的技术报告里,Kimi也着重分享了Agent swarm背后的创新。

K2.5使用了一种并行智能体强化学习(PARL)的方法进行训练,让模型学会自我指导一个多达100个子智能体的蜂群,在最多1500个协调步骤内执行并行工作流。而这个过程里无需预定义角色或手工设计的工作流。

PARL其实包括三个部分,一个可训练的编排智能体,负责拆解任务,“分身”出可并行化的子任务,这些子任务由动态实例化的冻结子智能体执行。

这个训练过程困难重重,比如当你让它们并行后再串联起来时,很可能会发现编排器默认退化为了单智能体执行,于是一切都崩了。Kimi为解决此问题,给PARL采用了分阶段奖励塑形,在训练早期鼓励并行,并逐步将重心转向任务成功。


这一套创新带来很好的效果。在Kimi的内部评估中,Agent Swarm使端到端运行时间缩短80%,并支持更复杂的长周期任务负载。


在广泛搜索场景下,相比单智能体执行,它将达成目标性能所需的最小关键步骤减少3至4.5倍,且节省效果随目标提升而扩展——通过并行化实现高达4.5倍的实际耗时缩减。

同时,在多模态上,它不只是给一个文本模型补上这个能力就完事了,它同样展现了自己对这个能力究竟能给人们带来什么价值的思考。

眼看人们的创造都已离不开AI却又逐渐沦陷在AI味儿的模版化里无暇逃离,它就花大力气去训模型的“美学品味”。

眼看提示词工程正变得越来越悬乎,本该简洁的AI交互里,它(很多时候瞎热闹)的复杂性正被反过来用作一种新的FOMO来源,于是Kimi强化了K2.5的意图理解能力,并且在交互上做文章——

都知道多模态是必备能力,但Kimi觉得它不该是“目的”本身,而应该是一把利刃,加持到Coding的能力上去,这样能让更多人平等的享受AI带来的编程“普惠”红利,不用陷入提示词陷阱里去。

有用户使用K2.5生成的网页 Prompt: Code me a landing page for a gym super good UI/UX single file html css javascript no limit.

Kimi从成立到今天,有一个地方一直没变,就是它是一个最有自己想法的,甚至有时候让人感到充满一股中二气质和热血感的模型公司。

一个很有意思的地方是,当这个多agent调用时,它会给不同agent起名字,在一个案例里,这些agent的名字中二气十足:


比起在榜单上对闭源模型的逼近,其实今天我们更需要的没有被困在某个阶段或是困在原地的模型和公司们,它们能让人看到继续打破一些桎梏往前走的希望,让人看到一些少年气,这真的很重要。


点个“爱心”,再走 吧

来源:https://www.163.com/dy/article/KKA1S14P0511N33R.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
蓝思科技2025成绩单:净利增超40亿,核心业务板块透视

蓝思科技2025成绩单:净利增超40亿,核心业务板块透视

蓝思科技近日公布的2025年度财务报告显示,公司全年实现营业收入744 1亿元,较上年增长6 46%;归属于母公司股东的净利润达40 18亿元,同比增长10 87%,基本每股收益为0 79元。这一业

时间:2026-03-31 10:37
搭载宁徳电池与法士特电机,乘龙H5新能源牵引车助跑绿色物流

搭载宁徳电池与法士特电机,乘龙H5新能源牵引车助跑绿色物流

在物流行业向绿色、高效转型的浪潮中,东风柳汽乘龙推出的H5新能源牵引车凭借创新设计与技术突破,成为中短途物流运输领域的焦点。这款车型以轻量化车身、高效三电系统及智能化配置为核心,为物流企业提供了兼顾

时间:2026-03-31 10:37
美股三大指数涨跌不一:纳指微跌0.73%,房利美与房地美飙升

美股三大指数涨跌不一:纳指微跌0.73%,房利美与房地美飙升

格隆汇3月31日|特朗普称与伊朗的谈判取得进展,但同时警告若霍尔木兹海峡未恢复通行,美方可能攻击伊朗能源基础设施。美股三大指数收盘涨跌不一,道指涨0 11%,纳指跌0 73%,标普500指数跌0 3

时间:2026-03-31 10:37
希迪智驾2025年报:营收增长超115%至超13亿港元

希迪智驾2025年报:营收增长超115%至超13亿港元

希迪智驾科技股份有限公司(股份代码:3881)正式登陆港交所后,交出了首份年度成绩单。根据其发布的截至2025年12月31日的年报显示,公司全年营收达8 85亿元,同比大幅增长115 8%,这一增速

时间:2026-03-31 10:37
小米SU7女性安全与电动尾翼详解,第224集答网友问

小米SU7女性安全与电动尾翼详解,第224集答网友问

小米汽车近日通过最新渠道发布了最新一期“答网友问”内容,针对新一代SU7的核心功能与安全设计进行详细解读,涵盖女性安全开发、通透模式应用及电动尾翼技术三大热点问题,引发消费者广泛关注。在安全开发领域

时间:2026-03-31 10:37
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程