杨植麟发布Kimi K2.5开源新王：智能体效能最高提升450%

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

杨植麟发布Kimi K2.5开源新王：智能体效能最高提升450%

热心网友时间：2026-01-27

转载

智东西
作者王涵
编辑云鹏

智东西1月27日报道，今天，月之暗面Kimi开源了新模型——K2.5，杨植麟还特别发视频亲自介绍。

杨植麟分享称，K2.5是Kimi迄今为止最强大的模型。面对复杂任务时，Kimi K2.5可自主调度包含多达100个子智能体的集群，并行执行最高1500次工具调用。

相较于单智能体模式，其任务执行效率提升最高达4.5倍。整个Agent集群由K2.5模型全自动创建与协调，无需任何预定义子智能体或工作流。该模型以Kimi K2为基础技术架构，在原有架构之上进行了持续的预训练优化，且训练过程中学习、融合了约15万亿个“视觉+文本”混合形式的训练数据单元。

▲K2.5模型开源页面（来源：Hugging Face）

基准测试上，在Agents方面，HLE-Full（综合推理）、BrowseComp（浏览交互）、DeepSearchQA（深度搜索问答）三个基准测试中K2.5得分均位列第一；在编码方面，K2.5在SWE-Bench Verified、SWE-Bench Multilingual两项中均排名第一；在图像多模态方面，K2.5在文档理解测试mniDocBench 1.5中得分88.8，为第一名。

▲K2.5模型基准测试

在Agent基准测试HLE、BrowseComp和SWE-Veried中，K2.5与GPT-5.2（xhigh）相比，在性能逼近的同时成本更低。

▲K2.5模型性价比对比

外网网友对Kimi K2.5模型的评价可以说是好评如潮。FireworksAI联合创始人兼首席技术官Dmytro Dzhulgakov评论称“Kimi K2.5=开源SOTA推理+视觉+256K 上下文+智能体编码”。

▲外网网友评价（来源：X）

Thrive Protocol AI与数据工程师、Ethers Club播客主持人0xSero说（他用）Kimi创建了新的页面。

▲外网网友评价（来源：X）

KEA Research协作平台创立者Stanislaw则评价Kimi看起来十分有潜力。

▲外网网友评价（来源：X）

除了K2.5模型外，针对软件工程场景，Kimi团队还推出了编程产品Kimi Code。Kimi Code可直接在终端运行，并支持与VSCode、Cursor、Zed等主流IDE集成。该产品已开源，支持图像与视频输入，还能自动发现现有技能及MCP协议并迁移至Kimi Code工作环境。

价格上，K2.5模型API输入（每百万Token）4元，缓存输入0.7元；输出（每百万Token）21元。

▲K2.5模型API价格

K2.5模型提供了四种模式：

1、快速模式：提供最快的响应体验；

2、思考模式：可以用来解答复杂问题；

3、Agent模式：擅长深度研究、PPT、Excel、Word、PDF和网页生成等任务；

4、Agent集群模式：适合需要并行处理的复杂任务。

▲K2.5模型主页

开源地址：

Hugging Face：

https://huggingface.co/moonshotai/Kimi-K2.5

魔搭社区：

https://modelscope.cn/models/moonshotai/Kimi-K2.5

一、几句话生成能交互的动态网页界面，K2.5降低视觉表达门槛

在Kimi团队内部编程基准测试集Kimi Code Bench中，K2.5在多语言环境下从构建、调试、重构、测试到脚本编写的端到端任务上均较K2有所增强。

▲内部编程基准测试集Kimi Code Bench

杨植麟称，Kimi团队不只是想让K2.5学会写代码，更希望它具备设计审美。在前端开发领域，K2.5能将简单对话转化为完整的前端界面，可以做出像专业设计师出品一样，有高级审美和动效的网页，就像这样：

在视觉编程方面，通过对图像与视频的推理，K2.5的图像/视频转代码生成与视觉调试能力增强，降低了用户通过视觉表达创意的门槛，直接上传一个录屏，就可以重建网页。

此能力源于K2.5的大规模视觉-文本联合预训练。当数据规模足够庞大时，视觉与文本能力实现同步提升。

K2.5还可以通过代码推理谜题并标记最短路径：

二、自主调动1500个协调步骤，K2.5端到端运行时间缩短80%

半年前，Kimi发布了首个万亿参数开源Agent模型Kimi K2。随后推出的Kimi K2 Thinking，通过增加思考时间，具备了独立完成长达300步操作的长程任务能力，但这还不够。

通过并行智能体强化学习（PARL）训练，K2.5模型学会了自主调度最多100个子智能体组成的集群，并行执行最多1500个协调步骤的工作流，整个过程无需预定义角色或人工设计工作流。

可以说，K2.5是从“单个专家”升级为了一个“专业团队”。

▲K2.5 Agent集群结构

K2.5 Agent集群通过并行、专门化的执行方式能够提升复杂任务的性能。在Kimi团队内部评估中，其能够将端到端运行时间缩短80%，同时支持更复杂、更长期的工作负载。

▲Kimi团队内部评估

在广泛搜索场景中，与单智能体执行相比，Agent集群可以将达到目标性能所需的最小关键步骤减少至原先的1/4到1/5.5。通过并行化，Agent集群实际运行时间最多可减少至原先的1/5.5。

▲运行时间对比

在实际任务中，例如在大规模并行处理方面，面对在100个细分领域中找出排名前三的YouTube创作者的任务，K2.5 Agent集群首先研究并定义每个领域，然后自主创建100个子智能体进行并行搜索。

每个子智能体在其分配的细分领域内识别出领先的创作者，并将结果汇总到一个结构化的电子表格中。

在大规模使用工具方面，K2.5 Agent集群仅凭一张结婚照，就能启动20个并行子智能体，生成符合当地文化背景的全球婚礼旅行场景，并将它们整合到一个具有统一身份和服饰的互动网页中。

此外，在规模化产出方面，K2.5 Agent集群可以将一项涵盖40篇社会心理学论文的文献综述任务分解为多个专注于写作的子智能体。

每个子智能体负责综述的特定部分，它们的输出最终被综合成一份100页的双栏学术文档，其中包含格式完整的引文和参考文献。

最后，在大规模下载方面，K2.5 Agent集群能够调度多个具有专业分工的子智能体，共同协作处理保罗·格雷厄姆（Paul Graham）的文章。这些子智能体分别负责搜索、下载、分类、总结与汇编任务。

在协同工作下，系统将超过200篇原始文章按主题整理至6个分类文件夹，并生成了一份结构清晰的综合摘要报告。报告中所有引用均明确标注了对应的原始文章来源。

三、AI办公质量提升近60%，K2.5能处理大规模办公任务

不仅如此，K2.5已经开始熟练掌握Office套件的核心技能。

其能够端到端处理高密度、大规模的办公任务，该模型能解析大规模高密度输入，协调多步骤工具使用，并通过直接对话生成专业级输出成果，包括Word、Excel、PPT和PDF。

KImi团队针对真实职场场景，设计了两套内部专家生产力基准测试。AI办公基准测试评估端到端的办公输出质量，而通用智能体基准测试则以人类专家表现为标准，衡量多步骤生产级工作流的表现。

在这两项测试中，在两项基准测试中，K2.5的性能分别比K2 Thinking提升了59.3%和24.3%。

▲kimi内部专家生产力基准测试

K2.5智能体支持高级办公任务，例如在Word中添加批注、使用数据透视表构建财务模型、在PDF中编写LaTeX公式，并能处理长达万字的论文或百页文档等长篇输出。

例如生成包含图片的100个镜头的分镜脚本表格：

给技术报告增添行内注释：

从数据中提取30个带密码的工资单PDF文件：

结语：月之暗面或将着重多模态及智能体集群能力

一周前，市场还在为月之暗面在20天内估值暴涨约34亿人民币的消息而惊叹。一周后，这家北京AI独角兽就开源了新模型。

此次开源的K2.5模型，最亮眼的就是其“智能体集群”能力，将AI从执行单一指令的工具，升级为能自主调度、并行处理上千步骤的“团队”，而这正直指企业级应用的核心痛点：复杂、高成本、长周期的知识工作流程自动化。

整体来看，这是一次聚焦于提升模型实际效能、扩展多模态能力的技术迭代。此次发布展示了月之暗面近期的研发重心与成果，此前曝光的新融资或为这类深度研发提供更多支持。

来源:https://www.163.com/dy/article/KKA6PKEE051180F7.html

上一篇： OpenAI最强对手，距通用AI系统再进一步

下一篇：女子乱扔充电枪引纠纷：充电桩管理难题何解

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

聪明开局吧第211关人间清醒找出32个常用字通关图文攻略

聪明开局吧第212关屋找出14个常用字图文通关攻略

超级混音带争议过大或无缘TGA年度游戏评选

聪明开局吧第213关通关攻略找出23个常用字图文详解

极限竞速地平线6抢先体验玩家破百万

聪明开局吧第214关马客页找出15个常用字图文通关攻略

魔兽世界魔铁矿石高效采集路线与刷新点详解

DNF手游史诗防具获取攻略毕业装备高效入手方法

宝可梦传说阿尔宙斯甜甜圈风味效果与获取方法

保卫萝卜4呆兔大舞台第15关通关攻略与技巧详解

inZOI双马尾美女捏脸数据与详细教程分享

异环浔抽取价值分析及培养建议

零重力体验与剧情张力指令8020的跳跃式惊吓解析

5月12日熊猫人之谜怀旧服停机维护公告

鸣潮达妮娅培养材料有哪些全等级突破与技能升级素材汇总

妖灵打工团公测时间确定正式开服日期最新公布

鸣潮3.3版本全角色培养材料清单与获取指南

小鱼传奇手游公测时间定档开服日期与版本福利详解

武侠人生路手游公测时间确定开服日期最新公告

傲视天下手游公测时间表及开服日期查询指南

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

新三国志曹操传野兽关卡攻略详解五关通关技巧全解析发布于 2026-05-18

字走山海最新礼包兑换码领取与使用教程发布于 2026-05-18

我的世界MC.JS网页版官方入口免费在线玩发布于 2026-05-18

蓬莱风起故事古今背景与剧情解析发布于 2026-05-18

火炬杂耍成就快速完成攻略发布于 2026-05-18

解限机比那卡机体操作技巧与实战玩法详解发布于 2026-05-18

聪明开局吧第236关通关攻略找出14个常用字图文详解发布于 2026-05-18

王者万象棋庄小鱼技能效果解析与实战运用发布于 2026-05-18

xertioN坦言巅峰期遭遇史上最强Vitality 发布于 2026-05-18

摩尔庄园云游戏在线秒玩入口与登录方法发布于 2026-05-18

Hally缺席令BC.G战队阵容调整面临复杂局面发布于 2026-05-18

好聽又特別的微信繁體名字大全推薦发布于 2026-05-18

火炬之光无限SS11职业强度排行与最强职业推荐发布于 2026-05-18

奇星协力风灵月影修改器2026最新版下载与使用教程发布于 2026-05-18

香缇小镇修改器2026最新版风灵月影下载使用教程发布于 2026-05-18

新浪邮箱登录入口官网登录页面发布于 2026-05-18

Win11语音搜索本地文件开启教程说话快速查找文档发布于 2026-05-18

Windows 11 虚拟化技术开启指南轻松运行虚拟机发布于 2026-05-18

Mac误删文件恢复指南苹果电脑数据找回方法详解发布于 2026-05-18

Mac清理大文件教程：快速查找与释放磁盘空间发布于 2026-05-18

Linux查看磁盘扇区大小命令详解与blockdev使用指南发布于 2026-05-18

Linux统计指定后缀文件行数脚本实例详解发布于 2026-05-18

Mac清理Sketch历史版本释放磁盘空间详细教程发布于 2026-05-18

统信UOS关闭开机磁盘自检与跳过扫描方法发布于 2026-05-18

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

杨植麟发布Kimi K2.5开源新王：智能体效能最高提升450%

特斯拉德州工厂部署14辆无方向盘自动驾驶出租车

魏牌V9X搭载归元S平台引领AI豪华出行新时代

DeepSeek估值680亿融资20亿梁文锋首次回应

WorkBuddy Tabbit OpenCLI 三角协同高效使用指南

Mythos推动AI进入行动时代从语言理解迈向动手操作

杨植麟发布Kimi K2.5开源新王：智能体效能最高提升450%

特斯拉德州工厂部署14辆无方向盘自动驾驶出租车

魏牌V9X搭载归元S平台引领AI豪华出行新时代

DeepSeek估值680亿融资20亿 梁文锋首次回应

WorkBuddy Tabbit OpenCLI 三角协同高效使用指南

Mythos推动AI进入行动时代从语言理解迈向动手操作

DeepSeek估值680亿融资20亿梁文锋首次回应