当前位置: 首页
AI资讯
前Kimi训练负责人宋鸿涌投身通用机器人基座模型创业

前Kimi训练负责人宋鸿涌投身通用机器人基座模型创业

热心网友 时间:2026-05-26
转载

大模型与强化学习领域的顶尖专家Flood Sung,正式将其前沿技术积累拓展至机器人产业。据AI科技评论独家消息,原月之暗面后训练与强化学习负责人宋鸿涌(Flood Sung)已于2025年12月离任,并创立了专注于通用人形机器人的新公司——「北京十六号机器人科技有限公司」(XVI Robotics)。该公司的核心使命清晰:致力于研发与构建面向通用人形机器人的基座大模型。

企查查公开信息显示,北京十六号机器人科技有限公司成立于2025年12月。其官方定位旨在构建大规模机器人基座模型,核心目标是赋能人形机器人,使其具备理解复杂指令、进行逻辑推理并在真实物理世界中自主执行任务的能力。

从游戏AI到大模型:一位强化学习专家的进阶之路

宋鸿涌,业界更熟悉其英文名Flood Sung,在人工智能学术界与开发者社区中享有极高声誉,被视为国内强化学习(RL)领域最早进行系统性研究与布道的先驱之一。回顾其职业发展路径,他先后深耕于游戏AI、大模型后训练以及如今的机器人三大前沿方向,这条独特的轨迹恰好为其进军具身智能与机器人领域奠定了坚实的技术逻辑。

在学术研究方面,宋鸿涌在少样本学习(Few-Shot Learning)领域贡献卓著。其于2018年在CVPR上发表的里程碑论文《Learning to Compare: Relation Network for Few-Shot Learning》,引用量已突破6000次,奠定了该领域的重要基础。此外,他在GitHub上维护的开源项目「Deep-Learning-Papers-Reading-Roadmap」,收获了超过3.9万颗星标,长期是国内AI学习与进阶最具影响力的开源指南之一。

在工程与实践层面,他的经验同样深厚。2020年至2022年,他在字节跳动AI Lab担任研究科学家,深度参与了游戏AI中复杂的多智能体强化学习(MARL)项目,曾主导3D-MOBA类游戏中多智能体AI机器人的算法研发与工程落地。2023年,他加入月之暗面,担任后训练与强化学习负责人,全面主导了Kimi K1.5、K2、K2.5等系列核心模型的强化学习训练体系构建,是推动Kimi大模型持续迭代与能力跃升的关键人物。

攻坚核心赛道:通用人形机器人基座模型

宋鸿涌此次创业所选择的方向,无疑是当前具身智能与机器人领域技术壁垒最高、竞争最为激烈、同时也最受资本关注的核心赛道。

“通用人形机器人基座模型”的本质,在于将大语言模型在数字领域所展现出的强大通用认知与推理能力,有效迁移至物理世界的机器人运动控制中。其终极目标是让人形机器人能够在开放、未知的真实场景中,仅通过自然语言指令,就能理解任务、感知动态环境并自主规划出安全、合理的动作序列,而无需为每一个具体任务进行海量的数据标注与训练。

这一技术路径所面临的核心挑战——例如,如何在稀疏、延迟的环境奖励信号下实现模型的自我优化与泛化——恰恰与宋鸿涌在月之暗面所精通的RLHF(基于人类反馈的强化学习)与大模型后训练技术一脉相承。这或许正是他选择此时入局机器人赛道的内在技术逻辑与信心所在。

目前,XVI Robotics团队仍处于早期筹建与研发阶段。据悉,公司已成功获得知名投资机构的种子轮融资支持。关于具体的产品路线图、技术细节及商业化策略,公司尚未对外详细披露,后续发展值得业界持续关注。

来源:https://www.aitntnews.com/newDetail.html?newId=25378

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Duck.ai的Few-Shot提示技巧实践指南:提升AI输出效果

Duck.ai的Few-Shot提示技巧实践指南:提升AI输出效果

Few-shot提示通过嵌入高质量示例提升模型输出的准确度和可控性。关键在于示例质量而非数量,通常2到4个精炼示例即可,需覆盖不同子场景并剔除冗余信息。示例应置于提示开头,并要求模型严格遵循其格式与风格。确保示例与任务领域一致,避免跨领域干扰,最后可通过AB测试微调示例以优化输出。

时间:2026-05-26 15:24
豆包AI团队协作功能详解:如何共享对话项目实现多人协同

豆包AI团队协作功能详解:如何共享对话项目实现多人协同

要实现豆包AI多人协作共享对话项目,需满足三个核心条件:将对话项目绑定至团队空间以统一管理;设置对话级协作权限,为不同成员分配查看、评论或续写权限;启用协作会话模式确保多端同步,避免内容覆盖。还可部署AI智能体维持对话一致性,并通过版本快照锁定关键节点便于回溯。

时间:2026-05-26 15:24
Hermes Agent自动化工作流实战指南与配置教程

Hermes Agent自动化工作流实战指南与配置教程

HermesAgent支持自动化工作流构建,内置技能链可编排标准化动作序列,无需代码实现闭环。看板机制支持多任务并行协作与进度追踪,通过MCP协议连接外部系统,实现跨平台数据流转。结合定时任务与条件分支,可动态响应运行状态,并能处理非结构化文档,完成从识别、分析到分发的全链路自动化。

时间:2026-05-26 15:24
ST豆神子公司布局人工智能业务 2026年注册信息公布

ST豆神子公司布局人工智能业务 2026年注册信息公布

投资者在互动平台向上市公司提问,重点关注其旗下子公司的具体业务布局与经营范围。 公司董事会秘书对此进行了正式回复。根据官方披露的信息,该子公司全称为“豆神智算科技有限公司”,其经核准的工商经营范围明确包含人工智能应用软件研发、基础算力服务与技术解决方案提供等核心业务板块。 需要特别关注的是,这家子公

时间:2026-05-26 15:24
人工智能招标平台使用现状与盈利贡献分析

人工智能招标平台使用现状与盈利贡献分析

投资者对招标股份(股票代码:301136)的人工智能业务进展高度关注,并提出核心关切:公司旗下的人工智能招标平台目前实际应用情况如何?该平台已产生或预计能带来多少利润贡献? 公司董事会秘书对此进行了正式回应,明确了技术布局的具体载体。回复指出,公司人工智能在招标采购领域的应用,主要依托于一个明确的募

时间:2026-05-26 15:24
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程