阿里巴巴发布首个具身智能大模型Qwen-Robot机器人通用底座
2025年6月16日,阿里巴巴正式推出千问具身智能大模型系列——Qwen-Robot。此次一次性发布了三款核心模型:专注于操作任务的Qwen-RobotManip、精通移动导航的Qwen-RobotNa v,以及具备世界动态预测能力的Qwen-RobotWorld。 简而言之,这是千问大模型家族在具
2025年6月16日,阿里巴巴正式推出千问具身智能大模型系列——Qwen-Robot。此次一次性发布了三款核心模型:专注于操作任务的Qwen-RobotManip、精通移动导航的Qwen-RobotNa v,以及具备世界动态预测能力的Qwen-RobotWorld。

简而言之,这是千问大模型家族在具身智能领域的首次全面亮相。这三款模型分别对应机器人的三大核心能力——灵巧的操作手、精准的导航脚以及智能决策大脑,堪称给各类形态机器人装配了统一的“通用底座”。它们既可独立部署执行特定任务,也能协同工作,为机器人的真实场景落地提供了更稳固的技术支撑。
三大模型解析:手、脚、大脑的分工与协作
Qwen-RobotNa v:物理智能体的行动入口与导航核心
Qwen-RobotNa v的核心导航能力,在于将视觉语言理解与移动控制无缝衔接。借助可控观测编码和工具接口,该模型能够统一处理指令跟随、点/目标导航、目标追踪以及自动驾驶等四种不同类型的任务,从而实现了路线规划与指令理解的深度打通。
Qwen-RobotManip:物理智能体的交互基石
在操作层面,Qwen-RobotManip通过规范状态-动作空间以及相机坐标系下的末端执行器增量位姿,将视觉语言能力深度融入操作控制。尤为重要的是,其训练语料库完全基于开源数据构建,总时长超过38,100小时,支撑起大规模多机型训练——这意味着不同形态的机器人手臂都能共用这套通用操作能力。
Qwen-RobotWorld:物理智能体的无限世界
Qwen-RobotWorld更进一步,通过自然语言动作接口,使视觉语言模型具备了世界动态预测能力。同一个世界模型,能够应用于操作、驾驶、导航等多种场景,预测出符合物理规律的未来演变趋势。模拟逻辑与现实世界的界限,在此逐渐消融。
值得关注的是,5月20日阿里巴巴还发布了全新一代千问旗舰模型Qwen3.7-Max。在第三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超越了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,性能与GPT、Claude、Gemini的最强模型接近,位列国产模型第一。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:阿里巴巴发布首个具身智能大模型Qwen-Robot机器人通用底座要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点日常工作中,你是不是也经常需要快速查询资料、验证想法?一个小工具就能搞定——基于ChatGPT API的Chrome扩展,装好之后随问随答,连注册都不用折腾。 什么是 ChatGPT Chrome Extension ai chrome 扩展程序 插件? 这个Chrome扩展的本质,就是把ChatG
你是否厌倦了在搜索结果中翻页寻找答案?Candle AI 这款基于 GPT-3 的浏览器工具,能够直接为你呈现精准的文本答案——只需输入查询,它便快速生成基于网页内容的搜索结果摘要。简单来说,就是借助 AI 自动摘要与回答,省去手动筛选信息的繁琐过程。 什么是 Candle AI Chrome 扩展
在内容创作与社交媒体运营日益复杂的当下,各类工具层出不穷,但真正能将AI写作、图形设计、视频剪辑与多账号管理无缝整合的一站式平台并不多见。今天介绍的这款工具,恰好把这一点做到了极致——它是一个集成了AI能力的全流程营销解决方案,专为企业和内容创作者打通内容生产与社交发布的全链路。 什么是 Simpl
Shift-Ctrl-F 是一款集成 MobileBERT 模型的 Chrome 扩展,专注于网页内容的语义搜索与关键信息高亮,让用户在浏览时快速定位所需答案。 Shift-Ctrl-F AI Chrome 扩展程序 插件究竟是何物? 简单来说,Shift-Ctrl-F 作为一个 Chrome 扩展
- 日榜
- 周榜
- 月榜
热点快看
