AMD携手博洛尼亚大学推进空间AI 赋能机器人及自动驾驶技术
AMD Silo AI与博洛尼亚大学计算机科学与工程系(DISI)正式建立研究合作伙伴关系,致力于将显式三维几何信息深度整合到面向机器人与自动驾驶的视觉-语言-动作(VLA)模型及世界模型开发流程中,并确保其原生高效运行于AMD ROCm™开放软件平台。此次合作将DISI旗下在立体视觉与深度估计领域享有盛誉的研究团队CVLab,确立为双节点学术枢纽中的“空间AI”核心节点,与摩德纳雷焦艾米利亚大学(UniMoRE)形成协同。该枢纽将持续为AMD Silo AI的开放式物理AI研究项目“世界模型铸造厂”(World Models Foundry)提供关键技术支撑,并与欧盟科学AI工厂等欧洲前沿战略计划保持紧密联动。

AMD软件开发高级总监Niko Vuokko对此表示:“下一代机器人与自动驾驶技术的突破,不仅需要能够识别或生成内容的AI系统,更关键的是构建对三维物理世界具有深刻、一致理解的智能体。这些系统必须在时间推移和视角变换中保持稳定认知,并在计算平台上实现高性能运行。这正是我们此次合作的战略目标。”他进一步阐述:“我们将携手DISI及生态系统伙伴,共同构建当前VLA与世界模型流水线中所缺失的‘空间AI’感知层。我们的目标是将几何理解领域的前沿学术成果,转化为开放、高性能且原生支持ROCm的软件模块,从而推动整个物理AI生态系统的实质性进步。”
DISI CVLab在立体视觉、深度估计与三维场景重建方面拥有长期深厚的技术积淀,其研究成果屡次发表于CVPR、ICCV、ECCV等国际顶级计算机视觉会议。根据合作框架,AMD Silo AI将与CVLab联合研发先进的感知与场景表示模块,将显式的三维几何与深度信息无缝集成到端到端的VLA架构及世界模型架构中。所有研究工作将优先适配并优化于AMD Instinct™ MI系列GPU及未来的ROCm平台。
三大核心研究方向
本次产学研合作将重点围绕以下三个核心方向展开深入探索:
几何感知骨干网络:重点研究立体视觉匹配、单目/多目深度估计、多视角感知融合、鸟瞰图(BEV)生成以及高效的三维场景表示方法。
基于ROCm的高效几何感知训练与推理:优化针对BEV与点云数据的处理流水线,开发能够集成于端到端VLA模型中的轻量化几何模块,并实现其在ROCm平台上的高性能训练与部署。
面向机器人与自动驾驶的评估体系:构建结合仿真环境与真实世界数据的综合评估基准,重点关注模型的空间推理能力、三维一致性保持,以及对视角变化、物体遮挡等复杂场景的鲁棒性。
博洛尼亚大学(DISI)副教授Matteo Poggi表示:“我们团队长期致力于研究如何让机器从二维图像中准确恢复三维世界的深度、形状与结构信息。此次合作提供了一个绝佳契机,能将我们在几何感知方面的专长,融入到更宏大的VLA与世界模型技术体系中,并直接应用于机器人与自动驾驶这一前沿领域。依托AMD强大的硬件与软件平台,我们有望将前沿的几何视觉研究成果,转化为ROCm原生的基础软件组件。这些组件将在实际平台上得到验证,并以开源形式发布,供全球开发者社区使用、改进与创新。”
需要特别指出的是,本次合作具有明确的产业落地导向——意大利知名机器人公司Generative Bionics将深度参与其中。该公司专注于为实际应用场景设计和部署全栈式人形机器人解决方案。它将与DISI、UniMoRE及AMD展开紧密的工程化协作,将真实机器人部署中遇到的挑战与经验反馈至研究环节,从而加速将空间AI科研成果转化为稳定、可用的机器人产品平台。
关于博洛尼亚大学与CVLab
博洛尼亚大学创立于1088年,是欧洲历史最悠久、学术声誉卓著的研究型大学之一。CVLab是其计算机科学与工程系下属的核心实验室,在立体视觉、深度估计、三维重建及几何感知人工智能领域拥有深厚的技术专长。其研究成果广泛发表于CVPR、ICCV、ECCV、ICRA等顶级国际会议,并积极贡献于三维视觉领域的多个开源基准测试数据集与工具生态。
合作详情问答
Q1:AMD Silo AI与博洛尼亚大学的空间AI合作具体研究什么内容?
此次合作的核心是研究如何将显式三维几何信息整合到VLA模型和世界模型开发流程中。主要聚焦三大方向:一是开发几何感知骨干网络(包括立体视觉、深度估计、BEV感知等);二是实现基于AMD ROCm平台的高效几何感知模型训练与推理优化;三是建立面向机器人与自动驾驶应用的专项评估体系。所有成果将原生支持ROCm,并向开源社区开放。
Q2:CVLab在这次合作中扮演什么角色?
CVLab是博洛尼亚大学DISI下属的顶尖计算机视觉研究团队,尤其在立体视觉、深度估计和三维重建方面积累深厚。在此次合作中,CVLab被定位为双节点学术枢纽中的“空间AI”技术核心,负责与AMD Silo AI联合研发关键的感知与三维表示模块,目标是将几何理解的前沿算法转化为高性能、开源、且原生支持ROCm的软件工具。
Q3:Generative Bionics在此次合作中起到什么作用?
Generative Bionics是意大利一家领先的机器人技术公司,专注于全栈式人形机器人系统的研发与场景化部署。在此次合作中,该公司将作为重要的产业合作伙伴,与学术机构及AMD进行紧密的工程协作,将其在真实机器人部署中的实践经验与需求融入研究体系,从而助力空间AI研究成果快速转化为具备实际应用价值的机器人平台解决方案,确保研究的产业相关性。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Notion AI生成GitHub项目README文件功能详解与使用教程
利用NotionAI生成GitHub项目README需提供清晰指令并分步操作。首先构建结构化提示词模板,要求包含标题、功能、安装等六个部分。随后注入项目真实元数据确保内容准确。采用分段生成与人工校验避免格式错误,并可利用Notion公式动态更新版本号。最后导出为Markdown并验证渲染效果,确保文档专业可用。
阿里千问3.7编程能力全球第二,仅次于Claude
5月26日凌晨,全球最具公信力的第三方编程能力评测平台Code Arena公布了最新榜单。阿里云最新发布的旗舰大模型Qwen3 7-Max以1541分的优异成绩,一举超越了GPT-5 5、Gemini-3 5-Flash、GLM-5 1、Kimi-K2 6等众多强劲对手,在全球大模型厂商中排名第二,
可灵AI制作水彩晕染展开效果教程
使用可灵AI实现水彩晕染需启用“湿画法动态晕染”模式,设置纸基、湿润度等参数模拟物理特性。通过时间轴编辑器设置关键帧,精准控制晕染节奏与形态。叠加湿纸基底与液态牵引双滤镜层,可增强真实水性反应。还可利用图生视频功能,上传手绘水痕过程图作为种子帧并辅以精确指令,驱动AI生。
可灵与即梦AI电商短视频工具对比哪款更实用
选择电商短视频AI工具时,若侧重商品细节展示与质感还原,可灵AI在主体稳定性和细节渲染上表现更优;若注重运营效率、真人口播适配及多平台发布,即梦AI在分镜生成、唇形同步和平台兼容性方面更具优势。两者分别适合以“货”为核心和以“人”与场景为核心的制作需求。
Qoder性能监控面板实时查看CPU内存占用情况
Qoder内置性能监控面板需手动开启,可在IDE状态栏实时查看CPU与内存占用。同时可通过日志控制台查看详细资源统计,或结合系统工具交叉验证数据准确性。此外,支持将性能数据导出至外部监控平台,便于长期追踪与分析。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

