苹果LiTo大模型发布:单图生成3D对象,AI还原多视角光影
科技媒体IT之家3月17日消息,据外媒9to5Mac昨日报道,苹果AI研究团队发布最新突破性成果,成功攻克了3D重建领域的一项核心技术难题:仅需输入单张平面图像,即可生成完整的三维对象模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
这项名为LiTo的创新模型,打破了传统方法需要多角度图像输入的限制。在完成3D对象重建后,即使切换不同观察视角,模型生成的反光、高光等光影效果仍能保持高度的物理真实性与视觉一致性。
该突破的核心在于对"潜在空间"的创新应用。在机器学习领域,潜在空间能够将复杂信息压缩为多维数学向量,从而大幅降低计算复杂度与资源消耗。

LiTo模型首创了统一的3D潜在表示法,将随机采样的表面光场数据编码为紧凑的向量集合。这意味着模型无需死记硬背每个视觉细节,而是通过数学描述,同时掌握对象的物理形状以及光线与其表面交互的底层规律。
在具体运行机制上,LiTo编码器负责"压缩信息",将输入图像中的几何结构和视角相关的外观特征,转化为潜在空间中的精简代码。
随后,解码器执行"逆向解压",利用这些底层代码完整还原出3D对象。这种双向机制让模型能够精准复现复杂光照条件下的镜面高光和菲涅尔反射等高级光影特效。
为打造这一模型,苹果研究人员使用了数千个在150个不同视角和3种光照条件下渲染的3D对象进行高强度训练。系统通过不断抽取小部分数据样本,训练解码器在不同光照和视角下还原完整对象。
最终,模型具备了仅凭单张图片就能预测其三维潜在表示的能力。在苹果公布的最新对比测试中,LiTo在多视角光影还原度上显著超越了现有的TRELLIS模型。





游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公
新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而
OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险
新智元报道编辑:倾倾【新智元导读】2025年底,极客圈发生了一场数字哗变,Anthropic的遮羞布被Peter Steinberger撕了个精光。从OpenClaw开源到Claude被扒出80页「
华为大模型负责人离职,重大人事变动引发行业关注
智东西作者|江宇编辑|冰倩智东西3月28日报道,今日,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤在朋友圈发文,确认离职。王云鹤于2017年以华为北京部门首位实习生身份加入,至今已接近9年。在
Nature重磅:AI生成论文在顶会通过率55%,单篇成本仅15美元
新智元报道编辑:元宇【新智元导读】刚刚,Nature盖章AI独立科研时代!全新Scaling Law显现,人类死守的学术铁王座,正发生不可逆的转移。一篇长达数十页的学术论文,在人类设定研究主题和实验
CMU首创无毒AutoGEO方案,破解GEO投毒产业链焦虑
新智元报道编辑:LRST【新智元导读】ChatGPT上线广告、315曝光GEO投毒产业链,AI搜索商业化的隐忧接连浮出水面。龙虾热背后,3000元就能让AI搜索信口开河,离全面「瞎说」还有多远?来自
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

