数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

ICLR 2026：浙大哈佛Stroke3D实现2D草图到3D模型一键生成

AI热点日报时间：2026-03-03

热点解读

Stroke3D 首次实现了从2D草图和文本到可直接动画的3D资产的端到端生成，其“骨架先行”的两阶段范式为解决3D生成中的结构控制问题提供了新思路。在3D内容创作领域，传统方法往往受限于专业软件

Stroke3D首次实现了从2D草图和文字描述到可直接动画的3D资产的端到端生成，其“骨架先行”的两阶段范式为解决3D生成中的结构控制问题提供了全新思路。

在3D内容创作领域，传统方法往往受限于专业软件的高门槛和AI生成工具的局限性。然而，浙江大学与哈佛大学的研究团队近期提出的Stroke3D框架，正在引领一场3D创作的新革命！通过简单的2D草图和一句文字描述，Stroke3D就能生成带有完整骨架、纹理清晰、可直接驱动动画的3D网格模型。这一创新不仅大幅降低了3D创作的门槛，更为AR/VR、影视动画和机器人仿真等领域带来了无限可能。

论文介绍

绑定3D模型是3D变形和动画的基础。然而，现有的3D生成方法在生成可动画几何体方面面临挑战，而绑定技术又缺乏对骨骼创建的精细结构控制。

为了解决这些局限性，论文提出了一个全新框架Stroke3D，它能够直接从用户输入（2D绘制的笔触和描述性文本提示）生成绑定网格。方法开创了一种两阶段流程，将生成过程分为：可控骨骼生成，采用骨骼图VAE（Sk-VAE）将骨骼的图结构编码到一个潜在空间中，其中骨骼图DiT（Sk-DiT）生成骨骼嵌入。生成过程同时依赖于文本的语义信息和2D笔触的显式结构控制，VAE的解码器重建最终的高质量3D骨骼；通过TextuRig和SKA-DPO增强网格合成，在此基础上合成纹理网格。在此阶段，首先使用TextuRig数据集（一个包含纹理和绑定网格以及说明文字的数据集，来自Objaverse-XL）扩充现有骨骼到网格模型的训练数据，从而增强其性能。此外采用基于骨骼-网格对齐评分的偏好优化策略SKA-DPO，以进一步提高几何保真度。该框架为创建可直接用于动画的3D内容提供了更直观的工作流程。

方法概述

Stroke3D 方法

Stroke3D概述。在训练阶段，Sk-VAE将骨架图编码到潜在空间中。随后，训练Sk-DiT以生成这些潜在嵌入，并以相应的2D笔画和文本提示为条件。使用TextuRig进行训练后，我们利用SKA-DPO，通过骨架网格对齐奖励信号进一步优化SKDream。右侧展示了模型的实现细节。

骨骼生成

将骨架生成结果与RigNet、SKDream、MagicArticulate和UniRig进行了比较。

网格生成

将网格生成结果与SKDream进行比较，并展示了SKA-DPO和TextuRig的消融研究。

TextuRig 数据集

对用于网格生成的TextuRig数据集进行分析。

结论

Stroke3D首次实现了从2D草图和文本到可直接动画的3D资产的端到端生成，其“骨架先行”的两阶段范式为解决3D生成中的结构控制问题提供了新思路。该工作不仅贡献了高质量的TextuRig数据集，还提出了创新的SKA-DPO优化策略，显著提升了生成几何质量。未来，Stroke3D有望在游戏开发、虚拟人创建、影视预可视化等领域发挥巨大作用，让3D创作更接近人类最自然的表达方式——绘画和语言。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：ICLR 2026：浙大哈佛Stroke3D实现2D草图到3D模型一键生成要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.51cto.com/article/837068.html

3D 虚拟人模型

上一篇：Claude算法如何协助美国打击伊朗：关键技术解析

下一篇：阿里巴巴统一大模型品牌：千问与通义实验室解析

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本周AI驱动配音平台 Speakmulti 03 / 本周Umi-OCR图片转文字识别软件 04 / 本周用AI生成你最爱的画家或艺术运动风格绘画 05 / 本周创一AI短视频脚本工具，专为创作者与编导设计

01 / 本月Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本月AI驱动配音平台 Speakmulti 03 / 本月Umi-OCR图片转文字识别软件 04 / 本月用AI生成你最爱的画家或艺术运动风格绘画 05 / 本月创一AI短视频脚本工具，专为创作者与编导设计

热点快看

07-04 19:00Daetama数据科学完整准备工作系统指南与精选学习资源汇总 07-04 19:00AI驱动配音平台 Speakmulti 07-04 18:59Umi-OCR图片转文字识别软件 07-04 18:59用AI生成你最爱的画家或艺术运动风格绘画 07-04 18:59创一AI短视频脚本工具，专为创作者与编导设计

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别