当前位置: 首页
AI
抠像任务:基于飞桨复现BackgroundMattingV2模型

抠像任务:基于飞桨复现BackgroundMattingV2模型

热心网友 时间:2025-07-18
转载
本文介绍飞桨框架复现Real-Time-High-Resolution-Background-Matting论文的项目,含相关链接与依赖。论文网络分base和refine模块,复现采用多阶段训练,用多个数据集,添加laplacian_loss,还说明训练、验证及预测过程。

抠像任务:基于飞桨复现backgroundmattingv2模型 - 游乐网

前言

人工智能创新应用大赛——飞桨开源框架前沿模型复现专题赛,使用Paddle复现Real-Time-High-Resolution-Background-Matting论文。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

github: https://github.com/zackzhao1/BackgroundMattingV2-paddle

aistudio: https://aistudio.baidu.com/aistudio/projectdetail/2467759

依赖环境: paddlepaddle-gpu2.1.2 python3.7

论文简介

该方法中将整个pipeline划分为两个部分:base和refine部分,前一个部分在缩小分辨率的输入下生成粗略的结果输出,其主要用于提供大体的区域位置定位(coarse predcition)。后一个网络在该基础上通过path selection选取固定数量的path(这些区域主要趋向于选择头发/手等难分区域)进行refine,之后将path更新之后的结果填充回原来的结果,从而得到其在高分辨率下的matting结果。抠像任务:基于飞桨复现BackgroundMattingV2模型 - 游乐网 图1:BGMv2的网络结构,其中蓝色的是base网络,绿色的是refine网络

论文细节

BGMv2的网络分成两个模块: GbaseGbase 和 GrefineGrefine 。给定一张输入图像 II 和空屏图像 BB ,首先将其降采样 cc 倍,得到 IcIc 和 BcBc 。 GbaseGbase 取 IcIc 和 BcBc 作为输入,输出同样是降采样尺寸的前景概率 acac ,前景残差 FcRFcR ,Error Map EcEc 以及隐层节点特征 HcHc 。然后 GrefineGrefine 根据 EcEc 中值较大的像素点取 HcHc ,II 以及 BB 中对应的patch(难样本)来优化 FRFR 和 aa ,整个过程如图1所示。

base网络

BGMv2借鉴了deeplab v3的网络结构,包含骨干网络,空洞空间金字塔池化和解码器三部分组成:

骨干网络:可以采用主流的卷积网络作为,作者开源的模型包括ResNet-50,ResNet-101以及MobileNetV2,用户可以根据速度和精度的不同需求选择不同的模型;空洞空间金字塔池化:(Atrous Spatial Pyramid Pooling,ASPP)是由DeeplabV3提出并在实例分割领域得到广泛应用的结构,人像抠图和实例分割本质上式非常接近的,因此也可以通过ASPP来提升模型准确率;解码器:解码器是由一些列的双线性插值上采样和跳跃连接组成,每个卷几块由 333∗3 卷积,BN以及ReLU激活函数组成。

如前面介绍的, GbaseGbase 的输入是 IcIc 和 BcBc ,输出是 acac , FcRFcR , EcEc 以及 HcHc 。其中Error Map EcEc 的Ground Truth是 EE∗ ,Error Map是一个人像轮廓的一个图。通过对Error Map的优化,可以使得BGMv2有更好的边缘检测效果。

Refine网络

GrefineGrefine 的输入是在根据 EcEc 提取的 k 个补丁块(patches)上进行进行精校, k 可以提前指定选择top- k 个或是根据阈值卡若干个。用户也可以根据速度和精度的trade-off自行设置 k 或者阈值的具体值。对于缩放到原图 1/c1/c 的 EcEc ,我们首先将其上采样到原图的 1/4 ,那么 E4E4 中的一个点便相当于原图上一个 444∗4 的补丁块,那么相当于我们要优化的像素点的个数总共有 16k 个。

GrefineGrefine 的网络分成两个阶段:在1/2的分辨率和原尺寸的分辨率上进行精校。

抠像任务:基于飞桨复现BackgroundMattingV2模型 - 游乐网

Stage 1:首先将 GbaseGbase 的输出上采样到原图的 1/2 ;然后再根据 E4E4 选择出的补丁块,从其周围在其中提取 888∗8 的补丁块;再依次经过两组 333∗3 的有效卷积,BN,ReLU将Feature Map的尺寸依次降为 666∗6 和 444∗4 。

Stage2:再将Stage 1得到的 444∗4 的Feature Map上采样到 888∗8 ,再依次经过两组 333∗3 的有效卷积,BN,ReLU将Feature Map的最终尺寸降为 444∗4 。而这个尺寸的Feature Map对应的ground truth就是我们上面根据 E4E4 得到的补丁块。最后我们将降采样的 acac 和 FcRFcR 上采样到原图大小,再将Refine优化过后的补丁块替换到原图中便得到了最终的结果。

复现思路

1.在复现过程中我们参考论文中的方法,做了多阶段的训练,并做了修改:

stage1:使用VideoMatte240K数据集做预训练,提升模型鲁棒性。注:由于预训练耗时较长,提供了训练好得模型,方便在自己的数据上微调,模型为stage1.pdparams。

stage2:使用Distinctions646数据集做微调,提升模型细节表现。注:此时模型最好精度为SAD: 7.58,MSE: 9.49,模型为stage2.pdparams。

stage3:使用个人数据集微调。注:本次比赛提交的是stage2模型,因为训练所用数据集都为公开数据集,方便复现。 原作者在论文中也使用了个人数据集微调,但没有公开。因此我增加了自己数据进行训练,没有条件的同学可以利用原工程生成pha作为训练数据。 模型最好精度为SAD: 7.61,MSE: 9.47,模型为stage3.pdparams。

2.添加了原作者新论文中用到的laplacian_loss,可以提高收敛速度。

3.模型api对照表 https://blog.csdn.net/qq_32097577/article/details/112383360?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-2.vipsorttest&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-2.vipsorttest

复现

抠像任务:基于飞桨复现BackgroundMattingV2模型 - 游乐网

模型下载 链接:https://pan.baidu.com/s/1WfpzLcjaDJPXYSrzPWvsyQ 提取码:nsfy

训练

stage1:使用VideoMatte240K数据集做预训练,提升模型鲁棒性。

注:由于预训练耗时较长,提供了训练好得模型,方便在自己的数据上微调,模型为stage1.pdparams。

stage2:使用Distinctions646数据集做微调,提升模型细节表现。

注:此时模型最好精度为SAD: 7.58,MSE: 9.49,模型为stage2.pdparams。

**stage3:使用个人数据集微调。

注:本次比赛提交的是stage2模型,因为训练所用数据集都为公开数据集,方便复现。 原作者在论文中也使用了个人数据集微调,但没有公开。因此我增加了自己数据进行训练,没有条件的同学可以利用原工程生成pha作为训练数据。 模型最好精度为SAD: 7.61,MSE: 9.47,模型为stage3.pdparams。

In [1]
# [VideoMatte240K & PhotoMatte85 数据集](https://grail.cs.washington.edu/projects/background-matting-v2/#/datasets)# [Distinctions646_person 数据集](https://github.com/cs-chan/Total-Text-Dataset)# 数据集需要申请,请自行下载! ./run.sh
登录后复制

验证

In [2]
# 解压测试集!unzip ./data/data111962/PhotoMatte85_eval.zip -d ./data/
登录后复制In [4]
!python eval.py
登录后复制
W1013 17:35:31.830500   406 device_context.cc:404] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1W1013 17:35:31.835165   406 device_context.cc:422] device: 0, cuDNN Version: 7.6.  0%|                                                    | 0/85 [00:00登录后复制

预测

In [6]
!python predict.py
登录后复制
W1013 18:00:01.562386  1535 device_context.cc:404] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1W1013 18:00:01.567060  1535 device_context.cc:422] device: 0, cuDNN Version: 7.6.save results:./image/01_pred.webp
登录后复制
来源:https://www.php.cn/faq/1413565.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
一篇讲透:豆包、元宝、DeepSeek、Kimi、WorkBuddy,职场里到底怎么分工

一篇讲透:豆包、元宝、DeepSeek、Kimi、WorkBuddy,职场里到底怎么分工

别再把所有 AI 当成一个东西:WorkBuddy 和豆包、元宝、DeepSeek、Kimi,到底该怎么选? 这一年,AI 的进化速度着实叫人眼花缭乱。 大家的关注点,早就从“这工具能写文章吗”跳到了“它能不能帮我做方案、改稿子、整理会议纪要,甚至把任务往前推一步”。 于是,一个新问题浮出水面。 很

时间:2026-04-05 18:33
我用WorkBuddy“克隆“了一个我,从此每句话像我自己说的

我用WorkBuddy“克隆“了一个我,从此每句话像我自己说的

如何使用WorkBuddy深度学习我的说话方式,让每一份文案都自带个人风格 作为一名企业培训师,每年主讲上百场课程是行业常态。无论是线下公开课、线上直播,还是视频号、公众号的内容创作,每天的工作状态不是在授课,就是在准备各种讲稿的路上。早期借助通用AI工具辅助创作,写作效率确实有所提升,但生成的内容

时间:2026-04-05 14:34
英国视障跑者挑战马拉松,将借助智能眼镜“看”到赛道、辨别方向

英国视障跑者挑战马拉松,将借助智能眼镜“看”到赛道、辨别方向

英国视障跑者挑战马拉松,将借助智能眼镜“看”到赛道、辨别方向 最近有一则科技助残的新闻,让人眼前一亮。当地时间4月2日,英国BBC报道称,视障跑者克拉克·雷诺兹正计划借助一项创新技术,参加一场全程马拉松。这项技术的巧妙之处在于,它能让世界另一端有视力的志愿者,实时“看到”雷诺兹眼前的景象,并为他提供

时间:2026-04-05 11:03
彻底卸载 OpenClaw (龙虾) 指南

彻底卸载 OpenClaw (龙虾) 指南

彻底卸载 OpenClaw (龙虾) 指南 想把 OpenClaw(大家常叫它“龙虾”)从你的系统里清理干净?这事儿得讲究个章法,胡乱删除往往治标不治本,残留的服务和文件就像散落在角落的贝壳,时不时硌你一下。接下来,咱们就按一套稳妥的流程,帮你把它请走。 卸载原则 核心原则就一句话:先停服务,再卸工

时间:2026-04-05 10:43
AI 让英国学生“不会思考”,近 6000 名英格兰中学教师表示担忧

AI 让英国学生“不会思考”,近 6000 名英格兰中学教师表示担忧

AI让英国学生“不会思考”?近6000名教师敲响教育警钟 一项来自英国教育界的深度调查,为当前AI技术涌入课堂的热潮带来了冷静思考。据英国《卫报》4月2日报道,英格兰的中学教师们普遍观察到一种现象:随着人工智能在教育中的应用日益广泛,学生的批判性思维能力与深度思考习惯正面临下滑风险。这项由英国全国教

时间:2026-04-05 08:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程