百度网盘AI大赛:手写文字擦除(赛题二)Baseline
AI时代已到来,百度网盘与百度飞桨AI Studio强强联合,旨在基于个人云存储的生态能力开放,通过比赛机制,鼓励选手结合当下前沿的计算机视觉技术与图像处理技术,产出基于飞桨框架的开源模型方案。

1.大赛背景
百度网盘AI大赛——图像处理挑战赛是 百度网盘开放平台 面向AI开发者和爱好者发起的计算机视觉领域挑战赛。AI时代已到来,百度网盘与百度飞桨AI Studio强强联合,旨在基于个人云存储的生态能力开放,通过比赛机制,鼓励选手结合当下前沿的计算机视觉技术与图像处理技术,完成模型设计搭建与训练优化,产出基于飞桨框架的开源模型方案,为中国开源生态建设贡献一份力量。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
本次图像处理挑战赛以线上比赛的形式进行,参赛选手需要在规定时间内,完成模型设计搭建与训练优化,并提交基于评测数据集产出的结果文件,榜单排名靠前且通过代码复查的队伍可获得高额奖金。
百度网盘开放平台 致力于为全球AI开发者和爱好者提供专业、高效的AI学习与开发环境,挖掘培养AI人才,助力技术产业生态发展。我们向所有胸怀梦想的开发者发出邀请,希望大家能与百度一起,用技术让复杂的世界变得更简单。
2.数据集简介
比赛数据集
在本次比赛最新发布的数据集中,所有的图像数据均由真实场景采集得到,再通过技术手段进行相应处理,生成可用的脱敏数据集。该任务为image-to-image的形式,因此源数据和GT数据均以图片的形式来提供。各位选手可基于本次比赛最新发布的训练数据快速融入比赛,为达到更好的算法效果,本次比赛不限制大家使用额外的训练数据来优化模型。测试数据集的GT不做公开,请各位选手基于本次比赛最新发布的测试数据集提交对应的结果文件。 备注: 百度网盘坚持隐私红线,不会收集或者提供任何用户存储在百度网盘中的文件数据。
数据集构成
|- root |- images |- gts登录后复制
本次比赛最新发布的数据集共包含训练集、A榜测试集、B榜测试集三个部分,其中训练集共1000个样本,A榜测试集共200个样本,B榜测试集共200个样本; images 为带手写文字的源图像数据,gts 为无手写文字的真值数据(仅有训练集数据提供gts ,A榜测试集、B榜测试集数据均不提供gts); images 与 gts 中的图片根据图片名称一一对应。
数据集下载
本次比赛将提供带有手写文字的文档图片作为比赛数据集。 其中,训练集1000张,A榜测试数据集共200张,B榜测试数据集共200张。
正式有训练集和测试集链接,但训练集只有原始图和GT图,作者在这儿做了一份粗略的MASK图以更好的适应模型的训练:下载路径
3.Baseline模型EraseNet介绍
Introduction
文字擦除的意义
隐私保护有助于文字编辑挑战
定位文字内容合理填充前景背景保持原样示例

Architecture

Coarse-Erasure Sub-Network
该结构类似于UNet的FCN结构,其中在特征图叠加时采用下图的lateral concatenations的设计,这种设计保证了concat过程中feature map的非线性程度。
Refinement Sub-Network
该部分是Coarse Network的输出,该输出由于监督信号不足的原因导致图像中还包含部分文本信息,因此作者在加一个阶段去细化生成图像。
Segmentation Head
Segmentation Head作为辅助路径能够更好的为Coarse阶段隐式的定位文本位置。
Global and local discriminator
该结构通过全局和局部鉴别,保证了整体的一致性和局部的敏感性。
4.训练及测试
4.1 准备数据集
In [ ]%cd /home/aistudio/data/!unzip /home/aistudio/data/data121581/dehw_testA_dataset.zip!unzip /home/aistudio/data/data121581/dehw_train_dataset.zip!unzip /home/aistudio/data/data122013/mask.zip%mv mask/ dehw_train_dataset/登录后复制
解压数据集之后,数据集目录如下:
| dehw_testA_dataset/ -images| dehw_train_dataset/ -gts -images -mask登录后复制
其中mask 分支为手写文字的掩码,通过滤波算法生成的。
4.2 启动训练命令
In [ ]%cd /home/aistudio/work/!python train.py --dataset_root ../data/dehw_train_dataset/ --max_epochs 100 --batch_size 3 --sample_interval 100 --log_iters 100登录后复制
4.3 启动测试命令
运行结束后,结果文件保存在train_result/model文件夹中,通过--pretrained选择训练模型的路径进行预测
In [ ]!python test.py --dataset_root ../data/dehw_testA_dataset/ --pretrained model.pdparams登录后复制
保存的文件在test_result路径中,进入该路径创建readme.txt文件,输入要求的内容:
训练框架:PaddlePaddle代码运行环境:V100是否使用GPU:是单张图片耗时/s:0.06模型大小:75MB其他说明:该算法参考EraseNet登录后复制
然后压缩所有文件
In [ ]%cd test_result/!zip -D result.zip ./*登录后复制
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话
新智元报道编辑:元宇【新智元导读】一个让AI像原始人一样说话的插件,在HN上一夜爆火,冲破2w星。它的核心只是一条简单粗暴的prompt:删掉冠词、客套和一切废话,号称能省下75%的输出token。
季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?
AI 时代最赚钱的公司,可能从来不是做 AI 的那个。作者|张勇毅编辑|靖宇淘金热里最稳赚的人,从来不是淘金的,是卖铲子的。这句老话在 2026 年的科技行业又应验了一次。只不过这次卖铲子的不是英伟
Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体
Claw AI Lab团队量子位 | 公众号 QbitAI你还在一个人做科研吗?科研最难的,从来不是问题本身,而是一个想法从文献到实验再到写作,只能靠自己一点点往前推。一个人方向偏了没人提醒,遇到歧
让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26
面对复杂连续任务的长程规划,现有的生成式离线强化学习方法往往会暴露短板。它们生成的轨迹经常陷入局部合理但全局偏航的窘境。它们太关注眼前的每一步,却忘了最终的目的地。针对这一痛点,厦门大学和香港科技大
美国犹他州启动新试点项目:AI为患者开具精神类药物处方
IT之家 4 月 5 日消息,据外媒 PC Mag 当地时间 4 月 4 日报道,美国医疗机构 Legion Health 在犹他州获得监管批准,启动一项试点项目,允许 AI 系统为患者开具精神类药
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

