数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名

AI热点日报时间：2025-07-17

热点解读

本文开源百度网盘AI大赛文档图像阴影消除参赛方案，基于IDR网络改进：底层加Non-Local模块，提升全局信息获取能力；特征通道增至96，增强学习能力。通过添加随机阴影等数据增强

本文开源百度网盘AI大赛文档图像阴影消除参赛方案，基于IDR网络改进：底层加Non-Local模块，提升全局信息获取能力；特征通道增至96，增强学习能力。通过添加随机阴影等数据增强提升多样性，调整损失函数使PSNR达40+。还分享了扩大卷积核等失败尝试，感谢相关支持，附各模型离线验证分数及代码相关说明。

百度网盘ai大赛：文档图像阴影消除参赛方案 ab榜第二名 - 游乐网

百度网盘AI大赛：文档图像阴影消除参赛方案开源

本项目网络源自IDR网络：Self-Supervised Image Denoising via Iterative Data Refinement

论文链接：https://arxiv.org/abs/2111.14358

github：https://github.com/zhangyi-3/IDR

项目paddle实现源自：https://aistudio.baidu.com/aistudio/projectdetail/3439099?channelType=0&channel=0

1、简介

百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名 - 游乐网

网络与UNET极为类似，用于去除噪音、摩尔纹等

DYng进行了以下改进：

在底层叠加了Non-Local模块，提高网络获取全局信息的能力。把网络特征通道从48增加到96，提高网络的学习能力。

2、本方案在此基础上，进行了以下工作：

1、数据增强借鉴原论文中的思路，对数据添加干扰，提升多样性

百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名 - 游乐网

原图：

百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名 - 游乐网

随机阴影、随机亮度、随机伽马

百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名 - 游乐网

擦除和随机重组

百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名 - 游乐网

2、训练过程

训练过程中发现主要的ssim可达到99+，但psnr只有39+ 调整损失函数，原方案中损失函数为L1_loss+ssim_loss，替换为1-0.1*log10（pnsr）+ssim_loss作为损失函数。更换后，psnr达到40+。

3、大把时间踩的坑，留赠有缘人

思路1：更大的感受野，更大的卷积效果会更好，将下面三层卷积核由3调整至7

放弃原因：收敛速度变慢，模型由10M+变大到50M+，不够优雅

思路2：归一化，借鉴P2P网络，加入tanh、Instance Normalization等，加快收敛

放弃原因：图像中存在大量255值，0.5*（1+tanh）取值范围是（0，1），无法达到255，导致分数下降，Instance Normalization可能也有同样的问题，并未提高成绩

思路3：借鉴Range Scaling Global U-Net for Perceptual Image Enhancement on Mobile Devices，引入浅层特征，与最后输出层做乘运算

放弃原因：分数不升反降，留待研究突破

思路3：采用transformer编码方式重构网络

放弃原因：多次训练，pnsr无法突破30，为何分割、检测与分类都可提取到更好的信息，gan却不行，留待研究突破模型一并开源（）

4、与技术无关的总结

感谢百度举办比赛，感谢沈忱同学、朱静茹同学、秦登达同学、翟同学的支持感谢aistudio平台DYng，FreFrankiesa开源的方案

已过而立之年，依然少年心性，任性且肆意妄为

于是被生活吊打

肺炎半年，仍未痊愈

毕业延期

家庭危机

教育责任

房贷压力

科研是一条需要独行的路，迷茫且孤独

奈何，我喜欢

要有情怀，迎难而上

要保持好奇，我们都是海边捡贝壳的孩子

要有光，我就是光

成绩复现

In [ ]

!unzip data/data129115/delight_testB_dataset.zip!python submit2.py

登录后复制

训练过程

In [ ]

# 准备训练数据与环境!unzip data/data128551/dataset_v3.zip!pip install scikit-image

登录后复制 In [ ]

# 开始训练!python train.py

登录后复制

代码与工作简要介绍：

IDR 离线验证最高分70.08 0和1模型是第一批数据训练，2和3是第一批+补充数据训练，作为提交模型MBCNN 离线验证最高分 68.64 详见：https://aistudio.baidu.com/aistudio/projectdetail/3454475?contributionType=1IDR-RSG（思路三）离线验证最高分68.63 详见：modules/AIDR_arch-rsg.pytransformer网络用于任务，离线验证最高分55.92,相当于完全失败IDR+ （思路一，卷积大小修改为7）离线验证最高分69.78（感觉还有潜力，但训练速度慢，模型大，有大显存卡可以试试）

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.php.cn/faq/1411353.html

python git ai 百度网盘百度 for

上一篇：私人AI情报官：豆包AI+Perplexity实时抓取行业报告并总结

下一篇：语句生成之胡编乱造哲理和爱情生成器

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周人工智能正从预测词元转向预测物理状态 02 / 本周岁程序员猝死家属索赔10万引热议 03 / 本周五大AI模型怎么选？Claude/GPT-4o/Gemini/Grok/DeepSeek协同攻略 04 / 本周Claude 4.8提示词写作：新手高效提问避坑与选型攻略 05 / 本周GPT-5.5短板实测：推理、代码与长文本真实表现

01 / 本月人工智能正从预测词元转向预测物理状态 02 / 本月岁程序员猝死家属索赔10万引热议 03 / 本月五大AI模型怎么选？Claude/GPT-4o/Gemini/Grok/DeepSeek协同攻略 04 / 本月Claude 4.8提示词写作：新手高效提问避坑与选型攻略 05 / 本月GPT-5.5短板实测：推理、代码与长文本真实表现

热点快看

07-10 10:39人工智能正从预测词元转向预测物理状态 07-10 10:39岁程序员猝死家属索赔10万引热议 07-10 10:39五大AI模型怎么选？Claude/GPT-4o/Gemini/Grok/DeepSeek协同攻略 07-10 10:39Claude 4.8提示词写作：新手高效提问避坑与选型攻略 07-10 10:38GPT-5.5短板实测：推理、代码与长文本真实表现

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别