论文复现：WS-DAN细粒度分类问题经典之作

AI热点日报时间：2025-07-24

热点解读

本文复现了细粒度分类论文《See Better Before Looking Closer》，其提出弱监督数据增强网络，基于注意力图引导裁剪与丢弃进行增强。复现采用Inceptio

本文复现了细粒度分类论文《See Better Before Looking Closer》，其提出弱监督数据增强网络，基于注意力图引导裁剪与丢弃进行增强。复现采用InceptionV3骨干，通过双线性池化生成特征矩阵分类。实验在鸟、飞机、汽车数据集上达原论文精度，体现该数据增强策略的有效性与优越性。

论文复现：ws-dan细粒度分类问题经典之作 - 游乐网

论文复现: See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained Visual Classification

一、简介

本篇论文标题名为See Better Before Looking Closer，这是一篇细粒度分类问题的经典论文，所谓细粒度，就是在一个大类下面对小类进行细分，如对鸟、狗的品种与车、飞机的型号进行分类。对于细粒度分类问题，一般的网络只能较为普通的中等性能，如(VGG、ResNet、Inception)，而论文《 See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained Visual Classification》提出一种基于弱监督的数据增强网络，即基于注意力图引导的数据增强策略，也就是不仅仅将原图送入网络训练，将增强后的图片也送入到网络训练，最后loss取平均，该部分思想的示意图如图一所示。上半部分为训练阶段的增强策略，分别为Attention Cropping（基于注意力裁剪）与Attention Dropping（基于注意力丢弃）；下半部分为测试验证阶段的增强策略，为基于注意力的裁剪，而后resize到原图尺寸大小送入网络进行预测。

图一：基于注意力机制的数据增强

值得注意的是，一般情况我们训练模型时使用的数据增强策略为随机丢弃（遮挡）、随即裁剪等，但是这种随机的方式目的性不强，且容易引入噪声，非常容易裁剪到背景（没有起到增强作用）、或者几乎把主体部分全部裁剪掉了(对于模型收敛有不利的影响)，而本文作者提出基于注意力图生成候选区域进行有指向性的裁剪、丢弃，可谓绝佳一笔，随机数据增强方法与基于注意力引导的数据增强方法对比图如图二所示。通俗来说，基于注意图的数据增强策略的思想如下：由于注意力图会注意到图片中主题的一些细节部位，如鸟的嘴部，而通过注意力增强，鸟的嘴部会被裁剪掉，这是便会引导模型更加注重鸟的腹部、羽毛颜色等等其他信息，以此完成数据增强，这也是这篇文章的精髓所在，精度自然显著提升，后文对比试验中将会给出。

图二：随机裁剪与基于注意力的方式

本文的模型结构骨干采用InceptionV3网络，利用其中的mix6e层作为特征图，进一步生成注意力图以进行数据增强，同时注意力图与特征图进行双线性池化（BAP）操作生成最终的特征矩阵，而后flatten送入全连接层进行分类，训练阶段的网络结构如图三所示，由于采取了基于注意力引导的数据增强，使得网络更加健壮，即呼应论文标题See Better，看得更好。

图三：训练阶段网络结构示意图

测试test阶段网络整体结构大体相似，只是较训练阶段少了一个随机丢弃的数据增强操作，很明显测试阶段我们希望输入网络的图片有更加多的信息，因此也就不需要丢弃，所以这一步送入网络的图片为原图和利用特征图进行目标定位后裁剪并Resize的图像，最终预测结果概率二者取平均，这一步也叫做精修（Refinement）环节，也呼应了论文标题中的See Closer，看的更近。

图四：测试阶段网络结构示意图

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：论文复现：WS-DAN细粒度分类问题经典之作要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.php.cn/faq/1425659.html

python git 工具 ai red asic

上一篇：主流互联网游戏评论情感态势分析

下一篇：DETR:基于transformer实现端到端目标检测

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周百度官方出品度加剪辑口播自媒体必备工具 02 / 本周基于AI的智能在线个性化锻炼计划生成工具 Workout Master 03 / 本周Calorielens AI智能实时拍照分析餐点照片卡路里追踪应用 04 / 本周百度旗下首个AI互动式搜索APP简单搜索 05 / 本周QuazaAI AI驱动的智能健身平台提供个性化训练计划

01 / 本月百度官方出品度加剪辑口播自媒体必备工具 02 / 本月基于AI的智能在线个性化锻炼计划生成工具 Workout Master 03 / 本月Calorielens AI智能实时拍照分析餐点照片卡路里追踪应用 04 / 本月百度旗下首个AI互动式搜索APP简单搜索 05 / 本月QuazaAI AI驱动的智能健身平台提供个性化训练计划

热点快看

07-06 20:47百度官方出品度加剪辑口播自媒体必备工具 07-06 20:46基于AI的智能在线个性化锻炼计划生成工具 Workout Master 07-06 20:46Calorielens AI智能实时拍照分析餐点照片卡路里追踪应用 07-06 20:46百度旗下首个AI互动式搜索APP简单搜索 07-06 20:46QuazaAI AI驱动的智能健身平台提供个性化训练计划

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别