当前位置: 首页
AI
《动手学深度学习》Paddle 版源码(经典CV网络合集)

《动手学深度学习》Paddle 版源码(经典CV网络合集)

热心网友 时间:2025-07-21
转载
本文将李沐《动手学深度学习》中CV经典网络章节的mxnet代码,用Paddle 2.0重写。介绍了NiN(用1×1卷积)、GoogLeNet(Inception模块多分支)、Batch Normalization(加速收敛)、ResNet(跨层连接防梯度问题)、DenseNet(极致跨层连接)的结构与特点。

《动手学深度学习》paddle 版源码(经典cv网络合集) - 游乐网

背景

李沐老师的经典教程 -《动手学深度学习》深入浅出,相信是很多小伙伴加入深度学习门派的“接引人”,我也是读这本书入门的~。书中的内容既不要求读者已经掌握充分的数学基础,又深入到深度学习的原理层面而不只是使用现成的经典模型结构,学起来很容易上手。美中不足的是,书中的代码是用 mxnet 框架实现的。为了方便 AI Studio 上的各位大佬们通过阅读此书提高炼丹技艺,(在紫涵大佬的唆使下(狗头~))我将书中的部分介绍 CV 经典网络章节的用 mxnet 框架实现的代码(包括 NetworkInNetwork、GoogLeNet、Batch Normalization、ResNet、DenseNet),用 Paddle 2.0 版本的 API 进行了重写。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

一、Network In Network

NiN(Network In Network) 结构就是在卷积核大于1×1的普通卷积后加入多个1×1卷积核的卷积组成“网络中的内嵌网络(NiN)”。每个 NiN 模块都可以被看成一个小型的全连接神经网络,而又没全连接层那么多的参数量。这是第一个使用1×1卷积网络结构,后来的 GoogLeNet 和 ResNet 的 BottleNeck 结构等都借鉴了这一思想。

《动手学深度学习》Paddle 版源码(经典CV网络合集) - 游乐网

NiN的结构(图片来自网络)

详情参考项目:《动手学深度学习》Paddle 版源码-5.08章(NIN)

二、GoogLeNet

GoogLeNet 通过一种称为 Inception 的模块将1×1、3×3、5×5的卷积层和3×3的最大池化层拼接在一起,使其能够在一层网络中提取不同视野范围的特征。这是一种多分支结构,让模型自行提取效率最佳的感受野特征。

《动手学深度学习》Paddle 版源码(经典CV网络合集) - 游乐网

Inception 模块的结构:(图片来自网络)

详情参考项目:《动手学深度学习》Paddle 版源码-5.09章(GoogLeNet)

三、Batch Normalization

批归一化(Batch Normalization)的作用是:当数据在 DNN 网络中传播时,不断的将数据分布拉回来,避免数据的分布越来越极端,以加快模型的收敛。

《动手学深度学习》Paddle 版源码(经典CV网络合集) - 游乐网

(图片来自网络)

由上图可见,在不使用 BN 层的网络中,每经过一个神经网络层,数据都向数据分布区间的两端进一步靠拢,导致部分数据引起网络权重的剧烈变化,而另部分数据几乎起不到训练作用。在使用 BN 层后,各层输出的特征图的值的分布都是相近的,使每个特征都能比较平等的影响网络权重的更新。

详情参考项目:《动手学深度学习》Paddle 版源码-5.10章(BatchNorm)

四、ResNet

与 GoogLeNet 一样,ResNet 也是一种多分支结构。但是 ResNet 的多分支是通过跨层连接来实现的,这样能够使梯度更好的进行传播,避免梯度消失/爆炸的问题。在 ResNet 之前网络的深度只能达到20多层,在深就会导致网络退化问题。ResNet 横空出世之后网络的深度能够达到上千层,拟合能力大大提升。即使现在,ResNet 的残差结构也是应用最广泛的网络基本结构之一。下图是 ResNet 的残差结构:

《动手学深度学习》Paddle 版源码(经典CV网络合集) - 游乐网

详情参考项目:《动手学深度学习》Paddle 版源码-5.11章(ResNet)

五、DenseNet

DenseNet 将 ResNet 的跨层连接发挥到了极致。ResNet 将相邻的层之间加入快层连接,而 DenseNet 将网络中的每一层都与其他所有层进行了跨层连接。也因此,为了结构的模块化,DenseNet 的跨层连接是通过拼接而非加和实现的。实验得出,DenseNet 并不需要很宽的网络,所以作者在 DenseNet 的稠密块之间加入了转换层控制网络宽度。下图是 DenseNet 与 ResNet 的网络结构对比:

《动手学深度学习》Paddle 版源码(经典CV网络合集) - 游乐网

来源:https://www.php.cn/faq/1419690.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

新智元报道编辑:元宇【新智元导读】一个让AI像原始人一样说话的插件,在HN上一夜爆火,冲破2w星。它的核心只是一条简单粗暴的prompt:删掉冠词、客套和一切废话,号称能省下75%的输出token。

时间:2026-04-07 14:55
季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

AI 时代最赚钱的公司,可能从来不是做 AI 的那个。作者|张勇毅编辑|靖宇淘金热里最稳赚的人,从来不是淘金的,是卖铲子的。这句老话在 2026 年的科技行业又应验了一次。只不过这次卖铲子的不是英伟

时间:2026-04-07 14:49
Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claw AI Lab团队量子位 | 公众号 QbitAI你还在一个人做科研吗?科研最难的,从来不是问题本身,而是一个想法从文献到实验再到写作,只能靠自己一点点往前推。一个人方向偏了没人提醒,遇到歧

时间:2026-04-07 14:43
让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

面对复杂连续任务的长程规划,现有的生成式离线强化学习方法往往会暴露短板。它们生成的轨迹经常陷入局部合理但全局偏航的窘境。它们太关注眼前的每一步,却忘了最终的目的地。针对这一痛点,厦门大学和香港科技大

时间:2026-04-07 14:37
美国犹他州启动新试点项目:AI为患者开具精神类药物处方

美国犹他州启动新试点项目:AI为患者开具精神类药物处方

IT之家 4 月 5 日消息,据外媒 PC Mag 当地时间 4 月 4 日报道,美国医疗机构 Legion Health 在犹他州获得监管批准,启动一项试点项目,允许 AI 系统为患者开具精神类药

时间:2026-04-07 14:30
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程