LSTM之父:1991年残差学习已萌芽,ResNet非深度学习开端?
深度学习圈内近期再次掀起关于残差学习起源的激烈讨论。这次发声的是LSTM(长短期记忆网络)联合发明人Jürgen Schmidhuber,他公开指出何恺明团队提出的残差网络(ResNet)并非完全原创,其核心思想可追溯至1991年其学生Sepp Hochreiter的博士研究。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据Jürgen介绍,Hochreiter在攻读博士学位期间首次系统分析了循环神经网络(RNN)的梯度消失问题,并提出通过"循环残差连接"破解这一难题。该方法采用恒等激活函数实现神经单元自连接,权重严格设定为1.0,使每个时间步的输入仅叠加到先前状态。这种设计确保了误差信号在反向传播过程中保持恒定,有效避免了梯度消失或爆炸。
技术细节显示,权重精度对效果影响显著。当权重为0.99时,误差信号在100个时间步后衰减至37%;若权重降至0.9,则仅剩0.0027%。这种严格的权重设定为后续深度学习残差思想奠定了理论基础。1997年,Jürgen与Hochreiter在此基础之上提出LSTM,其核心单元"恒定误差轮盘"(CECs)通过固定权重1.0的循环残差连接,实现了误差在数百甚至数千时间步中的稳定传播。
该理论的发展脉络清晰可见:1999年vanilla LSTM引入初始值为1.0的遗忘门,形成可控残差连接;2005年通过时间反向传播(BPTT)算法将LSTM展开为深度前馈网络,使每个输入序列时间步对应虚拟层;2015年Highway网络首次将LSTM的门控残差思想引入前馈网络,通过g(x)x+t(x)h(x)的结构实现自适应残流调控;同年12月ResNet在ImageNet竞赛中取得突破性成功,其残差连接设计被Jürgen认为与展开的LSTM及初始化的Highway网络存在本质相似性。
这场争议背后,折射出深度学习领域长期存在的学术归属争议。2015年ResNet发布当年,深度学习三巨头Bengio、Hinton、LeCun在《自然》杂志联合发表综述论文时,曾因大量引用自身成果而忽略Jürgen等人的贡献引发争议。2018年图灵奖公布后,Jürgen曾撰写200余条文献引用的长文进行驳斥。在GAN(生成对抗网络)的原创性争议中,由于提出者是Bengio的学生,双方争论更为激烈。
值得注意的是,这并非Jürgen首次对主流神经网络提出起源质疑。2024年他曾公开表示,LSTM、ResNet、AlexNet、VGG Net、GAN及Transformer等重大突破均受其实验室成果启发。例如他认为AlexNet和VGG Net采用了其团队开发的DanNet架构,GAN源自1990年提出的"对抗好奇心"原则,Transformer变体则延伸自快速权重存储系统。但除LSTM的归属得到普遍认可外,其他主张尚未获得学术界广泛支持,甚至衍生出"Schmidhuber is all you need"的调侃说法。
针对当前残差学习起源的争议,有学者指出从Hochreiter的早期研究到ResNet的实践应用,体现了技术思想的渐进发展过程。尽管1991年的研究为后续突破提供了理论基础,但ResNet在架构设计和工程实现上的创新同样具有里程碑意义。这场争论或许将推动学界更深入地审视技术演进的历史脉络。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI能从单份血样检出多种神经疾病
来源:科技日报科技日报讯 (记者刘霞)由瑞典隆德大学领衔的国际研究团队,研发出一款新的人工智能(AI)模型。该模型仅需一份血液样本,便能精准识别多种神经退行性疾病。团队期望,该AI模型未来能实现“一
褪去虚火,脑机接口方能释放长远价值
来源:科技日报2026年开年,马斯克宣称脑机接口产品将于年内启动量产,引爆全球市场情绪。国内资本随即扎堆追捧,脑机接口相关概念股大幅走高,行业短期炒作虚火蔓延。进入3月,脑机接口迎来多重利好:脑机接
黎万强、洪锋退出小米科技股东名单
人民财讯4月7日电,企查查APP显示,近日,小米科技有限责任公司发生工商变更,原股东小米联合创始人黎万强、洪锋退出,同时,注册资本由18 5亿元减至约14 8亿元。 企查查信息显示,该公司成立于20
新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月
新华社北京4月7日电 新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月 新华社记者张晓茹 美国东部时间6日18时40分许(北京时间7日6时40分许),执行美国“阿耳忒弥斯2号”载人绕月飞行任
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品
聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

