ResNet-18超详细介绍!!!!

ResNet-18超详细介绍!!!!残差神经网络 ResNet 是由微软研究院的何恺明 张祥雨 任少卿 孙剑等人提出的

大家好,欢迎来到IT知识分享网。

1.什么是ResNet

残差神经网络(ResNet)是由微软研究院的何恺明、张祥雨、任少卿、孙剑等人提出的。ResNet 在2015 年的ILSVRC(ImageNet Large Scale Visual Recognition Challenge)中取得了冠军。残差神经网络的主要贡献是发现了“退化现象(Degradation)”,并针对退化现象发明了 “快捷连接(Shortcut connection)”,极大的消除了深度过大的神经网络训练困难问题。 下面我将一步步引出退化现象和快捷连接。


假设一个层数较少的神经网络已经达到了较高准确率,我们可以在这个神经网络之后,拼接一段恒等变换的网络层,这些恒等变换的网络层对输入数据不做任何转换,直接返回(y=x),就能得到一个深度较大的神经网络,并且,这个深度较大的神经网络的准确率等于拼接之前的神经网络准确率,准确率没有理由降低。层数较多的神经网络,可由较浅的神经网络和恒等变换网络拼接而成,如图所示。

ResNet-18超详细介绍!!!!

1.1退化现象

由上述我们可知,随着网络深度增加,是不是准确率会一直增加呢?但是通过实验,ResNet随着网络层不断的加深,模型的准确率先是不断的提高,达到最大值(准确率饱和),然后随着网络深度的继续增加,模型准确率毫无征兆的出现大幅度的降低。这个现象与“越深的网络准确率越高”的信念显然是矛盾的、冲突的。ResNet团队把这一现象称为“退化(Degradation)”。ResNet团队把退化现象归因为深层神经网络难以实现“恒等变换(y=x)”。乍一看,让人难以置信,原来能够模拟任何函数的深层神经网络,竟然无法实现恒等变换这么简单的映射了?

让我们来回想深度学习的起源,与传统的机器学习相比,深度学习的关键特征在于网络层数更深、非线性转换(激活)、自动的特征提取和特征转换,其中,非线性转换是关键目标,它将数据映射到高纬空间以便于更好的完成“数据分类”。随着网络深度的不断增大,所引入的激活函数也越来越多,数据被映射到更加离散的空间,此时已经难以让数据回到原点(恒等变换)。或者说,神经网络将这些数据映射回原点所需要的计算量,已经远远超过我们所能承受的。

退化现象让我们对非线性转换进行反思,非线性转换极大的提高了数据分类能力,但是,随着网络的深度不断的加大,我们在非线性转换方面已经走的太远,竟然无法实现线性转换。显然,在神经网络中增加线性转换分支成为很好的选择,于是,ResNet团队在ResNet模块中增加了快捷连接分支,在线性转换和非线性转换之间寻求一个平衡。

 1.2快捷连接

这个概念的核心思想是通过添加额外的连接来解决深度神经网络训练中的梯度消失和梯度爆炸等问题,从而允许构建非常深的神经网络。 

ResNet通过引入快捷连接,允许某一层的输出直接跳过一个或多个层,连接到后续层的输入。这样做的好处是,即使某些层不做任何有意义的变换,它们仍然可以传递之前层的信息,而不会对梯度产生过多的损失。这可以用一个公式来表示:

                                ​​​​​​​        ​​​​​​​        ​​​​​​​        H(x)=F(x)+x

                    ResNet-18超详细介绍!!!!

那现在要解决的就是学习恒等映射函数了。 但是直接让一些层去拟合一个潜在的恒等映射函数H(x) = x,比较困难,这可能就是深层网络难以训练的原因。但是,如果把网络设计为H(x) = F(x) + x,如上图。我们可以转换为学习一个残差函数F(x) = H(x) – x. 只要F(x)=0,就构成了一个恒等映射H(x) = x. 而且,拟合残差肯定更加容易。

那么咱们要求解的问题变成了H(x) = F(x)+x。

  • 全0填充;
  • 采用1*1卷积。

2.ResNet结构图

ResNet-18超详细介绍!!!!

下图是论文给出的不同ResNet网络的层次需求 

ResNet-18超详细介绍!!!!

2.1ResNet18网络结构图

ResNet-18超详细介绍!!!!

2.2具体解析网络中的大小和通道的变化 

我们可以看到假设输入数据的大小为3*224*224,也就是3个通道,每个通道的大小为224*224。

ResNet-18超详细介绍!!!!

我们可以算出最后输出数据的大小为64*112*112.

(8)线性层

ResNet-18超详细介绍!!!!

3.ResNet-18实践 

具体可见,本人发表的基于ResNet-18的阿里云天池-真零基础入门CV-定长字符识别

————————->ResNet-18超详细介绍!!!!

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/111286.html

(0)
上一篇 2026-01-25 20:26
下一篇 2026-01-25 20:45

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信