首页 理论教育 GoogLeNet在深度学习中的应用

GoogLeNet在深度学习中的应用

时间:2023-11-18 理论教育 版权反馈
【摘要】:GoogLeNet是2014年ILSVRC竞赛的冠军,而那一届竞赛的亚军是VGGNet。GoogLeNet的网络结构相对VGG-Net更加复杂一些,共有22层,并且提出了一种Inception块的网络结构。Inception得名于同名电影《盗梦空间》。图5-17Inception网络结构由图5-17可以看出,Inception块进行了横向扩展,共有四条并行的分支。第四条线路则使用3×3最大池化层,并通过1×1卷积运算来改变通道数。GoogLeNet是第一个引入了“卷积神经网络不需要一直都按顺序堆叠各层”这一概念的模型。

GoogLeNet在深度学习中的应用

GoogLeNet是2014年ILSVRC竞赛的冠军,而那一届竞赛的亚军是VGGNet。GoogLeNet到底有什么过人之处?GoogLeNet的网络结构相对VGG-Net更加复杂一些,共有22层,并且提出了一种Inception块的网络结构。Inception得名于同名电影《盗梦空间》(Inception)。其结构如图5-17所示。

图5-17 Inception网络结构

由图5-17可以看出,Inception块进行了横向扩展,共有四条并行的分支。前三条分支使用窗口大小分别是1×1、3×3和5×5的卷积核来抽取不同空间尺寸下的信息,其中中间两个分支对输入先做1×1卷积来减少输入通道数,降低了模型复杂度。第四条线路则使用3×3最大池化层,并通过1×1卷积运算来改变通道数。四条分支都使用了合适的填充来使输入与输出的图像尺寸保持一致。最后将每条线路的输出合并,并输入后续的层中。(www.xing528.com)

引入Inception块的原因在于,复杂的网络会消耗巨大的计算资源,而且当卷积核个数设计不合理导致卷积核中的参数没有被完全利用时,会导致大量计算资源的浪费。考虑到神经网络权重矩阵主要是稀疏矩阵,如果能将稀疏矩阵和卷积核之间的卷积运算转换成多个等价的子矩阵和卷积核做卷积的方式则会大大降低计算量。同样,应用如图5-17所示的Inception结构,将256个均匀分布在3×3区域的特征转换成多个不同尺度的特征,如:96个1×1、96个3×3和64个5×5不同尺度汇聚在一起,这样可以使计算更加简便有效。

GoogLeNet是第一个引入了“卷积神经网络不需要一直都按顺序堆叠各层”这一概念的模型。总共使用了九个Inception模型,主干网络几乎全部使用卷积网络,仅在最终分类部分使用了一层全连接网络,由于采用了具有创造性的层次结构,解决了计算性能和计算效率的问题,其网络结构也为后续深度神经网络的架构打下了基础。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈