首页 理论教育 模型选择和训练策略优化

模型选择和训练策略优化

时间:2023-06-12 理论教育 版权反馈
【摘要】:5.1.3.3DeeplabV3+网络模型DeeplabV3+网络是谷歌推出的经典语义分割网络结构,其对空间卷积和多尺度特征的利用达到了新的高度。对以上三个模型分别进行模型训练。

模型选择和训练策略优化

研究所关注的操场和厂房目标,具备较显著的纹理、形态等辨识度特征,提取难度相对较低,基于深度学习方法实现其自动提取可以选择轻量级语义分割网络实现。研究选择深度学习语义分割中最常用的三种典型语义分割网络结构构建深度学习网络进行操场和厂房目标的识别,包括PSPNet、UNet和DeeplabV3+。为了构建轻量级的模型,实现高效提取并避免过拟合,网络选择经典的轻量级骨干网络(MobileNetV2)作为特征提取网络,构建MobileNetV2+PSPNet、MobileNetV2+UNet、MobileNetV2+DeeplabV3+三种网络模型。

5.1.3.1 PSPNet网络模型

PSPNet网络是在FCN上的改进,在多种尺度上卷积融合引入更多的上下文信息解决语境关联问题。当分割层有更多全局信息时,出现误分割的概率就会低一些,这种思想目前在许多图像领域都有所应用。其引入更多上下文信息的方式包括:一是增大分割层的感受野。这种方式是最直观的,视野越广,看到的东西也越多。而增大感受野也有许多方式,比如空洞卷积、全局(金字塔)均值池化操作。二是深层特征和浅层特征的融合。增加浅层特征的语义信息,这样在浅层进行分割时就有足够的上下文信息,同时也有目标的细节信息。这种做法早在FCN中就有了,但是包括融合策略和分割层的选择都有一定的优化空间。

5.1.3.2 UNet网络模型

UNet网络是U型对称结构,左侧是卷积层,右侧是上采样层,其核心是构建跳跃连接进行多尺度损失计算和优化。其主要结构网络特点包括:一是使用全卷积神经网络取代了全连接层。全连接层要求图像大小必须固定,而卷积则无此要求,全卷积网络是一个端到端的网络,可以输入任意尺寸的图片,同时输出的也是图片。二是UNet包括左边的收缩路径和右边的扩张路径。收缩路径就是经结构,包括几个3×3的卷积加RELU激活层再加2×2最大池化的结构,下采样的每一步特征通道数都增加一倍。扩张路径的每一步包括上采样、2×2卷积(减少一半通道数)和相应收缩路径中的剪裁过的特征层的串联,以及两个3×3卷积加RELU激活层。最后一层用了1×1卷积把64个通道映射到想要的类别种类数。 三是UNet采用了完全不同的特征融合方式:拼接。UNet采用将特征在通道维度拼接在一起,形成更厚的特征。同时这样的连接是贯穿整个网络的。网络中有四次融合过程,相对应的FCN网络只在最后一层进行融合。(www.xing528.com)

5.1.3.3 DeeplabV3+网络模型

DeeplabV3+网络是谷歌推出的经典语义分割网络结构,其对空间卷积和多尺度特征的利用达到了新的高度。其特点包括: 一是使用ASPP结构。ASPP利用对多种比例和多种有效感受野的不同分辨率特征处理,来挖掘多尺度的上下文内容信息,解编码结构逐步重构空间信息来更好地捕捉物体边界。二是添加新的解码模块,重构边界信息。把经过ASPP以及1×1卷积之后的编码特征进行 4倍上采样操作,然后拼接从主干网络中得出的相同分辨率的特征,再通过卷积以及上采样得到结果。

对以上三个模型分别进行模型训练。模型训练硬件采用Nvidia GTX1080Ti显卡,训练超参数设置包括迭代轮数300、批大小8、优化器Adam、学习率初始0.001,采用预热与余弦衰减策略,损失函数为二分类交叉熵损失函数。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈