SSD 网络设置多个检测特征图,并在不同特征图上检测不同大小的人脸。浅层特征图由于其有较小的感受野因而适用于小脸检测;但随着网络卷积层数的增加,感受野在不断扩大,特征图分辨率在不断降低,因而深层特征图更适合大脸检测。在深度卷积神经网络中,浅层特征图含有的语义特征不丰富,而且受限于小脸的分辨率和信息,因此对小脸进行检测是富有挑战性的任务。本章实验表明,SSD 算法对正常人脸检测的准确率较高,但对小脸检测的召回率较低,为此,MDSSD 算法对SSD 算法的检测特征图进行了改进。
深度卷积神经网络中,浅层特征图分辨率高,包含更多低级的纹理特征,但是由于特征提取不丰富,因而其包含的语义特征较少,噪声更多。而深层特征图经过多次卷积运算,提取的语义信息更丰富,但其对纹理等一些低级特征的感知能力较差,因此,MDSSD 算法通过引入上下文信息的方式来改进对小脸的检测,即通过融合多个特征层来提升人脸检测的性能,特征融合如图6-2 所示。具体来说,首先对深层特征图或深层融合层填充0,并使用3×3 卷积对填充特征图进行反卷积运算,在保证感受野范围不变的条件下使特征图的分辨率翻倍,同时使用与浅层特征图通道维度相同的卷积核数量,以保证反卷积运算输出维度与浅层融合特征图的维度相匹配。在融合方式中,有级联融合和像素融合两种方式,但为了减小模型的运算量和复杂度,MDSSD 算法在特征融合时只对浅层特征图与反卷积特征图的对应位置进行相加运算,这种强制融合多层级特征的方式能够有效增强上下文信息的作用。为了增加检测模块的非线性表达能力,模型通过在融合层添加激活层以进行非线性映射,最后将激活后的融合层作为最终的检测特征图。
(https://www.xing528.com)
图6-2 单层特征融合模块
在浅层引入上下文信息能够显著提高模型的检测能力,丰富浅层特征图的语义信息,但引入过多的上下文信息会引入大量的噪声,从而影响低分辨率小脸的检测。因此,本章根据人脸检测任务设计了多层融合和单层融合两种特征融合策略,并只对用于小脸检测的浅层检测层添加特征融合模块。对于较低层的特征图使用多层融合策略,即使用深层融合模块的反卷积层与该特征图进行融合,而对于高层特征图只进行单层融合,即该特征层只与下一模块的反卷积层融合。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
