首页 理论教育 本文检测方法实现步骤:详解与演示

本文检测方法实现步骤:详解与演示

时间:2023-11-06 理论教育 版权反馈
【摘要】:基于产生感兴趣区域时间长的问题,本文给出了基于Faster R-CNN 网络的交通标志图像检测方法,该方法可以看成是由区域生成网络和快速卷积神经网络的结合,具体的检测过程分以下几个步骤:准备实验所需的数据集和设备。可以仿照PASCAL VOC 数据的支持添加读取自己的数据的脚本文件,需要注意的是物体实例的标注信息在程序中有特定的格式,添加时要将标注信息转化为这种特定的格式。

本文检测方法实现步骤:详解与演示

基于产生感兴趣区域时间长的问题,本文给出了基于Faster R-CNN 网络的交通标志图像检测方法,该方法可以看成是由区域生成网络和快速卷积神经网络的结合,具体的检测过程分以下几个步骤:

(1)准备实验所需的数据集和设备。本文使用的数据集是GSTDB,所需的设备由3.4 节具体给出。

(2)锚点的选择和参数设定。针对锚点的选择,选用3 个面积尺度(128×128、256×256、512×512 像素)和3 个(1 ∶1、1 ∶2、2 ∶1)不同的长宽比值。区域生成网络RPN 的cls 层的输出分数使用0.7 的阈值进行非极大值抑制,每幅交通标志图像保留约2 000 个感兴趣区域。在Faster R-CNN 网络交替训练的前两个阶段以0.001 的学习率训练60 000 个min-batch,第3、4 阶段设置学习率为0.000 1 训练30 000 个 min-batch.momentum 设置为0.9,weight decay 设置为0.000 5,RPN网络的最大迭代次数为80 000,Fast R-CNN 网络的最大迭代次数为40 000。

(3)修改Faster R-CNN 源码。此处修改关键功能是实现对自定义的数据格式支持。由于实验的文件输入格式和源码中定义的输入格式并不一致,因此需要在源码中添加对自己的输入格式的支持。(www.xing528.com)

首先进入项目根目录下的lib 目录,再进入datasets目录,可以看到有对的PASCAL VOC 和微软COCO 数据的支持,分别是coco.py 和pascal_voc.py 这两个文件。可以仿照PASCAL VOC 数据的支持添加读取自己的数据的脚本文件,需要注意的是物体实例的标注信息在程序中有特定的格式,添加时要将标注信息转化为这种特定的格式。然后在修改factory.py,该文件是程序读取数据的一个入口,需要将自己的数据添加进数据工厂中去。

(4)下载预训练的ImageNet 模型,用ImageNet 网络模型去初始化RPN 网络和Faster R-CNN 网络。接下来就进入网络的训练阶段,对Faster R-CNN 网络进行训练,当网络收敛时,训练结束,同时保存训练好的网络参数。

(5)检测阶段。直接将交通标志图像输入到训练好的Faster R-CNN 网络中,对其进行判断,输出回归框和交通标志的识别率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈