光学 精密工程
2022, 30(19): 2390
昆明理工大学机电工程学院,云南 昆明 650500
针对辅助驾驶中夜间小目标红外行人检测精度低、网络模型占用内存空间大、检测速度难以满足实时检测要求等问题,提出了一种轻量化的夜间红外图像行人检测神经网络YOLO-Person。首先提出一种以MobileNetV3轻量化网络为骨干网络,以多尺度融合目标检测层为预测模块的网络模型,以解决网络模型大、推理速度慢的问题,大幅减少了模型计算量,初步实现轻量化;然后通过在网络中添加空间金字塔池化模块与更小感受野的检测层,增强网络输出特征图的表征能力,解决数据集中行人目标尺度大小不均衡的问题,提高模型的红外行人检测精度;最后应用通道剪枝对模型进行剪枝,减少特征图的通道数,获得最终网络模型YOLO-Person。通过Jetson Nano移动开发平台,在夜间红外图像行人数据集上验证YOLO-Person轻量化模型,结果表明:与YOLOv3网络模型相比,提出的YOLO-Person网络模型更适于移动端的夜间红外行人检测,平均检测精度达到了92.2%,检测速度由26 frame/s提高到了69 frame/s,模型大小也由246 MB减少到了11.7 MB。
成像系统 夜间红外行人检测 多尺度融合 MobileNetV3网络 模型剪枝 中国激光
2022, 49(17): 1709002
陆军工程大学石家庄校区电子与光学工程系, 河北 石家庄 050003
针对多尺度目标检测问题,提出一种基于深度注意力机制的多尺度红外行人检测方法。首先,选取较为轻量级的Darknet53作为深度卷积特征提取的主干网络,设计四尺度的特征金字塔网络负责目标的定位和分类,通过引入更低层高分辨率的特征图来改善对小尺度行人目标的检测性能。其次,利用注意力模块替代特征金字塔网络中传统的上采样模块,生成基于卷积特征的局部显著图,可以有效抑制不相关区域的特征响应,突出图像局部特性。最后,利用Caltech行人数据集和U-FOV红外行人数据集进行两次迁移训练,以提高模型的泛化能力,丰富行人的样本特征。实验结果表明,所提方法在U-FOV数据集上的识别平均准确率达到了93.45%,比YOLOv3高26.74个百分点,能检测到的最小行人像素为6×13。在LTIR数据集上的定性实验结果验证,所提模型具有良好的泛化能力,适用于多尺度红外行人的检测。
探测器 红外行人检测 卷积神经网络 超大视场 特征金字塔网络 注意力机制