作者单位
摘要
西安科技大学 电气与控制工程学院,陕西西安710054
针对红外行人图像中待检测目标存在多尺度及部分遮挡导致传统算法难以准确检测的问题,提出一种动态特征优化机制下的跨尺度红外行人检测算法。为解决复杂环境中行人目标特征难以有效表达进而造成目标检测精度低的问题,提出一种动态特征优化机制,通过设计亮度感知模块及EG-Chimp优化模型在增强输入图像局部对比度的同时抑制背景信息;搭建了CSPDarkNet特征提取网络,并在其基础上构建CSFF-BiFPN特征金字塔结构以及跨尺度特征融合模块,以提高检测网络对多尺度及部分遮挡行人目标的检测精度;为进一步精确定位行人目标,引入CIOU损失函数加速网络收敛,从而提升检测性能。选取9种经典检测算法在KAIST数据集上进行对比测试,实验结果表明,本文算法能够对复杂环境中的多尺度及部分遮挡红外行人目标进行准确检测,检测精度可达90.7%,验证了所提出检测网络的优势。
红外行人检测 跨尺度 动态特征优化 亮度感知 特征融合 infrared pedestrian detection cross scale dynamic feature optimization luminance perception feature fusion 
光学 精密工程
2022, 30(19): 2390
郝帅 1高山 1马旭 1,*安倍逸 1[ ... ]王峰 3
作者单位
摘要
1 西安科技大学 电气与控制工程学院,西安 710054
2 西安科技大学 安全科学与工程学院,西安 710054
3 渭南师范学院 物理与电气工程学院,陕西 渭南 714000
针对红外行人图像中受多尺度、部分遮挡以及环境干扰导致传统算法难以准确检测问题,提出一种红外图像行人检测算法。以CSPdarknet53作为主干特征提取网络,在输入端引入Focus模块以减少主干网络下采样过程中小尺度目标特征信息丢失;通过构建跨尺度特征聚合模块来融合主干网络不同残差层输出的全局特征和多尺度局部特征,提高网络多尺度特征聚合能力,提升网络检测精度;针对红外图像受自身成像机理以及复杂背景影响造成行人目标特征难以有效表达的问题,通过构建分层注意力映射模块来增强行人特征表达能力。为了验证所提出算法的优势,选取4种经典对比算法,并在3种公共数据集上进行测试验证。实验结果表明,该算法可以实现复杂环境下多尺度红外行人的准确检测,其平均准确率和召回率分别可达95.37%和92.99%。
红外行人检测 多尺度 Focus模块 空间金字塔 注意力机制 Infrared pedestrian detection Multi-scale Focus module Spatial pyramid Attention mechanism 
光子学报
2022, 51(6): 0610006
作者单位
摘要
昆明理工大学机电工程学院,云南 昆明 650500
针对辅助驾驶中夜间小目标红外行人检测精度低、网络模型占用内存空间大、检测速度难以满足实时检测要求等问题,提出了一种轻量化的夜间红外图像行人检测神经网络YOLO-Person。首先提出一种以MobileNetV3轻量化网络为骨干网络,以多尺度融合目标检测层为预测模块的网络模型,以解决网络模型大、推理速度慢的问题,大幅减少了模型计算量,初步实现轻量化;然后通过在网络中添加空间金字塔池化模块与更小感受野的检测层,增强网络输出特征图的表征能力,解决数据集中行人目标尺度大小不均衡的问题,提高模型的红外行人检测精度;最后应用通道剪枝对模型进行剪枝,减少特征图的通道数,获得最终网络模型YOLO-Person。通过Jetson Nano移动开发平台,在夜间红外图像行人数据集上验证YOLO-Person轻量化模型,结果表明:与YOLOv3网络模型相比,提出的YOLO-Person网络模型更适于移动端的夜间红外行人检测,平均检测精度达到了92.2%,检测速度由26 frame/s提高到了69 frame/s,模型大小也由246 MB减少到了11.7 MB。
成像系统 夜间红外行人检测 多尺度融合 MobileNetV3网络 模型剪枝 
中国激光
2022, 49(17): 1709002
作者单位
摘要
陆军工程大学石家庄校区电子与光学工程系, 河北 石家庄 050003
针对多尺度目标检测问题,提出一种基于深度注意力机制的多尺度红外行人检测方法。首先,选取较为轻量级的Darknet53作为深度卷积特征提取的主干网络,设计四尺度的特征金字塔网络负责目标的定位和分类,通过引入更低层高分辨率的特征图来改善对小尺度行人目标的检测性能。其次,利用注意力模块替代特征金字塔网络中传统的上采样模块,生成基于卷积特征的局部显著图,可以有效抑制不相关区域的特征响应,突出图像局部特性。最后,利用Caltech行人数据集和U-FOV红外行人数据集进行两次迁移训练,以提高模型的泛化能力,丰富行人的样本特征。实验结果表明,所提方法在U-FOV数据集上的识别平均准确率达到了93.45%,比YOLOv3高26.74个百分点,能检测到的最小行人像素为6×13。在LTIR数据集上的定性实验结果验证,所提模型具有良好的泛化能力,适用于多尺度红外行人的检测。
探测器 红外行人检测 卷积神经网络 超大视场 特征金字塔网络 注意力机制 
光学学报
2020, 40(5): 0504001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!