作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
作者单位
摘要
国防科技大学 电子科学学院 ATR重点实验室,湖南长沙410073
针对PointPillar在自动驾驶道路场景下对点云稀疏小目标检测效果差的问题,通过引入一种多尺度特征融合策略和注意力机制,提出一种点云目标检测网络Pillar-FFNet。针对网络中的特征提取问题,设计了一种基于残差结构的主干网络;针对馈入检测头的特征图没有充分利用高层特征的语义信息和低层特征的空间信息的问题,设计了一种简单有效的多尺度特征融合策略;针对主干网络提取的特征图中信息冗余的问题,提出了一种卷积注意力机制。为验证所提算法的性能,在KITTI和DAIR-V2X-I数据集上进行实验。实验结果表明,所提出的算法在KITTI数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.84%,2.13%和4.02%;在DAIR-V2X-I数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.33%,2.09%和4.71%,由此证明了所提方法对点云稀疏小目标检测的有效性。
小目标检测 点云稀疏 PointPillar 残差结构 多尺度特征融合 卷积注意力 small object detection point cloud sparse PointPillar residual structure multi-scale feature fusion convolutional attention 
光学 精密工程
2023, 31(19): 2910
作者单位
摘要
天津大学微电子学院,天津 300072
针对当前红外场景下多尺度车辆检测精度欠佳且算法模型复杂度高的问题,提出了基于Shuffle-RetinaNet的红外车辆检测算法。该算法以RetinaNet网络为基础,并选用ShuffleNetV2作为特征提取网络。提出双分支注意力模块,通过双分支结构和自适应融合方法增强网络对红外图像中目标关键特征的提取能力;优化特征融合网络,集成双向交叉尺度连接和快速归一化融合,增强目标多尺度特征的表达能力;设置校准因子增强分类和回归之间的任务交互,提高目标分类和定位的准确性。该算法在自建红外车辆数据集上的检测精度达到92.9%,参数量为11.74×106,浮点计算量为24.35×109,同时在公开红外数据集FLIR ADAS上也展现出较好的检测性能。实验结果表明:该算法具有较高的检测精度,且模型复杂度低,在红外车辆检测领域具有较高的应用价值。
目标检测 红外车辆 通道注意力模块 多尺度特征融合 校准因子 
激光与光电子学进展
2023, 60(24): 2410006
作者单位
摘要
河海大学计算机与信息学院,江苏 南京 210098
针对现有深度学习算法在进行医学图像配准时出现的模型对噪声敏感、精度较低等问题,提出一种基于结构光和CT图像的点云配准算法,旨在提高配准精度、算法鲁棒性的同时,避免图像采集过程中X射线带来的辐射。首先,向术中患者体表投射编码后的结构光,并使用主成分分析方法获取主轴矫正后术中患者的体表点云;然后,对术前患者进行CT扫描并进行三维重建及采样获取术前患者的体表点云。最后,构建一种基于特征重用和注意力机制的动态图卷积网络模型结合图像迭代配准算法进行人体背部点云配准。整个过程较好地融合了两种模态的信息,且具有无辐射、精度较高、用时较短等优点。
多模态点云配准 注意力机制 多尺度特征融合 主轴矫正 
激光与光电子学进展
2023, 60(22): 2210007
作者单位
摘要
1 大连民族大学 计算机科学与工程学院,大连 116600
2 大连民族大学 机器智能与生物计算研究所,大连 116600
针对磁共振成像脑肿瘤分割存在的肿瘤空间信息变化大与精细标注样本数量少的问题,提出一种基于多尺度伪影生成对抗网络的脑肿瘤影像分割方法。该方法采用三维U-Net模型来获取脑肿瘤分割结果并充当生成器,引入三维PatchGAN作为判别器来评判U-Net输出的脑肿瘤结果与真值标签,通过对抗学习方式来进行模型训练。为提升脑肿瘤分割效果,在生成器编码阶段引入伪影模块,使得在卷积过程中能够捕获到更丰富的深度特征而提升生成器的脑肿瘤生成结果;同时,在解码过程中采用多尺度特征融合方式来有效整合脑肿瘤的浅层信息与深层信息,并在对抗学习中进一步提升分割性能。在公开的BraTS2019-2020数据集上对该方法进行了评估,实验结果验证了所提出方法在脑肿瘤分割任务中的有效性,在两个验证集上获得的全肿瘤、核心肿瘤和增强肿瘤分割Dice值分别为0.902/0.903、0.836/0.826和0.77/0.782。
脑肿瘤分割 三维U-Net 生成对抗网络 伪影特征 多尺度特征融合 Brain tumor segmentation 3D U-Net Generative adversarial network Ghost feature Multi-scale feature fusion 
光子学报
2023, 52(8): 0817002
作者单位
摘要
1 广东工业大学计算机学院,广东 广州 510006
2 云南电网有限责任公司输电分公司,云南 昆明 650011
为了有效地检测复杂场景下施工人员的安全帽佩戴情况,减少安全隐患,提出一种改进的YOLOv4安全帽检测算法(SMD-YOLOv4)。首先采用SE-Net注意力模块强化模型主干网络提取有效特征的能力;然后使用密集空洞空间金字塔池化(DenseASPP)代替网络中的空间金字塔池化(SPP)以减少信息丢失,优化全局上下文信息的提取;最后在PANet部分增加特征融合的尺度并引入深度可分离卷积,使网络在获得复杂背景下小目标细节信息的同时不降低网络推理速度。实验结果表明:在自建实验数据集下,SMD-YOLOv4算法的平均精度均值(mAP)达97.34%,较目前具有代表性的Faster R-CNN、SSD、YOLOv5、YOLOx和YOLOv4算法,分别高出了26.41个百分点、6.44个百分点、3.25个百分点、1.49个百分点和3.19个百分点,能满足实时检测的需要。
目标检测 YOLOv4 安全帽检测 注意力机制 多尺度特征融合 DenseASPP 
激光与光电子学进展
2023, 60(12): 1210011
作者单位
摘要
1 西南科技大学信息工程学院, 四川 绵阳 621010
2 西南科技大学特殊环境机器人技术四川省重点实验室, 四川 绵阳 621010
针对红外与可见光图像在融合后容易出现伪影, 小目标轮廓不清晰等问题, 提出一种基于多尺度特征与注意力模型相结合的红外与可见光图像融合算法。通过 5次下采样提取源图像不同尺度的特征图, 再将同一尺度的红外与可见光特征图输入到基于注意力模型的融合层, 获得增强的融合特征图。最后把小尺度的融合特征图进行 5次上采样, 再与上采样后同一尺度的特征图相加, 直到与源图像尺度一致, 实现对特征图的多尺度融合。实验对比不同融合框架下融合图像的熵、标准差、互信息量、边缘保持度、小波特征互信息、视觉信息保真度以及融合效率, 本文方法在多数指标上优于对比算法, 且融合图像目标细节明显轮廓清晰。
图像融合 多尺度特征融合 注意力模型 红外图像 image fusion, multi-scale feature fusion, attentio 
红外技术
2023, 45(2): 143
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室,上海 201800
2 中国科学院大学,北京 100049
由于尺寸有限、外观和几何线索较少以及缺少大规模小目标数据集,从图像中检测小目标仍然是计算机视觉领域中一个具有挑战性的难题。针对这个问题,提出一种自适应特征增强的目标检测网络(YOLO-AFENet)来改善小目标的检测精度。首先,通过引入特征融合因子,设计改进的自适应双向特征融合模块,充分利用各个尺度的特征图,提高网络的特征表达能力;其次,结合网络自身的特点,提出空间注意力生成模块,通过学习图像中感兴趣区域的位置信息以提高网络的特征定位能力。在UAVDT数据集上实验结果表明:所提YOLO-AFENet的平均精度(AP)比改进前的YOLOv5提高了6.3个百分点,同时也优于其他目标检测网络。
图像处理 目标检测 小目标 多尺度特征融合 空间注意力 UAVDT 
激光与光电子学进展
2023, 60(6): 0610004
作者单位
摘要
贵州大学 大数据与信息工程学院,贵州 贵阳 550025
针对DeepLabv3+模型对图像目标边缘分割不准确、不同类目标分割不一致等问题,提出一种基于类特征注意力机制融合的语义分割算法。该算法在DeepLabv3+模型编码端先设计一个类特征注意力模块增强类别间的相关性,更好地提取和处理不同类别的语义信息。然后采用多级并行的空间金字塔池化结构增强空间之间的相关性,更好地提取图像不同尺度的上下文信息。最后在解码端利用通道注意力模块的特性对多层融合特征重新校准,抑制冗余信息,加强显著特征来提高网络的表征能力。在Pascal Voc2012和Cityscapes数据集上对改进模型进行了有效性和泛化性实验,平均交并比分别达到了81.34%和76.27%,使图像边缘分割更细致,类别更清晰,显著优于本文对比算法。
多尺度特征融合 类特征 注意力机制 语义分割 DeepLabv3+ multi-scale feature fusion class feature attention mechanism semantic segmentation DeepLabv3+ 
液晶与显示
2023, 38(2): 236
作者单位
摘要
昆明理工大学信息工程与自动化学院,云南 昆明 650500
针对轻量化网络在目标检测中检测精度低的问题,提出了一种以MobileNet为基础网络的轻量级目标检测网络MobileNet-RFB-ECA。针对目标多尺度特性,采用基于轻量化扩充感受野模块(RFB)的特征金字塔网络结构增强网络对目标多尺度特性的适应性。与此同时,针对复杂注意力模块导致计算量大的问题,在主干特征提取网络添加有效通道注意力机制模块(ECA),提高卷积神经网络的性能。实验结果表明,相较于MobileNet,所提MobileNet-RFB-ECA在PASCAL VOC数据集和KITTI数据集上检测精度分别提高了4.2个百分点和15.4个百分点,模型大小分别为50.3 MB和48.5 MB,平均检测速度为34 frame·s-1
图像处理 目标检测 轻量化神经网络 多尺度特征融合 MobileNet RFB-Net模型 有效注意力机制 
激光与光电子学进展
2023, 60(4): 0410024

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!