作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
作者单位
摘要
中国计量大学光学与电子科技学院,浙江 杭州 310018
为解决分布式相位敏感光时域反射计系统现有事件识别方法对于相似振动信号识别困难这一问题,提出了一种基于多尺度特征融合的相似信号识别方法。在该方法中,原始信号首先通过经验模态分解和小波包分解被分解为不同频率范围内的子信号。随后,分别提取原始信号和子信号的时频特征和近似熵特征,并利用主成分分析法对所提取的特征进行融合。最后,通过构建一个6层轻量反向传播(BP)神经网络分类器,训练分类模型并利用测试集验证模型分类度。该方法对小车经过和行走等相似信号的识别准确率可分别达到98.5%和98.0%,对于敲击和摇晃差异性大的信号的识别准确率可达100%。相比于直接从原始信号中提取特征并结合时频图的卷积神经网络方式,所提方法的综合识别准确率分别提高了8.4%与9.0%,相似信号的识别准确率分别提高了13.5%与12.4%。结果表明,该方法在保证差异性大的信号的高识别准确率的基础上,显著提高了相似信号的识别准确率,对于拓展分布式光纤传感的应用范围有重要的价值。
光通信 相位敏感光时域反射计 时频特征 近似熵 多尺度特征融合 反向传播神经网络 
中国激光
2024, 51(6): 0606001
作者单位
摘要
国防科技大学 电子科学学院 ATR重点实验室,湖南长沙410073
针对PointPillar在自动驾驶道路场景下对点云稀疏小目标检测效果差的问题,通过引入一种多尺度特征融合策略和注意力机制,提出一种点云目标检测网络Pillar-FFNet。针对网络中的特征提取问题,设计了一种基于残差结构的主干网络;针对馈入检测头的特征图没有充分利用高层特征的语义信息和低层特征的空间信息的问题,设计了一种简单有效的多尺度特征融合策略;针对主干网络提取的特征图中信息冗余的问题,提出了一种卷积注意力机制。为验证所提算法的性能,在KITTI和DAIR-V2X-I数据集上进行实验。实验结果表明,所提出的算法在KITTI数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.84%,2.13%和4.02%;在DAIR-V2X-I数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.33%,2.09%和4.71%,由此证明了所提方法对点云稀疏小目标检测的有效性。
小目标检测 点云稀疏 PointPillar 残差结构 多尺度特征融合 卷积注意力 small object detection point cloud sparse PointPillar residual structure multi-scale feature fusion convolutional attention 
光学 精密工程
2023, 31(19): 2910
作者单位
摘要
1 河北工程大学 数理科学与工程学院, 河北 邯郸 056038
2 河北省计算光学成像与光电检测技术创新中心, 河北 邯郸 056038
数字全息成像是一种获得三维物体的波前信息的关键技术, 获得高质量的全息图是其首要条件, 由于受到图像传感器的约束及实验环境的影响, 所获得的数字全息图带有散斑噪声及分辨率低等问题。为了克服这一约束, 采用了一种基于深度学习的方法来提高全息图质量、图像分辨率及条纹信噪比。结果表明, 所研究算法可以应用于采集的多尺度全息图, 而且获得的高质量全息图重建效果更好, 减少散斑噪声影响, 并比较了三种损失函数在该网络训练中的性能。
全息 数字全息图 超分辨 深度学习 多尺度特征融合 holography the digital hologram super resolution deep learning characteristics of the fusion 
光学技术
2023, 49(4): 407
作者单位
摘要
天津大学微电子学院,天津 300072
针对当前红外场景下多尺度车辆检测精度欠佳且算法模型复杂度高的问题,提出了基于Shuffle-RetinaNet的红外车辆检测算法。该算法以RetinaNet网络为基础,并选用ShuffleNetV2作为特征提取网络。提出双分支注意力模块,通过双分支结构和自适应融合方法增强网络对红外图像中目标关键特征的提取能力;优化特征融合网络,集成双向交叉尺度连接和快速归一化融合,增强目标多尺度特征的表达能力;设置校准因子增强分类和回归之间的任务交互,提高目标分类和定位的准确性。该算法在自建红外车辆数据集上的检测精度达到92.9%,参数量为11.74×106,浮点计算量为24.35×109,同时在公开红外数据集FLIR ADAS上也展现出较好的检测性能。实验结果表明:该算法具有较高的检测精度,且模型复杂度低,在红外车辆检测领域具有较高的应用价值。
目标检测 红外车辆 通道注意力模块 多尺度特征融合 校准因子 
激光与光电子学进展
2023, 60(24): 2410006
作者单位
摘要
河海大学计算机与信息学院,江苏 南京 210098
针对现有深度学习算法在进行医学图像配准时出现的模型对噪声敏感、精度较低等问题,提出一种基于结构光和CT图像的点云配准算法,旨在提高配准精度、算法鲁棒性的同时,避免图像采集过程中X射线带来的辐射。首先,向术中患者体表投射编码后的结构光,并使用主成分分析方法获取主轴矫正后术中患者的体表点云;然后,对术前患者进行CT扫描并进行三维重建及采样获取术前患者的体表点云。最后,构建一种基于特征重用和注意力机制的动态图卷积网络模型结合图像迭代配准算法进行人体背部点云配准。整个过程较好地融合了两种模态的信息,且具有无辐射、精度较高、用时较短等优点。
多模态点云配准 注意力机制 多尺度特征融合 主轴矫正 
激光与光电子学进展
2023, 60(22): 2210007
作者单位
摘要
1 中国科学技术大学 生物医学工程学院(苏州)生命科学与医学部, 安徽 合肥 230026
2 中国科学院 苏州生物医学工程技术研究所, 江苏 苏州 215163
针对结直肠镜图像分辨率偏低、纹理信息偏少和细节模糊等缺点,提出了一种基于残差注意力网络的图像超分辨率重建算法SMRAN,选取结直肠息肉内窥镜图像数据集PolypsSet中的部分图像作为原始数据进行实验。首先,使用卷积网络提取低分辨率图像的浅层特征;其次,设计Res-Sobel结构对图像边缘特征进行增强;然后,通过引入不同大小的卷积核,设计多尺度特征融合模块(Multi-Scale feature Extraction Block, MEB),自适应地提取不同尺度的特征,从而得到有效的图像信息,并通过残差注意力网络将Res-Sobel模块和多尺度特征融合模块MEB进行连接;最后,通过亚像素卷积层对图像进行重建,得到最终的高分辨率图像。在尺度因子为×4时,网络在测试集上的测试结果如下: 峰值信噪比PSNR为34.25 dB,结构相似性SSIM为0.8675。实验结果表明,与传统的双三次插值算法及常用的SRCNN、RCAN等深度学习算法相比,本文提出的SMRAN对结直肠内窥镜图像具有更好的超分辨率重建效果。
内窥镜图像 超分辨率重建 残差结构 注意力机制 多尺度特征融合 索贝尔算子 endoscopic image super-resolution reconstruction residual structure attention mechanism multi-scale feature extraction Sobel operator 
中国光学
2023, 16(5): 1022
作者单位
摘要
1 大连民族大学 计算机科学与工程学院,大连 116600
2 大连民族大学 机器智能与生物计算研究所,大连 116600
针对磁共振成像脑肿瘤分割存在的肿瘤空间信息变化大与精细标注样本数量少的问题,提出一种基于多尺度伪影生成对抗网络的脑肿瘤影像分割方法。该方法采用三维U-Net模型来获取脑肿瘤分割结果并充当生成器,引入三维PatchGAN作为判别器来评判U-Net输出的脑肿瘤结果与真值标签,通过对抗学习方式来进行模型训练。为提升脑肿瘤分割效果,在生成器编码阶段引入伪影模块,使得在卷积过程中能够捕获到更丰富的深度特征而提升生成器的脑肿瘤生成结果;同时,在解码过程中采用多尺度特征融合方式来有效整合脑肿瘤的浅层信息与深层信息,并在对抗学习中进一步提升分割性能。在公开的BraTS2019-2020数据集上对该方法进行了评估,实验结果验证了所提出方法在脑肿瘤分割任务中的有效性,在两个验证集上获得的全肿瘤、核心肿瘤和增强肿瘤分割Dice值分别为0.902/0.903、0.836/0.826和0.77/0.782。
脑肿瘤分割 三维U-Net 生成对抗网络 伪影特征 多尺度特征融合 Brain tumor segmentation 3D U-Net Generative adversarial network Ghost feature Multi-scale feature fusion 
光子学报
2023, 52(8): 0817002
蔡心悦 1周杨 1,2,3,*胡校飞 1,2吕亮 1,2,3[ ... ]彭杨钊 1
作者单位
摘要
1 信息工程大学地理空间信息学院,河南 郑州 450001
2 智慧中原地理信息技术河南省协同创新中心,河南 郑州 450001
3 时空感知与智能处理自然资源部重点实验室,河南 郑州 450001
4 河南建筑职业技术学院,河南 郑州 450001
针对小目标占有像素少导致检测精确率低的问题,提出一种基于超分辨率重建的小目标检测算法。首先,通过图像预处理对高分辨率图像分块并筛选出含有目标的子图像;其次,构建超分辨率锐化增强模块,引入锐化图像和锐化损失,以获得边缘更清晰的高分辨率子图像;然后,采用多尺度锐化目标检测模块检测目标,该模块添加边缘锐化模型,在深层特征层中进一步锐化图像边缘,弥补深层卷积对细节的损失;最后,根据子图像编号将小目标检测结果回归到原图像中,完成小目标图像检测。在PASCAL VOC数据集和COCO 2017数据集上的实验结果表明,所提算法的平均精确率(mAP)分别为85.3%和54.0%,对COCO数据集的小目标检测精确率为43.5%,高于次优值9.7个百分点。因此,所提算法可以有效减少小目标漏检的次数,提高检测精确率。
图像处理 小目标检测 超分辨率增强 卷积神经网络 多尺度特征融合 边缘锐化 
激光与光电子学进展
2023, 60(12): 1210002
作者单位
摘要
1 广东工业大学计算机学院,广东 广州 510006
2 云南电网有限责任公司输电分公司,云南 昆明 650011
为了有效地检测复杂场景下施工人员的安全帽佩戴情况,减少安全隐患,提出一种改进的YOLOv4安全帽检测算法(SMD-YOLOv4)。首先采用SE-Net注意力模块强化模型主干网络提取有效特征的能力;然后使用密集空洞空间金字塔池化(DenseASPP)代替网络中的空间金字塔池化(SPP)以减少信息丢失,优化全局上下文信息的提取;最后在PANet部分增加特征融合的尺度并引入深度可分离卷积,使网络在获得复杂背景下小目标细节信息的同时不降低网络推理速度。实验结果表明:在自建实验数据集下,SMD-YOLOv4算法的平均精度均值(mAP)达97.34%,较目前具有代表性的Faster R-CNN、SSD、YOLOv5、YOLOx和YOLOv4算法,分别高出了26.41个百分点、6.44个百分点、3.25个百分点、1.49个百分点和3.19个百分点,能满足实时检测的需要。
目标检测 YOLOv4 安全帽检测 注意力机制 多尺度特征融合 DenseASPP 
激光与光电子学进展
2023, 60(12): 1210011

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!