汪崟 1,*蒋峥 1刘斌 2
作者单位
摘要
1 武汉科技大学 信息科学与工程学院,湖北 武汉 430080
2 武汉科技大学 冶金自动化与检测技术教育部工程研究中心,湖北 武汉 430080
针对传统SIFT匹配算法复杂、特征冗余点多、难以满足实时性等问题,本文提出了一种具有局部自适应阈值的SIFT快速图像匹配算法。首先,所提方法在SIFT算法的基础上,对构建的高斯金字塔进行了优化,通过减少金字塔层数来消除冗余特征点以提高检测效率,并根据图像局部对比度来自适应提取FAST算法中的阈值从而实现高质量的特征点检测,筛选出鲁棒性较强的特征点进行更准确的匹配;其次,采用高斯圆形窗口建立32维降维特征向量,提高算法运行效率;最后,根据匹配特征点对之间的几何一致性对特征点进行提纯,有效减少误匹配。实验结果表明,本文方法在匹配精度和运算效率方面的综合表现均优于SIFT算法及其他对比匹配算法,相比传统的SIFT算法,匹配精度提高了约10%,算法运行时间缩短了约49%。在图像发生尺度、旋转以及光照变化的情况下,正确匹配率在93%以上。
SIFT算法 高斯金字塔 自适应阈值 特征描述符 图像匹配 SIFT algorithm Gaussian pyramid adaptive thresholds feature descriptor image matching 
液晶与显示
2024, 39(2): 228
付惠琛 1,2高军伟 1,2,*车鲁阳 1,2
作者单位
摘要
1 青岛大学 自动化学院,山东 青岛 266071
2 山东省工业控制技术重点实验室,山东 青岛 266071
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。
图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling 
液晶与显示
2024, 39(2): 217
作者单位
摘要
1 西安电子科技大学空间科学与技术学院,西安 710126
2 北京航空航天大学电子信息工程学院,北京 100191
3 北京空间机电研究所先进光学遥感技术北京市重点实验室,北京 100094
4 西安航天天绘数据技术有限公司,西安 710100
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35 %、2.15 %、4.1 %、3.15 %和14.34 %,且减少了36.1 %的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。
道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像 road extraction ASPP channel attention mechanism separable convolution High-Resolution Network remote sensing images 
航天返回与遥感
2024, 45(1): 111
作者单位
摘要
南京信息工程大学电子与信息工程学院,江苏 南京 210044
针对车底危险物图像拼接中存在特征点匹配精度低、匹配速度慢、拼接处存在裂缝以及拼接时间久的问题,提出一种车底危险物图像快速拼接算法。首先,利用角点检测(FAST)算法进行图像特征点提取,再用二进制鲁棒不变可扩展关键点(BRISK)算法对保留的特征点进行特征描述;其次,用快速最近邻搜索(FLANN)算法进行粗匹配;接着,使用渐进一致采样(PROSAC)算法进行特征点提纯;最后,利用拉普拉斯金字塔算法进行图像融合与拼接。实验结果表明:在车底危险物图像数据中,与SIFT、SURF、ORB算法相比,所提算法的图像特征匹配精度分别提高13.10百分点、8.59百分点、11.27百分点,匹配时间分别缩短76.26%、85.36%、10.27%,图像拼接时间分别缩短63.73%、64.21%、20.07%,拼接处不存在明显裂痕。因此,基于FAST、BRISK、PROSAC和拉普拉斯金字塔组合的图像拼接算法是一种优质的图像快速拼接算法。
图像处理 FAST算法 BRISK算法 PROSAC算法 拉普拉斯金字塔算法 图像融合 
激光与光电子学进展
2024, 61(8): 0837011
王慧 1王军 1,2,*曹召良 1,2
作者单位
摘要
1 苏州科技大学物理科学与技术学院,江苏 苏州 215009
2 中国科学院长春光学精密机械与物理研究所应用光学国家重点实验室,吉林 长春 130033
针对传统水接触角测量过程需要人工干预,导致测量结果精度低、可复现性差等问题,提出一种基于改进Faster RCNN的水接触角测量方法。首先,把Faster RCNN骨干网络VGG16替换为ResNet101,在其残差块末尾处添加注意力机制模型convolutional block attention module(CBAM),增强网络提取特征的能力;其次,融入特征金字塔网络(FPN),充分提取不同尺度下的特征信息,此外,引入Focal损失函数来解决正负类样本不均衡的问题;最后,对定位到的水滴进行边缘检测和角点提取,再利用迭代重加权最小二乘法(IRLS)拟合椭圆轮廓计算水接触角。实验结果表明,改进后的Faster RCNN目标检测算法与原算法相比,平均精度均值提高10.794%,速度提升11 frame/s,水接触角测量结果平均标准偏差为0.109°。
图像处理 水接触角 特征金字塔网络 注意力机制 Faster RCNN 
激光与光电子学进展
2024, 61(8): 0812002
作者单位
摘要
苏州科技大学电子与信息工程学院,江苏 苏州 215009
为进一步提升高动态范围图像在普通显示器上的呈现效果,提出了一种基于改进拉普拉斯金字塔的高动态范围图像色调映射算法。该算法将预处理后的图像分解为高频层和低频层,分别输入2个特征提取子网络,将2个包含不同特征的输出图像融合后再输入微调网络,最终得到感知效果优越的低动态范围图像。此外,该算法设计了自适应分组卷积模块以增强子网络提取局部和全局特征的能力。测试结果表明:与现有的先进算法相比,所提算法可以更好地压缩高动态范围图像的亮度,保留更多图像细节,拥有更加优越的客观质量指标和主观感知效果。
图像处理 高动态范围图像 色调映射 拉普拉斯金字塔 深度学习 
激光与光电子学进展
2024, 61(4): 0437009
作者单位
摘要
1 辽宁工程技术大学 软件学院,辽宁 葫芦岛 125105
2 辽宁工程技术大学 矿业学院,辽宁 阜新 123000
针对道路交通中目标所处环境复杂,存在模型对关键特征提取不充分、目标定位准确率低的问题,选取SSD模型为基本框架展开了特征提取方式、关键信息增强和非局部性特征定位的研究。首先,为针对性地解决道路交通场景下目标多尺度的问题,提出跳跃式反向特征金字塔结构,生成更具判别力的特征;其次,为解决不同语义层次的信息对特征融合过程贡献度不同的问题,设计基于注意力机制的自适应特征融合模块,在通道层面非先验地增强关键特征表达能力;最后,引入十字交叉注意力模块,提升模型对目标的位置敏感度。实验结果表明,与原始SSD模型相比,在保证实时性的情况下,改进方法的精度均值在PASCAL VOC子数据集上提升了2.6%,在自制道路交通数据集上提升了3.9%。综合考量,改进算法可广泛适用于道路车辆与行人检测任务中。
深度学习 车辆与行人检测 特征金字塔 注意力机制 特征融合 deep learning vehicle and pedestrian detection feature pyramid attention mechanism feature fusion 
液晶与显示
2023, 38(12): 1707
作者单位
摘要
武汉工程大学智能机器人湖北省重点实验室, 武汉 430000
针对遥感地物图像具有背景复杂且种类众多的特点, 利用传统算法进行分割会导致边缘模糊、信息丢失及分割精度低的问题, 提出了一种基于改进DeepLabV3+网络的语义分割算法。首先, 在主干网络中引入改进后的特征提取网络CHRNet; 其次, 使用非下采样轮廓波变换(NSCT)算法重构空洞空间金字塔池化(ASPP)模块中的全局池化操作; 最后, 在模型编码和解码阶段添加无参数的注意力机制SimAM, 加强模块间的特征传递, 提高特征利用率。实验表明, 在PASCAL VOC2012和WHDLD数据集上, 改进算法的平均交并比(MIoU)分别达到了81.56%和64.2%, 较原有算法分别提升了约4.61和2.8个百分点, 改进算法在保证分割速率的同时, 提升了分割精度。
遥感图像 非下采样轮廓波变换 空洞空间金字塔池化 注意力机制 remote sensing image DeepLabV3+ DeepLabV3+ Non-Subsampled Contourlet Transform Atrous Spatial Pyramid Pooling attention mechanism 
电光与控制
2023, 30(11):
作者单位
摘要
1 太原工业学院电子工程系, 山西太原 030008
2 长春理工大学电子信息工程学院, 吉林长春 130022
3 长春理工大学电子信息工程学院, 吉林长春 130022教育部学科创新引智基地(D17017), 吉林长春 130022
针对复杂任务场景中, 目标检测存在的多尺度特征学习能力不足、检测精度与模型参数量难以平衡的问题, 提出一种基于 CSE-YOLOv5(CBAM-SPPF-EIoU-YOLOv5, CSE-YOLOv5)模型的目标检测方法。模型以 YOLOv5主干网络框架为基础, 在浅层引入卷积块注意力机制层, 以提高模型细化特征提取能力并抑制冗余信息干扰。在深层设计了串行结构空间金字塔快速池化层, 改进了统计池化方法, 实现了由浅入深地融合多尺度关键特征信息。此外, 通过改进损失函数与优化锚框机制, 进一步增强多尺度特征学习能力。实验结果显示, CSE-YOLOv5系列模型在公开数据集 RSOD、DIOR和 DOTA上表现出良好的性能。 mAP@0.5的平均值分别为 96.8%、92.0%和 71.0%, 而 mAP@0.5:0.95的平均值分别为 87.0%、78.5%和 61.9%。此外, 该模型的推理速度满足实时性要求。与 YOLOv5系列模型相比, CSE-YOLOv5模型的性能显著提升, 并且在与其他主流模型的比较中展现出更好的检测效果。
遥感图像 目标检测 注意力机制 金字塔快速池化 多尺度目标 remote sensing images, target detection, attention 
红外技术
2023, 45(11): 1187
作者单位
摘要
重庆科技学院机械与动力工程学院,重庆 401331
现有光伏组件缺陷识别方法存在提取特征困难、实时性较差导致了对光伏组件的缺陷故障检测的识别精度不高,本文提出一种基于改进 YOLO v5算法的光伏组件红外热成像缺陷检测方法。改进后的 YOLO v5算法主要是在原来的基础上增添注意机制 SE模块,并且改进损失函数将 GIoU改为 EIoU提高模型收敛效果、最后采用 KG模块平衡特征金字塔结构对模型进行优化,用以提高 YOLOv5算法的识别精度和收敛效果。改进后的网络结构应用在 YOLO v5s模型中,在光伏组件红外图像的检测上的平均检测精度 mAP可以达到 92.8%,比原本的 YOLO v5s算法 88.3%提升了 4.5%,在精确度和召回率上的收敛效果也比原始 YOLO v5算法模型有所提高,改进后的网络结构应用于 l、m、x三种模型中,其检测精度都有所提升,因此改进后的 YOLOv5算法适用于 4种模型。
缺陷检测 深度学习 损失函数 SE模块 平衡特征金字塔结构 defect detection, deep learning, YOLOv5, loss func YOLOv5 
红外技术
2023, 45(9): 974

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!