王慧 1王军 1,2,*曹召良 1,2
作者单位
摘要
1 苏州科技大学物理科学与技术学院,江苏 苏州 215009
2 中国科学院长春光学精密机械与物理研究所应用光学国家重点实验室,吉林 长春 130033
针对传统水接触角测量过程需要人工干预,导致测量结果精度低、可复现性差等问题,提出一种基于改进Faster RCNN的水接触角测量方法。首先,把Faster RCNN骨干网络VGG16替换为ResNet101,在其残差块末尾处添加注意力机制模型convolutional block attention module(CBAM),增强网络提取特征的能力;其次,融入特征金字塔网络(FPN),充分提取不同尺度下的特征信息,此外,引入Focal损失函数来解决正负类样本不均衡的问题;最后,对定位到的水滴进行边缘检测和角点提取,再利用迭代重加权最小二乘法(IRLS)拟合椭圆轮廓计算水接触角。实验结果表明,改进后的Faster RCNN目标检测算法与原算法相比,平均精度均值提高10.794%,速度提升11 frame/s,水接触角测量结果平均标准偏差为0.109°。
图像处理 水接触角 特征金字塔网络 注意力机制 Faster RCNN 
激光与光电子学进展
2024, 61(8): 0812002
王昊 1查涛 1乜灵梅 1张军 2[ ... ]赵友全 1,*
作者单位
摘要
1 天津大学精密仪器与光电子工程学院,天津 300072
2 甘肃康视达科技集团有限公司,甘肃 白银 730900
针对传统图像处理算法在检测隐形眼镜表面缺陷时存在精度低、耗时长、算法鲁棒性差、漏检多等问题,提出一种基于改进Faster R-CNN的隐形眼镜表面缺陷检测算法。首先,对比了3种特征提取网络的性能,选取ResNet50作为骨干网络;然后,引入特征金字塔网络(FPN),通过融合多层次的特征信息,提高Faster R-CNN的多尺度检测能力;最后,基于构建的隐形眼镜表面缺陷数据集,使用K-means++算法改进锚框的尺度和数量。实验结果表明:改进后的Faster R-CNN算法在测试集上的平均精度均值(mAP)达到了86.95%,相比于改进前的Faster R-CNN算法,提高了9.45个百分点,可以有效地检测出气泡、车削亮点、划痕、模具亮点等多种隐形眼镜典型缺陷。
智能检测 表面缺陷 Faster R-CNN 特征金字塔网络 聚类标注 
激光与光电子学进展
2023, 60(20): 2015004
李鸿 1,2,3杜芸彦 1,2,3邵林松 2,3雷铭 2,3[ ... ]毛耀 1,2,3
作者单位
摘要
1 中国科学院光束控制重点实验室, 成都 610000
2 中国科学院光电技术研究所, 成都 610000
3 中国科学院大学, 北京 100000
随着无人机的快速发展与应用, 无人机的普及也对公共安全、**安全和个人隐私等造成了一定的安全隐患。无人机具有飞行速度快、体积小等特点, 如何精准快速地发现并定位无人机位置具有一定的挑战。针对此问题, 提出了一种基于沙漏瓶颈模块的YOLOv3无人机实时检测算法。首先, 将原本3个特征尺度检测扩展为在5个特征尺度上进行检测, 充分利用多尺度信息帮助提升小目标检测精度; 然后, 堆叠沙漏瓶颈模块作为该方法的骨干网络部分, 沙漏瓶颈模块作为一种轻量化网络对模型进行加速, 并使用通道注意力机制在上采样之后的拼接部分关注更重要的通道信息, 抑制不利的信息。为了验证所提算法的有效性, 生成基于复杂城市背景下的无人机数据集, 实验结果表明, 所提算法的精度能够达到98.92%, 且具有98.76%的召回率, 在1080Ti上达到62.37 帧/s的实时速度, 模型权重大小仅为5.38 MiB, 为进一步在嵌入式平台和移动端实现实时目标检测提供了可能。
无人机检测 轻量化网络 沙漏瓶颈模块 特征金字塔网络 注意力机制 UAV detection lightweight network SandGlass Bottleneck Block feature pyramid network attention mechanism 
电光与控制
2022, 29(12): 58
作者单位
摘要
海军工程大学兵器工程学院,武汉 430000
鉴于深度学习在图像识别领域的重大进展,在无人直升机自主着舰的应用背景下,针对较为复杂的着舰环境和着舰标志设计,采用单级多区域检测(SSD)网络对着舰标志进行识别。针对SSD网络对小目标识别率低的缺点,基于深度残差网络和特征金字塔网络结构对SSD网络进行了改进,使用ResNet101代替VGG-16网络,并利用特征金字塔网络结构改进传统上采样结构,将检测网络的高层语义信息融入低层特征信息中,最后通过实验验证了改进网络的识别效果。
着舰标志识别 SSD网络 图像识别 深度残差网络 特征金字塔网络结构 identification of landing mark SSD network image recognition deep residual network feature pyramid network structure 
电光与控制
2022, 29(1): 88
作者单位
摘要
1 长沙理工大学 物理与电子科学学院, 湖南 长沙 410114
2 柔性电子材料基因工程湖南省重点实验室, 湖南 长沙 410114
3 黑山大学 电气工程学院, 黑山共和国 波德戈里察 81000
针对实时目标检测算法 Tiny YOLOv3存在的深层特征难以提取、实时性不能满足需求、边界框定位不够准确的问题, 提出一种改进的轻量级检测模型MTYOLO(MdFPN Tiny YOLOv3)。该模型构造多向特征金字塔网络(MdFPN)代替简单级联, 充分完成了多层语义信息的提取与融合; 使用深度可分离卷积代替标准卷积, 有效降低网络复杂度, 提升了检测的实时性能; 采用Complete IOU loss(CIOU loss)代替MSE作为回归损失函数, 极大地提高了边界框的回归精度。在 PASCAL VOC 和 COCO数据集上对MTYOLO进行测试, 结果表明, 改进后模型的mAP最高可达到83.7%, 检测速度最快可达到205 fps。
目标检测 特征金字塔网络 深度可分离卷积 object detection feature pyramid network deep separable convolution Complete IOU loss complete IOU loss 
液晶与显示
2021, 36(11): 1516
作者单位
摘要
西安建筑科技大学 信息与控制工程学院,陕西西安710055
高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测方法;提出最小交集(Intersection Over Minimum,IOM)后处理策略,改善因文本长宽比变化较大特性导致的掩膜重叠现象,提升检测效果。首先,模型以Resnet50为主干网络采用FPN结构捕获多尺度特征;然后,利用空洞卷积扩大特征感受野,提高特征信息的多尺度捕获能力,深层次挖掘文本细粒度特征,并通过共享核手段减少模型参数量,降低计算成本;同时,采用上下文注意模块(Context Attention Module,CxAM)捕捉多感受野间的语义信息关系,通过内容注意模块(Content Attention Module,CnAM)精确定位目标位置信息,增强多尺度融合能力,提升特征图质量;最后,将同一文本区域预测的候选框按大小排列,提出将面积最大的框与相邻文本框之间区域的交集面积占较小框面积的比值作为候选框筛选指标,抑制检测结果的掩模重叠现象,实现文本的精准检测。采用ICDAR2013、ICDAR2015、Total-Text数据集进行对比实验,实验结果表明,本文模型对于水平场景文本检测的精度和召回率分别为95.3和90.4;对于倾斜文本检测的精度和召回率分别为87.1和84.2;对于任意形状文本检测的精度和召回率分别为69.6和57.3。提出的算法有效克服了图像分辨率、文本形状与长度等因素的影响,提高了检测精度,得到了更为精准的文本边界。
文本检测 注意力结构 共享核空洞卷积 特征金字塔网络 text detection attention structure kernel-sharing dilated convolutions feature pyramid network 
光学 精密工程
2021, 29(8): 1955
作者单位
摘要
天津城建大学计算机与信息工程学院, 天津 300384
针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征金字塔网络有效融合了高分辨率的浅层特征;然后,使用逐层上采样增强图像中像素信息的连续性;最后,将空洞空间金字塔池化模块中的标准卷积替换为深度可分离卷积,提高了网络模型的训练效率。在语义分割标准数据集PASCAL VOC2012验证集上的实验结果表明,本方法的平均交并比可达到79.97%。相比DeepLab网络,可预测出更精细的语义分割结果。
图像处理 改进的DeepLabv3+网络 特征金字塔网络 空洞空间金字塔池化模块 
激光与光电子学进展
2021, 58(16): 1610008
作者单位
摘要
上海海事大学信息工程学院, 上海 201306
针对SSD等算法在合成孔径雷达(SAR)图像舰船小目标以及复杂场景下目标的检测效果不佳问题,提出了一种基于多重连接特征金字塔的舰船目标检测方法。首先,针对图像中小目标舰船的特点,构建了全新的特征提取网络I-VGGNet,以解决小尺寸舰船特征信息的丢失问题;其次,增加了多重连接特征金字塔网络模块,加强舰船高层语义特征与低层定位特征的融合,从而提高网络对于中小尺寸舰船的检测性能;最后,为了解决复杂场景对于舰船目标检测的干扰,在广义交并比损失和焦点损失基础上,构造了一个新的损失函数,从而降低网络对于舰船尺度的敏感性,加速模型的收敛。本文方法在中国科学院SAR图像舰船目标数据集上进行了相关实验,实验结果表明,平均精度达到了94.79%,优于现存的主流检测算法,帧率达到了22 frame/s,满足实时检测的需求,所提方法对复杂场景下不同尺寸的舰船目标的检测展现出了良好的适应性。
成像系统 舰船检测 合成孔径雷达图像 特征提取 特征金字塔网络 
激光与光电子学进展
2021, 58(8): 0811002
作者单位
摘要
青岛大学计算机科学技术学院, 山东 青岛266071
为了进一步提升基于卷积神经网络的文本检测器的检测精度,首先,用具有分散注意力机制的特征提取网络替代原始算法的主干网络,如残差网络,以促进通道间的信息交互,最大化地激活文本特征。其次,在原始特征金字塔网络的基础上增加自底向上的路径,以减少文本特征信息的损耗。实验结果表明,本算法在CTW1500、Total-Text曲线数据集上的平均精度分别为78.7%、79.0%,在多方向数据集和多语言数据集的平均精度分别为82.7%、79.3%,相比其他算法均有一定的提升。
图像处理 卷积神经网络 主干网络 分散注意力机制 特征金字塔网络 
激光与光电子学进展
2020, 57(24): 241023
作者单位
摘要
陆军工程大学石家庄校区电子与光学工程系, 河北 石家庄 050003
针对多尺度目标检测问题,提出一种基于深度注意力机制的多尺度红外行人检测方法。首先,选取较为轻量级的Darknet53作为深度卷积特征提取的主干网络,设计四尺度的特征金字塔网络负责目标的定位和分类,通过引入更低层高分辨率的特征图来改善对小尺度行人目标的检测性能。其次,利用注意力模块替代特征金字塔网络中传统的上采样模块,生成基于卷积特征的局部显著图,可以有效抑制不相关区域的特征响应,突出图像局部特性。最后,利用Caltech行人数据集和U-FOV红外行人数据集进行两次迁移训练,以提高模型的泛化能力,丰富行人的样本特征。实验结果表明,所提方法在U-FOV数据集上的识别平均准确率达到了93.45%,比YOLOv3高26.74个百分点,能检测到的最小行人像素为6×13。在LTIR数据集上的定性实验结果验证,所提模型具有良好的泛化能力,适用于多尺度红外行人的检测。
探测器 红外行人检测 卷积神经网络 超大视场 特征金字塔网络 注意力机制 
光学学报
2020, 40(5): 0504001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!