相同关键词【特征金字塔网络】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 苏州科技大学物理科学与技术学院，江苏苏州 215009

² 中国科学院长春光学精密机械与物理研究所应用光学国家重点实验室，吉林长春 130033

针对传统水接触角测量过程需要人工干预，导致测量结果精度低、可复现性差等问题，提出一种基于改进Faster RCNN的水接触角测量方法。首先，把Faster RCNN骨干网络VGG16替换为ResNet101，在其残差块末尾处添加注意力机制模型convolutional block attention module（CBAM），增强网络提取特征的能力；其次，融入特征金字塔网络（FPN），充分提取不同尺度下的特征信息，此外，引入Focal损失函数来解决正负类样本不均衡的问题；最后，对定位到的水滴进行边缘检测和角点提取，再利用迭代重加权最小二乘法（IRLS）拟合椭圆轮廓计算水接触角。实验结果表明，改进后的Faster RCNN目标检测算法与原算法相比，平均精度均值提高10.794%，速度提升11 frame/s，水接触角测量结果平均标准偏差为0.109°。

图像处理水接触角特征金字塔网络注意力机制 Faster RCNN

PDF全文 Full Text

激光与光电子学进展

2024, 61(8): 0812002

机器视觉

基于改进Faster R-CNN的隐形眼镜表面缺陷检测算法

王昊 ¹查涛 ¹乜灵梅 ¹张军 ²[ ... ]赵友全 ^1,*

作者单位

摘要

¹ 天津大学精密仪器与光电子工程学院，天津 300072

² 甘肃康视达科技集团有限公司，甘肃白银 730900

针对传统图像处理算法在检测隐形眼镜表面缺陷时存在精度低、耗时长、算法鲁棒性差、漏检多等问题，提出一种基于改进Faster R-CNN的隐形眼镜表面缺陷检测算法。首先，对比了3种特征提取网络的性能，选取ResNet50作为骨干网络；然后，引入特征金字塔网络（FPN），通过融合多层次的特征信息，提高Faster R-CNN的多尺度检测能力；最后，基于构建的隐形眼镜表面缺陷数据集，使用K-means++算法改进锚框的尺度和数量。实验结果表明：改进后的Faster R-CNN算法在测试集上的平均精度均值（mAP）达到了86.95%，相比于改进前的Faster R-CNN算法，提高了9.45个百分点，可以有效地检测出气泡、车削亮点、划痕、模具亮点等多种隐形眼镜典型缺陷。

智能检测表面缺陷 Faster R-CNN 特征金字塔网络聚类标注

PDF全文 Full Text

激光与光电子学进展

2023, 60(20): 2015004

工程应用

基于沙漏瓶颈模块的无人机实时检测算法

李鸿 ^1,2,3杜芸彦 ^1,2,3邵林松 ^2,3雷铭 ^2,3[ ... ]毛耀 ^1,2,3

作者单位

摘要

¹ 中国科学院光束控制重点实验室, 成都 610000

² 中国科学院光电技术研究所, 成都 610000

³ 中国科学院大学, 北京 100000

随着无人机的快速发展与应用, 无人机的普及也对公共安全、**安全和个人隐私等造成了一定的安全隐患。无人机具有飞行速度快、体积小等特点, 如何精准快速地发现并定位无人机位置具有一定的挑战。针对此问题, 提出了一种基于沙漏瓶颈模块的YOLOv3无人机实时检测算法。首先, 将原本3个特征尺度检测扩展为在5个特征尺度上进行检测, 充分利用多尺度信息帮助提升小目标检测精度; 然后, 堆叠沙漏瓶颈模块作为该方法的骨干网络部分, 沙漏瓶颈模块作为一种轻量化网络对模型进行加速, 并使用通道注意力机制在上采样之后的拼接部分关注更重要的通道信息, 抑制不利的信息。为了验证所提算法的有效性, 生成基于复杂城市背景下的无人机数据集, 实验结果表明, 所提算法的精度能够达到98.92%, 且具有98.76%的召回率, 在1080Ti上达到62.37 帧/s的实时速度, 模型权重大小仅为5.38 MiB, 为进一步在嵌入式平台和移动端实现实时目标检测提供了可能。

无人机检测轻量化网络沙漏瓶颈模块特征金字塔网络注意力机制 UAV detection lightweight network SandGlass Bottleneck Block feature pyramid network attention mechanism

PDF全文 Full Text

电光与控制

2022, 29(12): 58

工程应用

基于改进SSD网络的着舰标志识别方法

吴鹏飞石章松黄隽傅冰

作者单位

摘要

海军工程大学兵器工程学院，武汉 430000

鉴于深度学习在图像识别领域的重大进展，在无人直升机自主着舰的应用背景下，针对较为复杂的着舰环境和着舰标志设计，采用单级多区域检测(SSD)网络对着舰标志进行识别。针对SSD网络对小目标识别率低的缺点，基于深度残差网络和特征金字塔网络结构对SSD网络进行了改进，使用ResNet101代替VGG-16网络，并利用特征金字塔网络结构改进传统上采样结构，将检测网络的高层语义信息融入低层特征信息中，最后通过实验验证了改进网络的识别效果。

着舰标志识别 SSD网络图像识别深度残差网络特征金字塔网络结构 identification of landing mark SSD network image recognition deep residual network feature pyramid network structure

PDF全文 Full Text

电光与控制

2022, 29(1): 88

目标检测与跟踪

基于多向特征金字塔的轻量级目标检测算法

白创 ^1,2王英杰 ¹闫昱 ¹DJUKANOVIC Milena ³

作者单位

摘要

¹ 长沙理工大学物理与电子科学学院, 湖南长沙 410114

² 柔性电子材料基因工程湖南省重点实验室, 湖南长沙 410114

³ 黑山大学电气工程学院, 黑山共和国波德戈里察 81000

针对实时目标检测算法 Tiny YOLOv3存在的深层特征难以提取、实时性不能满足需求、边界框定位不够准确的问题, 提出一种改进的轻量级检测模型MTYOLO(MdFPN Tiny YOLOv3)。该模型构造多向特征金字塔网络(MdFPN)代替简单级联, 充分完成了多层语义信息的提取与融合; 使用深度可分离卷积代替标准卷积, 有效降低网络复杂度, 提升了检测的实时性能; 采用Complete IOU loss(CIOU loss)代替MSE作为回归损失函数, 极大地提高了边界框的回归精度。在 PASCAL VOC 和 COCO数据集上对MTYOLO进行测试, 结果表明, 改进后模型的mAP最高可达到83.7%, 检测速度最快可达到205 fps。

目标检测特征金字塔网络深度可分离卷积 object detection feature pyramid network deep separable convolution Complete IOU loss complete IOU loss

PDF全文 Full Text

液晶与显示

2021, 36(11): 1516

信息科学

共享核空洞卷积与注意力引导FPN文本检测

下载：506次

孟月波 ^*金丹刘光辉徐胜军 [ ... ]石德旺

作者单位

摘要

西安建筑科技大学信息与控制工程学院，陕西西安710055

高分辨率图像具有特征尺度差异较大的特点，针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题，提出一种共享核空洞卷积与注意力引导（Kernel-Sharing Dilated Convolutions and Attention-guided FPN，KDA-FPN）的复杂场景文本检测方法；提出最小交集（Intersection Over Minimum，IOM）后处理策略，改善因文本长宽比变化较大特性导致的掩膜重叠现象，提升检测效果。首先，模型以Resnet50为主干网络采用FPN结构捕获多尺度特征；然后，利用空洞卷积扩大特征感受野，提高特征信息的多尺度捕获能力，深层次挖掘文本细粒度特征，并通过共享核手段减少模型参数量，降低计算成本；同时，采用上下文注意模块（Context Attention Module，CxAM）捕捉多感受野间的语义信息关系，通过内容注意模块（Content Attention Module，CnAM）精确定位目标位置信息，增强多尺度融合能力，提升特征图质量；最后，将同一文本区域预测的候选框按大小排列，提出将面积最大的框与相邻文本框之间区域的交集面积占较小框面积的比值作为候选框筛选指标，抑制检测结果的掩模重叠现象，实现文本的精准检测。采用ICDAR2013、ICDAR2015、Total-Text数据集进行对比实验，实验结果表明，本文模型对于水平场景文本检测的精度和召回率分别为95.3和90.4；对于倾斜文本检测的精度和召回率分别为87.1和84.2；对于任意形状文本检测的精度和召回率分别为69.6和57.3。提出的算法有效克服了图像分辨率、文本形状与长度等因素的影响，提高了检测精度，得到了更为精准的文本边界。

文本检测注意力结构共享核空洞卷积特征金字塔网络 text detection attention structure kernel-sharing dilated convolutions feature pyramid network

PDF全文 Full Text

光学精密工程

2021, 29(8): 1955

图像处理

基于改进DeepLabv3+网络的图像语义分割方法

下载：1011次

徐聪 ^*王丽

作者单位

摘要

天津城建大学计算机与信息工程学院, 天津 300384

针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征金字塔网络有效融合了高分辨率的浅层特征;然后,使用逐层上采样增强图像中像素信息的连续性;最后,将空洞空间金字塔池化模块中的标准卷积替换为深度可分离卷积,提高了网络模型的训练效率。在语义分割标准数据集PASCAL VOC2012验证集上的实验结果表明,本方法的平均交并比可达到79.97%。相比DeepLab网络,可预测出更精细的语义分割结果。

图像处理改进的DeepLabv3+网络特征金字塔网络空洞空间金字塔池化模块

PDF全文 Full Text

激光与光电子学进展

2021, 58(16): 1610008

成像系统

基于多重连接特征金字塔的SAR图像舰船目标检测

下载：743次

徐志京黄海 ^*

作者单位

摘要

上海海事大学信息工程学院, 上海 201306

针对SSD等算法在合成孔径雷达(SAR)图像舰船小目标以及复杂场景下目标的检测效果不佳问题,提出了一种基于多重连接特征金字塔的舰船目标检测方法。首先,针对图像中小目标舰船的特点,构建了全新的特征提取网络I-VGGNet,以解决小尺寸舰船特征信息的丢失问题;其次,增加了多重连接特征金字塔网络模块,加强舰船高层语义特征与低层定位特征的融合,从而提高网络对于中小尺寸舰船的检测性能;最后,为了解决复杂场景对于舰船目标检测的干扰,在广义交并比损失和焦点损失基础上,构造了一个新的损失函数,从而降低网络对于舰船尺度的敏感性,加速模型的收敛。本文方法在中国科学院SAR图像舰船目标数据集上进行了相关实验,实验结果表明,平均精度达到了94.79%,优于现存的主流检测算法,帧率达到了22 frame/s,满足实时检测的需求,所提方法对复杂场景下不同尺寸的舰船目标的检测展现出了良好的适应性。

成像系统舰船检测合成孔径雷达图像特征提取特征金字塔网络

PDF全文 Full Text

激光与光电子学进展

2021, 58(8): 0811002

图像处理

基于分散注意力与路径增强特征金字塔的文本检测

下载：841次

程琦王国栋 ^*赵毅

作者单位

摘要

青岛大学计算机科学技术学院, 山东青岛266071

为了进一步提升基于卷积神经网络的文本检测器的检测精度,首先,用具有分散注意力机制的特征提取网络替代原始算法的主干网络,如残差网络,以促进通道间的信息交互,最大化地激活文本特征。其次,在原始特征金字塔网络的基础上增加自底向上的路径,以减少文本特征信息的损耗。实验结果表明,本算法在CTW1500、Total-Text曲线数据集上的平均精度分别为78.7%、79.0%,在多方向数据集和多语言数据集的平均精度分别为82.7%、79.3%,相比其他算法均有一定的提升。

图像处理卷积神经网络主干网络分散注意力机制特征金字塔网络

PDF全文 Full Text

激光与光电子学进展

2020, 57(24): 241023

探测器

基于深度注意力机制的多尺度红外行人检测

下载：1452次

赵斌王春平 ^*付强陈一超

作者单位

摘要

陆军工程大学石家庄校区电子与光学工程系, 河北石家庄 050003

针对多尺度目标检测问题,提出一种基于深度注意力机制的多尺度红外行人检测方法。首先,选取较为轻量级的Darknet53作为深度卷积特征提取的主干网络,设计四尺度的特征金字塔网络负责目标的定位和分类,通过引入更低层高分辨率的特征图来改善对小尺度行人目标的检测性能。其次,利用注意力模块替代特征金字塔网络中传统的上采样模块,生成基于卷积特征的局部显著图,可以有效抑制不相关区域的特征响应,突出图像局部特性。最后,利用Caltech行人数据集和U-FOV红外行人数据集进行两次迁移训练,以提高模型的泛化能力,丰富行人的样本特征。实验结果表明,所提方法在U-FOV数据集上的识别平均准确率达到了93.45%,比YOLOv3高26.74个百分点,能检测到的最小行人像素为6×13。在LTIR数据集上的定性实验结果验证,所提模型具有良好的泛化能力,适用于多尺度红外行人的检测。

探测器红外行人检测卷积神经网络超大视场特征金字塔网络注意力机制

PDF全文 Full Text

光学学报

2020, 40(5): 0504001

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索