作者单位
摘要
1 西京学院 材料与能源科学技术研究院,陕西 西安 710123
2 北京星航机电装备有限公司,北京 100074
3 西北工业大学 光电与智能研究院,陕西 西安 710072
在计算机视觉领域中,基于孪生网络的跟踪算法相比于传统算法提高了精度和速度,但是仍会受到目标遮挡、变形、环境变化等影响,导致孪生网络的跟踪算法的性能降低。为了深入了解基于孪生网络的单目标跟踪算法,本文对现有基于孪生网络目标跟踪算法进行了总结和分析,主要包括在孪生网络中引入注意力机制方法、超参数推理方法和模板更新方法,对这3种方法的目标跟踪算法进行了综述,详细介绍了国内外近几年基于孪生网络的算法研究和发展现状。对3个方面的代表算法采用VOT2016、VOT2017、VOT2018和OTB-2015数据集进行实验对比,获得了多种基于孪生网络的目标跟踪算法的性能。最后对基于孪生网络的目标跟踪算法进行了总结,并对未来的发展方向进行了展望。
计算机视觉 目标跟踪 孪生网络 深度学习 computer vision target tracking Siamese networks deep learning 
液晶与显示
2024, 39(2): 192
栗博 1,2何红艳 1,2王钰 1,2丁与非 1,2[ ... ]曹世翔 1,2
作者单位
摘要
1 北京空间机电研究所,北京 100094
2 先进光学遥感技术北京市重点实验室,北京 100094
3 中国人民解放军63768部队,西安 710000
特征点提取与匹配是遥感图像处理中关键的一环,目前成熟的算法大多面向对地成像类型的遥感图像,对于空间目标的遥感图像,没有考虑成像条件与探测平台的影响因素,特征点匹配质量较差。针对空间目标的匹配精度不高这一问题,文章提出了一种基于聚类的特征点匹配算法。首先,根据空间目标的重复弱纹理进行特征点提取与描述,再利用特征点的空间位置进行聚类,并对特征点簇进行匹配;之后将特征点的主方向减去目标整体方向,利用特征点主方向对每一个点簇进行再分组,并完成特征点匹配;最后利用最近邻次近邻比率方法和随机样本一致算法(RANSAC)剔除外点。采用该特征点匹配方法进行的模拟成像数据实验结果表明,对于空间目标图像,基于聚类的特征点匹配较直接匹配,匹配数量的提升最高可达50%,重投影误差优于1/4个像元。文章提出的这一方法使用目前通用的各种特征描述子,能够大幅度提高空间目标图像特征点匹配的数量与精度。
特征点匹配 聚类 结构张量 重复纹理 空间目标 feature point matching clustering structural tensors repeated texture spatial object 
航天返回与遥感
2024, 45(1): 99
作者单位
摘要
1 中国铁道科学研究院集团有限公司铁道建筑研究所,北京 100081
2 中国铁道科学研究院集团有限公司高速铁路轨道系统全国重点实验室,北京 100081
3 铁科检测有限公司,北京 100081
随着遥感技术在铁路行业应用的深入,应用多源遥感对铁路设施状态进行观测成为学界和产业界关注的热点。针对铁路设施状态定量化监测问题,应用InSAR技术可以获得铁路设施沉降信息,沉降信息的分析提取往往要借助设施的类别、位置等属性,否则无法进一步对特定铁路设施的沉降进行量化评估。文章综合利用星基光学与微波遥感影像,通过目标检测技术对铁路设施进行自动提取,确定铁路设施微波散射点与光学属性中类别与位置的对应关系;选取典型区域,以接触网立柱为例,利用多源遥感影像对文中提出的提取方法进行验证,结果显示:综合光学遥感影像的高空间分辨率以及SAR影像对铁路设施特异性散射的特征对铁路设施进行提取,提取准确率较光学遥感影像提取准确率提高2.8%,较SAR影像提取准确率提高9.2%,同时提取结果中设施位置更准确,可减少因设施的错误监测造成的行车安全影响,为InSAR对铁路设施形变的定量化监测提供参考。
铁路设施 接触网立柱 遥感 光SAR融合 目标检测 railway facility contact wire column remote sensing optical SAR fusion object detection 
航天返回与遥感
2024, 45(1): 29
作者单位
摘要
1 浙江工业大学计算机科学与技术学院,浙江 杭州 310023
2 中国科学院深海科学与工程研究所,海南 三亚 572000
水下目标检测 YOLO ZYNQ 声呐图像 深度学习 轻量化 underwater target detection YOLO ZYNQ sonar image deep learning lightweight 
光电工程
2024, 51(1): 230284
贾剑利 1,2,3韩慧妍 1,2,3,*况立群 1,2,3韩方正 1,2,3[ ... ]张秀权 1,2,3
作者单位
摘要
1 中北大学计算机科学与技术学院,山西 太原 030051
2 机器视觉与虚拟现实山西省重点实验室,山西 太原 030051
3 山西省视觉信息处理及智能机器人工程研究中心,山西 太原 030051
当前基于深度学习的目标检测算法已较为成熟。然而,基于少量样本检测新类仍具有挑战性,因为少样本条件下的深度学习容易导致特征空间退化。现有工作采用整体微调范式在丰富样本的基类上进行预训练,在此基础上构建新类的特征空间。然而,新类基于多个基类隐式地构造特征空间,其结构较为分散,导致基类与新类之间可分性较差。采用对新类和与其相似的基类进行关联再识别的方法进行少样本目标检测。通过引入动态感兴趣区域头,提升模型对训练样本的利用率,基于二者间的语义相似度,显式地为新类构建特征空间。通过解耦基类和新类的分类分支、添加通道注意力模块及增加边界损失函数,提升二者间的可分性。在标准PASCAL VOC数据集上的实验结果表明,所提方法的nAP50均值较TFA、MPSR及DiGeo分别提升10.2、5.4、7.8。
少样本目标检测 关联和识别 动态感兴趣区域头 通道注意力 边界损失 
激光与光电子学进展
2024, 61(8): 0837015
陈凯余 1,2,3,4,5李颖 1,2,3,4李政岱 1,2,3,4郭友明 1,2,3,4,*
作者单位
摘要
1 中国科学院自适应光学重点实验室,四川 成都 610209
2 中国科学院光电技术研究所,四川 成都 610209
3 中国科学院大学,北京 100049
4 中国科学院大学电子电气与通信工程学院,北京 100049
5 光场调控科学技术全国重点实验室,四川 成都 610209
无透镜成像系统使用掩模板替代镜头,在降低成本的同时使设备更加轻巧,然而在进行目标识别前需通过计算重建图像,涉及参数调优和计算耗时问题。基于此,提出一种无重建的目标识别方案,直接在无透镜相机拍摄的编码图像上训练网络识别目标,在节约计算资源的同时还提供隐私保护。使用具有相位掩模板和振幅掩模板的无透镜相机,仿真生成MNIST与Fashion MNIST数据集和实采MNIST数据集,然后在这些数据集上训练ResNet-50与Swin_T网络进行目标识别。结果表明,在仿真MNIST、Fashion MNIST和真实MNIST数据集上,所提方案的最高识别准确率达99.51%、92.31%和98.06%,与先重建目标后识别方案的准确率相当,证明所提方案是一种高效的、具有隐私保护的端到端方案,且在两种掩模板和两类常规骨干分类网络上得到了验证。
计算成像 目标识别 深度学习 无透镜成像 
激光与光电子学进展
2024, 61(8): 0811008
作者单位
摘要
上海大学通信与信息工程学院,特种光纤与光接入网省部共建国家重点实验室培育基地,特种光纤与先进通信国际合作联合实验室,上海 200444
传统的光学透镜存在体积较大、聚焦效率低、焦点半峰全宽较大以及在高数值孔径的透镜中性能表现不佳等问题。而光学超表面凭借其自身的亚波长结构,具有强大的操控光相位的能力。相比于传统透镜,超透镜具有尺寸小、厚度薄以及聚焦性能好等优点。本文提出一种基于目标优先算法的逆向设计方法,设计了一种基于低折射率聚合物材料的超透镜结构。其在传播方向上的厚度仅为3.2 μm,在1550 nm的工作波长下,数值孔径为0.82,聚焦效率为72%。较传统设计方法而言,该方法具有计算复杂度低和设计效率高等优点。设计的器件可采用高精度微纳打印技术实现批量化的快速制造。考虑到超透镜在制备过程中存在制造容差,进一步讨论了超透镜轮廓偏移以及三维旋转操作对所设计的二维超透镜的影响。
超表面 超透镜 逆向设计 目标优先算法 偏振不依赖性 
光学学报
2024, 44(8): 0822002
陈建明 1,2李定鲣 1曾祥津 1,2任振波 3[ ... ]秦玉文 1,2,**
作者单位
摘要
1 通感融合光子技术教育部重点实验室,广东省信息光子技术重点实验室,广东工业大学信息工程学院,先进光子技术研究院,广东 广州 510006
2 南方海洋科学与工程广东省实验室(珠海),广东 珠海 519082
3 光场调控与信息感知工业和信息化部重点实验室,陕西省信息光子技术重点实验室,西北工业大学物理科学与技术学院,陕西 西安 710129
提出一种跨模态光学信息交互和模板动态更新的可见光和热红外(RGBT)跟踪方法,选取能够在跟踪速度和精度上取得平衡的Siamese跟踪器作为基本框架,并设计特征交互模块以重构不同模态的信息比例和增强模态间信息交流。在此基础上,基于无锚框的思想构建预测网络,以提升跟踪器的灵活性和通用性,同时提出一种模板动态更新的策略,通过动态更新跟踪模板增强模型对变化目标的适应能力。在GTOT等3个基准数据集上的对比实验表明,所提方法可显著提升跟踪器在复杂环境下的目标跟踪性能。
机器视觉 计算机视觉 目标跟踪 孪生网络 模板更新 
光学学报
2024, 44(7): 0715001
作者单位
摘要
东北石油大学计算机与信息技术学院,黑龙江 大庆 163318
针对目前基于点云的三维目标检测算法中小目标检测效果差的问题,提出了基于改进PointPillars模型的三维目标检测方法。首先,改进了PointPillars模型中的pillar特征网络,提出了一个新的pillar编码模块,在编码网络中引入了平均池化和注意力池化,充分考虑了每个pillar模块的局部详细几何信息,提高了每个pillar模块的特征表示能力,从而提升了模型的小目标检测性能。其次,基于ConvNeXt改进了骨干网络中的二维卷积下采样模块,使模型在网络特征提取阶段能够提取丰富的上下文语义信息和全局特征,从而增强了算法的特征提取能力。在公开数据集KITTI上进行验证,实验结果表明,所提方法具有更高的检测精度,相较于原网络,改进后的算法的平均检测精度提升了3.63个百分点,证明了该方法的有效性。
三维目标检测 PointPillars 小目标检测 注意力池化 ConvNeXt 
激光与光电子学进展
2024, 61(8): 0812007
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!