1 北京航空航天大学 仪器科学与光电工程学院 精密光机电一体化教育部重点实验室,北京009
2 季华实验室 智能机器人工程研究中心,广东佛山5800
在室内实例物体目标检测中,传统深度学习需要大量人工标注的训练样本进行网络训练,费时费力,为此提出并实现了一种采用奇异值分解(Singular Value Decomposition,SVD)和协同训练的半监督实例级目标检测网络SVD-RCNN。挑选关键样本进行人工标注并预训练SVD-RCNN,以确保其获取更多先验知识,采用基于SVD的收敛-分解-微调策略,在SVD-RCNN中得到两个较强独立性的检测器以满足协同训练的要求,最后提出一种自适应的自标注策略,获得高质量的自标注及检测结果。在多个室内实例数据集上对该方法进行测试,在GMU数据集上只需人工标注199个样本,均值平均精度(mean Average Precision,mAP)达到了79.3%,相较于需标注3 851个样本的全监督Faster RCNN的81.3% mAP仅下降了2%。消融实验及系列实验证明了本文方法的有效性和普适性,本文提出的方法仅需人工标注5%的训练数据,即可达到与全监督学习相当的实例级目标检测精度,有利于智能机器人高效识别不同实例物体的实际应用。
计算机视觉 目标检测 半监督学习 自标注 computer vision object detection semi-supervised learning self-labeling 光学 精密工程
2023, 31(13): 2000
浙江大学信息与电子工程学院,浙江 杭州 310027
为提高红外图像中目标检测的精度,提出一种基于CenterNet与OMix增强的半监督红外图像目标检测算法(IRCC-OMix)。针对红外图像中锚框先验信息难以确定的问题,利用CenterNet作为主干模型,通过关键点检测红外图像中的目标。由于红外图像标注成本昂贵,引入基于教师学生网络互学习的半监督学习方法,设计基于CenterNet与基于一致性的半监督红外图像目标检测(IRCC)模型。IRCC模型中的随机擦除(cutout)增强可能导致红外图像中的小目标消失,影响模型检测性能,因此采用一种基于目标的图像混合增强方法,提升算法对小目标的检测能力。在公开数据集FLIR上的实验结果表明,IRCC模型的平均精度均值(mAP)达到55.3%,与仅使用有标签数据训练情况相比,mAP提升1.9个百分点,说明该模型能够充分利用无标签数据、提高模型的鲁棒性。基于OMix增强的IRCC模型的mAP为56.8%,与使用cutout增强的IRCC模型相比提高1.5个百分点,取得了良好的检测性能。
图像处理 目标检测 卷积神经网络 红外图像 半监督学习 激光与光电子学进展
2023, 60(14): 1428005
1 中山大学物理学院, 广州 510275
2 广东省磁电物性分析与器件重点实验室, 广州 510275
在常压下寻找新型高温超导材料是物理和材料领域共同关注的热点问题。近年来, 机器学习技术和大数据成功地解决了材料特性与复杂物理因素之间关系建模的难题, 在新型材料的优化设计中获得了重要应用。然而利用机器学习在材料数据库中寻找常规Bardeen-Cooper-Schrieffer (BCS)超导材料, 存在可用数据量少的问题, 导致设计出的超导材料种类少, 结构构型单一。结合BCS超导理论和半监督学习方法, 发展了神经网络模型预测BCS超导体。通过充分利用材料数据库中大量的无标签数据, 即未知超导温度但已知电子结构的晶体材料, 使得训练出的分类模型准确性达72%。模型预测出数十种可常压下存在的新型BCS超导材料, 其中B-C和B-C-N体系的超导温度最高可达约60 K, 高于MgB2的39 K超导纪录。
高温超导 半监督学习 材料设计 神经网络 high-temperature superconductors semi-supervised learning materials design neural networks
南京邮电大学自动化学院、人工智能学院,江苏 南京 210023
为了有效利用少量的医学图像标签数据和大量的无标签数据,提出了一种基于半监督学习和生成对抗网络的医学图像融合算法。所提生成对抗网络融合架构包含1个生成器网络和2个判别器网络。采用半监督学习策略对所提网络进行训练,主要包括监督训练、无监督训练、参数微调等3个阶段。此外,生成器由面向融合任务的U-Net和squeeze and excitation通道注意力模块组成,而判别器含有3层卷积层、1层全连接层及sigmoid激活输出层。在各种不同模态医学图像上的实验结果表明,与现有的6种基于深度学习的算法相比,所提算法的主观视觉效果和客观性能指标都有一定竞争力。相关消融实验也验证了半监督学习策略能强化生成网络的性能,提高融合图像的质量。
机器视觉 生成对抗网络 半监督学习 医学图像融合 注意力机制 激光与光电子学进展
2022, 59(22): 2215005
光学 精密工程
2022, 30(15): 1889
火箭军工程大学 导弹工程学院,陕西 西安 710025
针对红外数据集规模小,标记样本少的特点,提出了一种红外目标检测网络的半监督迁移学习方法,主要用于提高目标检测网络在小样本红外数据集上的训练效率和泛化能力,提高深度学习模型在训练样本较少的红外目标检测等场景当中的适应性。文中首先阐述了在标注样本较少时无标注样本对提高模型泛化能力、抑制过拟合方面的作用。然后提出了红外目标检测网络的半监督迁移学习流程:在大量的RGB图像数据集中训练预训练模型,后使用少量的有标注红外图像和无标注红外图像对网络进行半监督学习调优。另外,文中提出了一种特征相似度加权的伪监督损失函数,使用同一批次样本的预测结果相互作为标注,以充分利用无标注图像内相似目标的特征分布信息;为降低半监督训练的计算量,在伪监督损失函数的计算中,各目标仅将其特征向量邻域范围内的预测目标作为伪标注。实验结果表明,文中方法所训练的目标检测网络的测试准确率高于监督迁移学习所获得的网络,其在Faster R-CNN上实现了1.1%的提升,而在YOLO-v3上实现了4.8%的显著提升,验证了所提出方法的有效性。
红外目标检测 半监督学习 迁移学习 伪监督损失函数 infrared object detection semi-supervised learning transfer learning pseudo-supervised loss function 红外与激光工程
2021, 50(3): 20200511
针对目前视觉监控领域中采集到的人物数据样本量少和特征单一的问题,提出了一种具有高视觉感知约束的双向生成对抗网络生成期望人物姿态图像的方法。采用给定人物的单个图像和期望姿态的二维骨架作为双向生成对抗网络的输入,生成具有该目标人物期望姿态的图像。将生成的期望姿态图像反映射回原始姿态图像,利用少量的图像以无监督学习方式进行学习,生成该人物期望姿态的高质量图像。提出的方法在 DeepFashion公开数据集上进行了实验,结果表明,采用文中提出的方法生成的图像结构相似度(SSIM)比以往的方法提高了 0.28,有效的提升了基于无监督学习的单人多姿态人物图像生成的质量。
半监督学习 视觉监控 生成对抗网络 结构相似度 semi-supervised learning visual surveillance generative adversarial network structural similari. ty index
重庆大学 光电技术与系统教育部重点实验室, 重庆 400044
针对传统图嵌入方法仅采用单一图结构无法有效表征高维数据中复杂本征结构, 本文提出了一种半监督多图嵌入(SSMGE)方法, 并应用于高光谱影像特征提取。该方法首先利用标记样本的类内、类间近邻点来构建类内超图、类间超图、类内普通图、类间普通图, 然后通过无标记样本的近邻点和远离点构建无监督本征超图和惩罚超图, 并以多图协同方式来表征高维数据间的复杂几何关系, 实现鉴别特征提取。本文提出的SSMGE方法不仅能有效揭示数据点间超图和普通图的结构, 而且在低维嵌入空间中增强同类数据聚集性和非同类数据的远离性, 提取的鉴别特征可改善地物分类精度。在PaviaU和Urban高光谱数据集上进行了分类实验, 本文方法的总体分类精度分别可达到85.92%和79.74%。相比普通图嵌入和超图方法, 该算法明显提升了地物的分类性能。
高光谱影像 特征提取 半监督学习 多图嵌入 超图结构 hyperspectral image feature extraction semi-supervised learning multi-graph embedding hypergraph structure
江苏自动化研究所计算机事业部, 江苏 连云港 222002
现有基于深度学习的遥感飞机图像检测方法在训练时需要大量的带标记数据集和较长的训练时间,鉴于此,提出了一种基于生成式对抗网络的半监督学习方法。采用两种粒度的深度卷积生成式对抗网络,分别提取待检测目标的边缘特征信息和深层语义特征。通过结合两种粒度的生成式对抗网络的判别器网络模型,设计了目标检测网络模型。实验结果表明,实验设计的半监督学习训练方法具有更快的收敛速度,且在训练时需要的标记样本更少。
图像处理 半监督学习 生成式对抗网络 遥感图像 目标检测 激光与光电子学进展
2020, 57(6): 061009