1 鲁东大学信息与电气工程学院,山东 烟台 264025
2 烟台理工学院信息工程学院,山东 烟台 264003
3 山东大学软件学院,山东 济南 250014
图像分割是计算机视觉领域的重要研究方向。模糊聚类方法由于其无监督的特性,在图像分割中得到了广泛的应用。然而,传统的模糊聚类方法在处理含高强度噪声和复杂形状的图像时,往往分割效果不理想。为了解决这一问题,提出了一种基于显著性检测的权重因子,用于构建加权滤波器和像素相关性模型,从而提高算法的抗噪能力。所提加权滤波器在结构相似性上比传统滤波器的最优结果高出0.1。此外,引入核度量以适应复杂图像的分割需求。在合成图像、自然图像、遥感图像和医学图像上进行了大量实验,结果表明,所提算法在视觉效果上优于传统方法,并且在分割精度上比传统方法的最优结果高出2%。
图像分割 模糊聚类 加权滤波 核度量 像素相关性 激光与光电子学进展
2024, 61(8): 0837005
光子学报
2023, 52(12): 1201003
1 北京交通大学 机械与电子控制工程学院,北京 00044
2 北京交通大学 智慧高铁系统前沿科学中心,北京 100044
异物入限是导致铁路安全事故频发的主要原因之一,传统深度学习需要大量训练样本进行网络训练,但铁路场景中入侵样本很少且难于获取。本文提出了基于改进度量元学习的铁路小样本异物入侵检测方法。为了让入侵目标的特征表征在分类时发挥更大作用,提出了基于通道注意力机制的特征提取网络;为解决样本数量不足时个别样本在特征空间中产生偏离的问题,提出了一种基于类中心微调的网络用于类别中心的修正;同时,基于center loss与交叉熵构建了中心相关损失函数用于小样本网络训练,提升特征空间中同类别特征分布的紧凑性。在公共数据集miniImageNet上与经典小样本学习模型中最优的相比,本文算法在5-way 5-shot设置下图像分类准确率提升了7.31%。在铁路入侵小样本数据集的5-way 5-shot消融实验表明:本文提出的通道注意力机制(Channel Attention Mechanism,CAM)和中心相关损失函数分别提升0.86%和1.91%的检测精度;提出的类中心微调和预训练方法对检测精度的提升效果更明显,分别达到3.05%和6.70%,上述模块综合应用的提升效果达到了7.90%。
小样本学习 度量元学习 铁路限界入侵 目标检测 注意力机制 few-shot learning metric meta learning railway clearance intrusion object detection attention mechanism 光学 精密工程
2023, 31(12): 1816
1 中国科学院光电技术研究所,四川 成都 610209
2 中国科学院大学电子电气与通信工程学院,北京 100049
To improve the performance of few-shot classification, we present a general and flexible method named Multi-Scale Attention and Domain Adaptation Network (MADA). Firstly, to tackle the problem of limited samples, a masked autoencoder is used to image augmentation. Moreover, it can be inserted as a plug-and-play module into a few-shot classification. Secondly, the multi-scale attention module can adapt feature vectors extracted by embedding function to the current classification task. Multi-scale attention machine strengthens the discriminative image region by focusing on relating samples in both base class and novel class, which makes prototypes more accurate. In addition, the embedding function pays attention to the task-specific feature. Thirdly, the domain adaptation module is used to address the domain shift caused by the difference in data distributions of the two domains. The domain adaptation module consists of the metric module and the margin loss function. The margin loss pushes different prototypes away from each other in the feature space. Sufficient margin space in feature space improves the generalization performance of the method. The experimental results show the classification accuracy of the proposed method is 67.45% for 5-way 1-shot and 82.77% for 5-way 5-shot on the miniImageNet dataset. The classification accuracy is 70.57% for 5-way 1-shot and 85.10% for 5-way 5-shot on the tieredImageNet dataset. The classification accuracy of our method is better than most previous methods. After dimension reduction and visualization of features by using t-SNE, it can be concluded that domain drift is alleviated, and prototypes are more accurate. The multi-scale attention module enhanced feature representations are more discriminative for the target classification task. In addition, the domain adaptation module improves the generalization ability of the model.
小样本图像识别 注意力机制 领域自适应 相似性度量 few-shot image classification attention mechanism domain adaptation similarity metric
1 苏州科技大学物理科学与技术学院,江苏省微纳热流技术与能源应用重点实验室,江苏 苏州 215009
2 江南大学理学院,江苏 无锡 214122
3 北京联合大学数理部,北京 100101
4 中国航天科技集团公司上海卫星工程研究所,上海 201109
随机并行梯度下降(SPGD)算法广泛应用于光学系统静态像差校正,其性能指标对校正效果影响较大。由于传统的环围能量(EE)校正精度低、平均半径(MR)稳定性差,提出性能指标组合法,以实现静态像差的高精度、稳定校正。所提方法将EE与MR性能指标相结合进行像差校正,首先以EE作为性能指标对畸变图像进行校正,待能量集中于环围区域后,利用MR性能指标继续进行校正,直至能量分布均匀,校正终止。首先进行了校正仿真,结果显示:相比于EE和MR方法,性能指标组合法对静态像差的校正精度高、稳定性好。搭建实验光路,验证了所提方法的有效性。模拟和实验结果均表明,采用性能指标组合法可以获得高的校正精度且校正稳定。该方法可以应用于光学系统静态像差的校正和消除,实现其接近衍射极限的光学性能。
成像系统 随机并行梯度下降算法 静态像差 性能指标 校正精度 稳定性
1 清华大学 精密仪器系,北京 100083
2 清华大学 光子测控技术教育部重点实验室,北京 100083
3 北京市遥感信息研究所,北京 100083
由于影像之间有显著的几何和辐射差异,光学、合成孔径雷达(SAR)影像的自动匹配一直是研究的难点。介绍具有辐射不变的相位一致性模型,并引入索引图对相位一致性的方向和尺度信息进行统计; 借助相位响应方向特征形成方向索引图,借助相位响应尺度特征形成尺度索引图; 建立一种对影像局部特征的描述符--局部相位一致性统计图(LPCS)最后利用LPCS在光学、SAR影像中获取同名点,运用仿射变换模型实现匹配。实验表明,方法对光学、SAR影像之间的辐射差异有很强的适应性,并且匹配精度较高。
图像配准 相位一致性 索引图 相似性测度 image registration phase congruency maximum index map similarity metric
大连海事大学信息科学技术学院, 辽宁 大连 116026
行人重识别(ReID)任务在提取身份相关特征时可能会丢失一些信息,导致判别依据减少并影响模型性能。为此,提出了基于双分辨率特征及通道注意力机制的行人重识别方法。首先,在ResNet基础上增加了高分辨率特征分支,通过在不同分辨率的特征图上应用池化层,生成了对应着8种不同区域的特征向量。然后根据特征向量的情况设计了一个通道注意模块,增强了其中有效部分的表达能力。最后利用批归一化处理来协调分类损失和度量损失。消融实验中,算法内各步骤的运用都有效提升了模型的性能。在Market-1501、DUKEMTMC-REID、CUHK03等数据集上进行的对比实验中,该算法相比近几年具有代表性的其他算法,平均准确率和Rank-1都有所提升。实验结果表明,该方法能结合更丰富的特征,提高行人重识别准确度。
图像处理 行人重识别 双分辨率特征 通道注意力机制 批归一化 分类损失和度量损失 激光与光电子学进展
2021, 58(20): 2010019
西安建筑科技大学 理学院,陕西 西安 710055
以SRCNN(super-resolution convolutional neural network)模型为代表的超分辨率重建模型通常都有很高的PSNR(peak signal to noise ratio)和SSIM(structural similarity)值,但其在视觉感知上并不令人满意,而以SRGAN为代表的拥有高感知质量的GAN(generative adversarial networks)模型却很容易产生大量的伪细节,这表现在其PSNR和SSIM值通常都较低。针对上述问题,提出了一种基于深度反向投影的感知增强超分辨率重建模型。该模型采用双尺度自适应加权融合特征提取模块进行特征提取,然后通过深度反向投影进行上采样,最终由增强模块增强后得到最终输出。模型采用残差连接与稠密连接,有助于特征的共享以及模型的有效训练。在指标评价上,引入了基于学习的LPIPS(learned perceptual image patch similarity)度量作为新的图像感知质量评价指标,与PSNR、SSIM一起作为模型评价指标。实验结果表明,模型在测试数据集上PSNR、SSIM、LPIPS的平均值分别为27.84、0.7320、0.1258,各项指标均优于对比算法。
超分辨率重建 感知质量 深度反向投影 LPIPS度量 super-resolution reconstruction perceived quality deep back projection learned perceptual image patch similarity metric