贾剑利 1,2,3韩慧妍 1,2,3,*况立群 1,2,3韩方正 1,2,3[ ... ]张秀权 1,2,3
1 中北大学计算机科学与技术学院,山西 太原 030051
2 机器视觉与虚拟现实山西省重点实验室,山西 太原 030051
3 山西省视觉信息处理及智能机器人工程研究中心,山西 太原 030051
当前基于深度学习的目标检测算法已较为成熟。然而,基于少量样本检测新类仍具有挑战性,因为少样本条件下的深度学习容易导致特征空间退化。现有工作采用整体微调范式在丰富样本的基类上进行预训练,在此基础上构建新类的特征空间。然而,新类基于多个基类隐式地构造特征空间,其结构较为分散,导致基类与新类之间可分性较差。采用对新类和与其相似的基类进行关联再识别的方法进行少样本目标检测。通过引入动态感兴趣区域头,提升模型对训练样本的利用率,基于二者间的语义相似度,显式地为新类构建特征空间。通过解耦基类和新类的分类分支、添加通道注意力模块及增加边界损失函数,提升二者间的可分性。在标准PASCAL VOC数据集上的实验结果表明,所提方法的nAP50均值较TFA、MPSR及DiGeo分别提升10.2、5.4、7.8。
少样本目标检测 关联和识别 动态感兴趣区域头 通道注意力 边界损失 激光与光电子学进展
2024, 61(8): 0837015
读出电路开窗是红外焦平面和图像传感器读出电路中,用于提高图像帧频降低带宽的重要技术。该技术通过减小读出阵列的窗口尺寸,降低电路读出的数据量,从而提高帧频。介绍了两类主要的开窗模式:异步读出模式和同步读出模式。针对异步读出模式扩展性差、存在竞争冒险的问题,以及同步读出模式占用像元面积和窗口切换速度慢的问题,基于同步读出提出了一种行列控制字架构,并设计了一种用于该架构的可重复单元电路,提高了对不同面阵规格的扩展性。完成了所提出的开窗电路设计和版图设计,并对该电路进行了仿真验证。对比其他方案,文中设计实现了任意位置、最小1×1尺寸的开窗,同时解决了占用像元面积和竞争冒险问题,并提高了窗口切换速度。
红外焦平面 读出电路 开窗 infrared FPA readout integrated circuit region of interest(ROI) 红外与激光工程
2022, 51(11): 20220100
未来战争将向海陆空天一体化、海量数据信息化发展,舰船作为海洋信息感知的重要目标,其检测技术的发展对于红外安全防御系统具有重要意义。根据红外载荷成像特点,提出了红外目标检测的基本框架,并详细介绍了预处理、目标粗检和目标鉴别三个关键步骤的研究现状,在此基础上对各种算法进行比较并指出其适用性和优缺点,最后对其未来发展趋势进行了展望。
遥感图像 图像预处理 显著性 形态学处理 感兴趣区域 remote sensing image image preprocessing saliency morphological processing region of interest
重庆邮电大学 通信与信息工程学院, 重庆 400065
车道线检测是车辆智能驾驶系统的重要组成部分。针对传统的车道线检测方法精度低、实时性能差的问题, 提出一种基于机器视觉的车道线精确检测算法。该算法采用车道内侧边缘线代表车道线, 具体包括预处理和车道线提取两个步骤: 预处理部分包括灰度化、Sobel边缘检测、ROI设定、二值化, 最终得到车道线部分的二值图像; 车道线提取部分包括图像切片、改进的Hough直线检测、DBSCAN直线聚类以及直线拟合, 最终得到精确的车道边缘线信息。最后将算法应用于各种场景下的路况测试, 实验结果表明: 该算法的平均准确率为94.9%, 平均处理时长为25.6ms/f, 具有很好的实时性和鲁棒性。
车道线检测 感兴趣区域 霍夫变换 聚类 lane line detection region of interest Hough transform DBSCAN DBSCAN clustering
华东交通大学信息工程学院, 江西 南昌 330013
针对钢轨表面缺陷检测中,钢轨表面图像存在背景不均匀、缺陷尺度变化大且样本数据不足的问题,提出一种基于图像增强与改进Cascade R-CNN的钢轨表面缺陷检测方法。首先,采用改进Retinex算法处理钢轨表面图像,增强缺陷与背景的对比度。然后,采用改进Cascade R-CNN对钢轨表面缺陷进行检测,并应用交并比(IoU)平衡采样、感兴趣区域对齐和完全交并比(CIoU)损失分别解决训练样本IoU分布与困难样本IoU分布不平衡、感兴趣区域池化中取整量化导致的感兴趣区域与提取的特征图不匹配和回归损失Smooth L1对于预测边框回归不准确的问题。最后,采用翻转变换、随机剪裁、亮度变换和生成对抗网络等方法增广钢轨表面缺陷图像数据集,消除样本数据不足导致的网络训练过拟合现象。实验结果表明,该方法以ResNet-50作为特征提取器,平均精度可达98.75%,相对于未改进的Cascade R-CNN提高了2.52%,且检测时间缩短了24.2 ms。
图像处理 钢轨表面缺陷 图像增强 Cascade R-CNN 感兴趣区域对齐 完全交并比 数据增广 激光与光电子学进展
2021, 58(22): 2212001
广东工业大学 广东省焊接工程技术研究中心, 广州 510006
为了研究多层单道电弧增材表面3-D成形特征, 采用激光视觉传感系统采集电弧增材制造表面条纹图像。提出基于边界约束条件的感兴趣区域(ROI)提取法对焊缝特征曲线进行定位, 获取ROI的激光条纹像素坐标。进行了理论分析和实验验证, 得到电弧增材表面的3-D离散点数据, 采用Delaunay三角剖分对离散点拟合形成3-D实体表面。结果表明, 锯齿靶标的线性标定方法, 3-D重构精度在0.2mm以内;基于边界约束条件的ROI提取方法能准确定位电弧增材上表面和侧表面的条纹特征曲线。这一结果对电弧增材表面的3-D成形检测是有帮助的。
传感器技术 3-D重构 感兴趣区域提取 电弧增材 sensor technique 3-D reconstruction region of interest extraction arc additive
昆明理工大学信息工程与自动化学院, 云南 昆明 650500
目标检测是计算机视觉研究中的热门问题,其中加速区域卷积神经网络(Faster R-CNN)对目标检测具有指导意义。针对Faster R-CNN算法在目标检测中准确率不高的问题,先对数据进行增强处理;然后对提取的特征图进行裁剪,利用双线性插值法代替感兴趣区域池化操作,分类时采用软非极大值抑制(Soft-NMS)算法。实验结果表明,该算法在PASCAL VOC2007、PASCAL VOC07+12数据集下的准确率分别为76.40%和81.20%,相较Faster R-CNN算法分别提升了6.50个百分点和8.00个百分点。没有进行数据增强的情况下,在COCO 2014数据集上的准确率相较Faster R-CNN算法提升了2.40个百分点。
目标检测 加速区域卷积神经网络(Faster R-CNN) 感兴趣区域池化 软非极大值抑制(Soft-NMS) 激光与光电子学进展
2020, 57(10): 101009
长春理工大学 计算机科学技术学院, 长春 130022
针对立体图像舒适度难以有效地进行客观评价的问题, 结合人眼视觉注意机制, 提出了基于区域对比度的舒适度评价模型.根据显著图与视差图提取感兴趣区域作为前景区域; 量化前景和后景区域颜色空间, 估计空间加权区域对比度, 计算前景区域视差角、宽度角; 根据主观评价值利用最小二乘法拟合曲线得出客观评价模型.对比视差+宽度模型可知, 模型预测值与主观评价值的Pearson相关系数、Kendall相关系数较原模型分别提高了8.1%、3.9%, 且平均绝对值误差减小了13%, 均方根误差减小了22.1%.本文模型的普适性更优, 结果更接近主观评价值.
双目立体图像 视觉舒适度 对比度 感兴趣区域 客观评价 颜色空间 最小二乘法 Binocular stereo images Degree of visual comfortable Contrast Region of interest Objective evaluation Color space Least square method 光子学报
2018, 47(12): 1210002
上海理工大学 光电信息与计算机工程学院, 上海 200093
为了实现从掌纹图像中提取出稳定的感兴趣的区域(ROI)图像的目标,设计了一种新的掌纹ROI提取方法。使用Harris角点检测算法对二值化后的掌纹图像进行角点提取,收集相应区域的角点,利用聚类算法得到角点簇的中心点坐标,从中寻找关键点建立坐标系,提取ROI。分别利用该方法在不同掌纹数据库中进行了ROI提取实验。实验结果表明,该方法对不同的掌纹数据库图像均能保持很好的提取效果,成功率均达到了99%以上。
掌纹识别 Harris算法 聚类算法 感兴趣的区域 palmprint recognition Harris algorithm clustering algorithm region of interest