贾剑利 1,2,3韩慧妍 1,2,3,*况立群 1,2,3韩方正 1,2,3[ ... ]张秀权 1,2,3
1 中北大学计算机科学与技术学院,山西 太原 030051
2 机器视觉与虚拟现实山西省重点实验室,山西 太原 030051
3 山西省视觉信息处理及智能机器人工程研究中心,山西 太原 030051
当前基于深度学习的目标检测算法已较为成熟。然而,基于少量样本检测新类仍具有挑战性,因为少样本条件下的深度学习容易导致特征空间退化。现有工作采用整体微调范式在丰富样本的基类上进行预训练,在此基础上构建新类的特征空间。然而,新类基于多个基类隐式地构造特征空间,其结构较为分散,导致基类与新类之间可分性较差。采用对新类和与其相似的基类进行关联再识别的方法进行少样本目标检测。通过引入动态感兴趣区域头,提升模型对训练样本的利用率,基于二者间的语义相似度,显式地为新类构建特征空间。通过解耦基类和新类的分类分支、添加通道注意力模块及增加边界损失函数,提升二者间的可分性。在标准PASCAL VOC数据集上的实验结果表明,所提方法的nAP50均值较TFA、MPSR及DiGeo分别提升10.2、5.4、7.8。
少样本目标检测 关联和识别 动态感兴趣区域头 通道注意力 边界损失 激光与光电子学进展
2024, 61(8): 0837015
未来战争将向海陆空天一体化、海量数据信息化发展,舰船作为海洋信息感知的重要目标,其检测技术的发展对于红外安全防御系统具有重要意义。根据红外载荷成像特点,提出了红外目标检测的基本框架,并详细介绍了预处理、目标粗检和目标鉴别三个关键步骤的研究现状,在此基础上对各种算法进行比较并指出其适用性和优缺点,最后对其未来发展趋势进行了展望。
遥感图像 图像预处理 显著性 形态学处理 感兴趣区域 remote sensing image image preprocessing saliency morphological processing region of interest
重庆邮电大学 通信与信息工程学院, 重庆 400065
车道线检测是车辆智能驾驶系统的重要组成部分。针对传统的车道线检测方法精度低、实时性能差的问题, 提出一种基于机器视觉的车道线精确检测算法。该算法采用车道内侧边缘线代表车道线, 具体包括预处理和车道线提取两个步骤: 预处理部分包括灰度化、Sobel边缘检测、ROI设定、二值化, 最终得到车道线部分的二值图像; 车道线提取部分包括图像切片、改进的Hough直线检测、DBSCAN直线聚类以及直线拟合, 最终得到精确的车道边缘线信息。最后将算法应用于各种场景下的路况测试, 实验结果表明: 该算法的平均准确率为94.9%, 平均处理时长为25.6ms/f, 具有很好的实时性和鲁棒性。
车道线检测 感兴趣区域 霍夫变换 聚类 lane line detection region of interest Hough transform DBSCAN DBSCAN clustering
华东交通大学信息工程学院, 江西 南昌 330013
针对钢轨表面缺陷检测中,钢轨表面图像存在背景不均匀、缺陷尺度变化大且样本数据不足的问题,提出一种基于图像增强与改进Cascade R-CNN的钢轨表面缺陷检测方法。首先,采用改进Retinex算法处理钢轨表面图像,增强缺陷与背景的对比度。然后,采用改进Cascade R-CNN对钢轨表面缺陷进行检测,并应用交并比(IoU)平衡采样、感兴趣区域对齐和完全交并比(CIoU)损失分别解决训练样本IoU分布与困难样本IoU分布不平衡、感兴趣区域池化中取整量化导致的感兴趣区域与提取的特征图不匹配和回归损失Smooth L1对于预测边框回归不准确的问题。最后,采用翻转变换、随机剪裁、亮度变换和生成对抗网络等方法增广钢轨表面缺陷图像数据集,消除样本数据不足导致的网络训练过拟合现象。实验结果表明,该方法以ResNet-50作为特征提取器,平均精度可达98.75%,相对于未改进的Cascade R-CNN提高了2.52%,且检测时间缩短了24.2 ms。
图像处理 钢轨表面缺陷 图像增强 Cascade R-CNN 感兴趣区域对齐 完全交并比 数据增广 激光与光电子学进展
2021, 58(22): 2212001
1 九江学院电子工程学院,江西九江 332005
2 南昌大学医学部,江西南昌 330031
3 南昌大学九江附属医院妇科,江西九江 332000
4 九江市妇幼保健院新生儿科,江西九江 332000
5 九江学院信息科学与技术学院,江西九江 332005
医学红外热像设备测得的红外数据及转换得到的温度数据难以直接判定其所属的人体区域,常需将其转为图像数据,利用图像处理技术得到感兴趣区域并从区域内温度数据得到生物特征,实现疾病的筛查或诊断。然而,从 14位红外数据转换到 8位图像数据存在严重的数据精度损失,导致处理性能欠佳。本文提出一种新的热像图表达方法,所得到的彩色热像图含原精度的温度数据信息,且含温度观察窗设定尺度下的彩色增强效果,同时载有温度数据记录和观察窗设定规则,通过对图像数据的逆变换,可以再现原始温度数据,并可改变彩色增强效果。该方法提供的热像图无需额外存取温度数据文件,在不同的红外热像系统间具有通用性,将更符合大数据和人工智能的发展趋势。
医学红外热像图 彩色增强 温度观察窗 感兴趣区域 medical infrared thermography, color enhancement,
广东工业大学 广东省焊接工程技术研究中心, 广州 510006
为了研究多层单道电弧增材表面3-D成形特征, 采用激光视觉传感系统采集电弧增材制造表面条纹图像。提出基于边界约束条件的感兴趣区域(ROI)提取法对焊缝特征曲线进行定位, 获取ROI的激光条纹像素坐标。进行了理论分析和实验验证, 得到电弧增材表面的3-D离散点数据, 采用Delaunay三角剖分对离散点拟合形成3-D实体表面。结果表明, 锯齿靶标的线性标定方法, 3-D重构精度在0.2mm以内;基于边界约束条件的ROI提取方法能准确定位电弧增材上表面和侧表面的条纹特征曲线。这一结果对电弧增材表面的3-D成形检测是有帮助的。
传感器技术 3-D重构 感兴趣区域提取 电弧增材 sensor technique 3-D reconstruction region of interest extraction arc additive
昆明理工大学信息工程与自动化学院, 云南 昆明 650500
目标检测是计算机视觉研究中的热门问题,其中加速区域卷积神经网络(Faster R-CNN)对目标检测具有指导意义。针对Faster R-CNN算法在目标检测中准确率不高的问题,先对数据进行增强处理;然后对提取的特征图进行裁剪,利用双线性插值法代替感兴趣区域池化操作,分类时采用软非极大值抑制(Soft-NMS)算法。实验结果表明,该算法在PASCAL VOC2007、PASCAL VOC07+12数据集下的准确率分别为76.40%和81.20%,相较Faster R-CNN算法分别提升了6.50个百分点和8.00个百分点。没有进行数据增强的情况下,在COCO 2014数据集上的准确率相较Faster R-CNN算法提升了2.40个百分点。
目标检测 加速区域卷积神经网络(Faster R-CNN) 感兴趣区域池化 软非极大值抑制(Soft-NMS) 激光与光电子学进展
2020, 57(10): 101009
1 内蒙古科技大学信息工程学院, 内蒙古 包头 014010
2 包头医学院, 内蒙古 包头 014010
为了对传统体素生长算法加以改进,提取心脏局部血管,在三维心脏组织的感兴趣局部血管上勾画初始体素种子点,将初始体素的相邻体素中灰度直方图相似的体素添加到生长体素集合中,作为新的种子点按照生长规则继续寻找相似体素。为了防止体素生长过程中出现泄漏,设置终止规则限制体素生长的边界,进而找到感兴趣血管包括的全部体素。通过对体素生长算法的生长规则和终止条件的进一步改进,在一定程度上解决了传统体素生长算法交互性差、运行不实时等问题,测试结果表明该算法的准确度高、稳健性好,是心血管疾病临床治疗过程中有效的影像辅助工具。
医用光学 体素生长算法 交互式分割 心血管系统 感兴趣区域 激光与光电子学进展
2018, 55(6): 061701
长春理工大学 计算机科学技术学院, 长春 130022
针对立体图像舒适度难以有效地进行客观评价的问题, 结合人眼视觉注意机制, 提出了基于区域对比度的舒适度评价模型.根据显著图与视差图提取感兴趣区域作为前景区域; 量化前景和后景区域颜色空间, 估计空间加权区域对比度, 计算前景区域视差角、宽度角; 根据主观评价值利用最小二乘法拟合曲线得出客观评价模型.对比视差+宽度模型可知, 模型预测值与主观评价值的Pearson相关系数、Kendall相关系数较原模型分别提高了8.1%、3.9%, 且平均绝对值误差减小了13%, 均方根误差减小了22.1%.本文模型的普适性更优, 结果更接近主观评价值.
双目立体图像 视觉舒适度 对比度 感兴趣区域 客观评价 颜色空间 最小二乘法 Binocular stereo images Degree of visual comfortable Contrast Region of interest Objective evaluation Color space Least square method 光子学报
2018, 47(12): 1210002