戴腾 1,2张珂 1,2尹东 1,2,*
作者单位
摘要
1 中国科学技术大学信息科学技术学院,安徽 合肥 230027
2 中国科学院电磁空间信息重点实验室,安徽 合肥 230027
小目标物体实时检测一直是图像处理领域中的难点。本文基于深度学习的目标检测算法,提出了一种端到端的神经网络,用于复杂驾驶场景下的手机小目标检测。首先,通过改进YOLOv4算法,设计了一个端到端的小目标检测网络(OMPDNet)来提取图片特征;其次,基于K-means算法设计了一个聚类中心更加贴切数据样本分布的聚类算法K-means-Precise,用以生成适应于小目标数据的先验框(anchor),从而提升网络模型的效率;最后,采用监督与弱监督方式构建了自己的数据集,并在数据集中加入负样本用于训练。在复杂的驾驶场景实验中,本文提出的OMPDNet算法不仅可以有效地完成驾驶员行车时使用手机的检测任务,而且对小目标检测在准确率和实时性上较当今流行算法都有一定的优势。
目标检测 神经网络 聚类算法 监督与弱监督 object detection neural network clustering algorithm supervision and weak supervision 
光电工程
2021, 48(4): 200325
曹志 1,2尚丽丹 1,2尹东 1,2,*
作者单位
摘要
1 中国科学技术大学信息科学技术学院,安徽 合肥 230027
2 中国科学技术大学中国科学院电磁空间信息重点实验室,安徽 合肥 230027
车辆识别代号对于车辆年检具有重要的意义。由于缺乏字符级标注,无法对车辆识别代号进行单字符风格校验。针对该问题,设计了一种单字符检测和识别框架,并对此框架提出了一种无须字符级标注的弱监督学习方法。首先,对VGG16-BN各个层次的特征信息进行融合,获得具有单字符位置信息与语义信息的融合特征图;其次,设计了一个字符检测分支和字符识别分支的网络结构,用于提取融合特征图中的单字符位置和语义信息;最后,利用文本长度和单字符类别信息,对所提框架在无字符级标注的车辆识别代号数据集上进行弱监督训练。实验结果表明,本文方法在车辆识别代号测试集上得到的检测Hmean数值达到0.964,单字符检测和识别准确率达到95.7%,具有很强的实用性。
卷积神经网络 弱监督学习 自然场景文本检测 自然场景文本识别 车辆识别代号 convolutional neural network weakly supervised learning scene text detection scene text recognition vehicle identification number (VIN) 
光电工程
2021, 48(2): 200270
孟凡俊 1,2,*尹东 1,2
作者单位
摘要
1 中国科学技术大学信息科学技术学院,安徽 合肥 230027
2 中国科学院电磁空间信息重点实验室,安徽 合肥 230027
在车辆识别和车辆年检时,正确识别车架上金属刻印的车辆识别代号(VIN)是非常重要的环节。针对VIN 序列,本文提出了一种基于神经网络的旋转VIN 图片识别方法,它由VIN 检测和VIN 识别两部分组成。首先,在EAST 算法基础上利用轻量级神经网络提取特征,并结合文本分割实现快速、准确的VIN 检测;其次,将VIN 识别任务作为一个序列分类问题,提出了一种新的识别VIN 方法,即通过位置相关的序列分类器,预测出最终的车辆识别代号。为了验证本文的识别方法,引入了一个VIN 数据集,其中包含用于检测的原始旋转VIN 图像和用于识别的水平VIN 图像。实验结果表明,本文方法能有效地识别车架VIN 图片,同时达到了实时性。
车辆识别代号 神经网络 文本分割 机器视觉 vehicle identification number neural network text segmentation machine vision 
光电工程
2021, 48(1): 200094
金瑶 1,2张锐 1,2尹东 1,2,*
作者单位
摘要
1 中国科学技术大学信息科学技术学院,安徽 合肥 230027
2 中国科学院电磁空间信息重点实验室,安徽 合肥 230027
视频图像中的小像素目标难以检测。针对城市道路视频中的小像素目标,本文提出了一种改进YOLOv3 的卷积神经网络Road_Net 检测方法。首先,基于改进的YOLOv3,设计了一种新的卷积神经网络Road_Net;其次,针对小像素目标检测更依赖于浅层特征,采用了4 个尺度检测方法。最后,结合改进的M-Softer-NMS 算法来进一步提高图像中目标的检测精度。为了验证所提出算法的有效性,本文收集并标注了用于城市道路小像素目标物体检测的数据集Road-garbage Dataset,实验结果表明,本文算法能有效地检测出诸如纸屑、石块等在视频中相对于路面的较小像素目标。
视频图像 小像素目标 卷积神经网络 video image smaller pixel object convolutional neural network 
光电工程
2019, 46(9): 190053
王嫣然 1,2,*罗宇豪 1,2尹东 1,2
作者单位
摘要
1 中国科学技术大学信息科学技术学院, 安徽 合肥 230027
2 中国科学院电磁空间信息重点实验室, 安徽 合肥 230027
由于目前监控视频所拍摄的人脸图像目标较小、难以辨识, 图像超分辨处理已成为亟待解决监控视频图像实际应用问题的技术和手段。提出了一种针对室外监控视频人脸图像的超分辨技术,利用先验知识设置图像训练集, 并进行图像空间转化、去噪等预处理操作; 设计八层卷积神经网络并对各层类型及连接方式进行设定, 同时设定激活函数类型及各层间传递方式函数; 初始化参数并根据训练集训练网络; 根据损失函数反向调整卷积核和偏置参数, 完成图像输出。经过大量实际监控视频图像测试, 并将本文方法和现有其他方法做对比, 实验结果表明,本文方法在图像超分辨效果和处理速度上均有一定的优势。
图像处理 图像超分辨 卷积神经网络 监控视频 
光学学报
2017, 37(3): 0318012
刘小金 1,2,*尹东 1,2王华凌 3
作者单位
摘要
1 中国科学技术大学 信息科学技术学院,合肥 230027
2 中国科学院电磁空间信息重点实验室,合肥 230027
3 安徽中烟工业有限责任公司合肥卷烟厂,合肥 230601
提出了一种紧密二值描述子用于解决RGB-D 人脸识别过程中的特征表达问题。首先,不同于手工设计的特征,该方法使用无监督学习从训练数据自动获取紧密的二值特征;其次,该方法使用像素与周围像素的差异信息作为输入,利用了空间上下文信息;最后,考虑到Depth 图像平滑性特点,对分块的Depth 和RGB 图提取不同半径范围的像素差异信息。实验结果表明,该方法具有较强的人脸描述能力,且对光照和面部遮挡具有一定的鲁棒性,并在两个公开的RGB-D 数据库上获得了较好的识别率。
人脸识别 无监督学习 紧密二值特征 face recognition unsupervised learning compact binary feature RGB-D RGB-D 
光电工程
2016, 43(12): 162
文凌艳 1,2,*尹东 1,2
作者单位
摘要
1 中国科学技术大学 信息科学技术学院,合肥 230027
2 中国科学院电磁空间信息重点实验室,合肥 230027
视频运动检测中,运动阴影常被误检为运动目标。针对这一问题,提出了一种利用哈尔型特性局部二元模 式(HLBP)检测运动阴影的方法。首先,提取每个检测到的运动像素及其对应背景像素的HLBP 特征向量。其次, 使用曼哈顿距离度量HLBP 纹理差异,获得纹理差异图。最后,利用最大类间方差算法(Ostu 算法)对纹理差异图 进行二值化处理,得到消除运动阴影后的目标结果。实验表明,该方法在多种室内外场景中能实时且有效地检测 出运动阴影,具有较强的实用性。
运动阴影检测 哈尔型特性局部二元模式 纹理差异 图像分割 moving shadow detection Haar local binary pattern texture difference image segmentation 
光电工程
2016, 43(10): 84
谢昌志 1,2,*尹东 1,2孙涛 2,3
作者单位
摘要
1 中国科学技术大学电子工程与信息科学系,合肥 230027
2 超精密控制与系统联合实验室,合肥 230027
3 中国科学院长春光学精密机械与物理研究所光电部,长春 130033
提出了一种基于块匹配的迭代滤波合成孔径雷达图像去噪方法。首先,利用图像块之间的相似性进行块匹配,将相似图像块构建成一个三维矩阵。然后,在相似图像块之间进行迭代变换域滤波去除相干斑噪声,通过加权平均重建得到基本估计去噪图像。最后,对基本估计结果图像执行块匹配,在相似图像块内与相似图像块之间进行三维经验滤波得到最终去噪图像。实验表明,该方法不仅能够很好的去除合成孔径雷达图像相干斑噪声,还能够较好地保持图像的细节信息。
块匹配 迭代滤波 合成孔径雷达 去噪 block matching iterative filtering SAR image denoising 
光电工程
2015, 42(1): 65
作者单位
摘要
中国科学技术大学电子工程与信息科学系, 合肥 230027
针对自然图像提出了一种基于最大方向梯度的模糊度评价方法。该方法首先对图像进行方向梯度运算, 并进行方向性掩蔽, 然后提取一组最大梯度值, 运用最大梯度值估计的模糊度均值即为全局模糊度评价值。通过算法一致性实验、交叉失真实验和灵敏度实验表明, 本文方法评价值与主观评价值一致性高, 性能稳定, 灵敏度好。
图像质量评价 模糊度 最强方向梯度 无参考 image quality assessment blurriness maximum oriented gradient no-reference 
光电工程
2013, 40(5): 79
作者单位
摘要
中国科学技术大学 电子工程与信息科学系,合肥 230027
本文以机场场景下的可见光和SAR 图像为研究对象,提出了一种基于虚拟点特征的可见光和SAR 图像配准方法。该方法以虚拟点特征和控制点匹配技术为基础,处理具有全局仿射几何失真的异源图像配准问题。首先根据两类图像的特点,使用Canny 算子和一种兴趣算子提取两幅图像中的共有特征?直线特征,然后在直线特征的基础上拟合虚拟点特征,采用基于特征一致的粗配准和基于虚拟点特征的精确配准相结合的方法,对两幅图像实现由粗到精的自动配准。实验结果表明,本文方法可行且能取得较高的配准精度。
图像配准 直线特征 虚拟点 特征一致 image registration line feature virtual point feature consistency 
光电工程
2009, 36(11): 79

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!