作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
针对单样本目标检测样本量较少的问题,提出了一种基于跨域学习的方法。该方法从数据增强的角度出发,增加其他域的数据集作为辅助,增强网络学习能力,同时为解决不同域间存在差异的问题,提出了一种基于图片尺度和实例尺度的跨域学习算法,分别对输入的图片特征与检测网络的候选特征增加域分类器模型,用于增强网络对跨域数据的背景和目标的域适应能力。在两个不同的跨域场景进行实验,其中在PASCAL VOC数据集上与目前主流的单样本目标检测算法进行比较,超过目前最好算法2.8个百分点,从而证明了本文方法可以有效提高单样本目标的检测性能。
卷积神经网络 目标检测 单样本学习 跨域学习 
激光与光电子学进展
2023, 60(4): 0415004
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
交通标志检测是自动驾驶系统的一项重要功能,当前先进的交通标志检测器大多采用Anchor-Based网络模型,根据锚框遍历所有潜在的目标位置。为了减少锚框带来的计算开销和过多的超参数设置,提出了一种基于编码-解码结构的Anchor-Free交通标志检测算法。为了增加解码模块的特征表征能力,在解码模块中引入残差增强分支。为了高效地提取和利用多尺度特征,设计了特征融合子网络,提升对多尺度目标的检测能力,并使用Ghost轻量化模块提取多尺度特征图,不显著引进运算量。在Tsinghua-Tencent 100K数据集上进行验证,所提算法实现了92.5%的召回率和90.3%的准确率,模型的参数量和模型大小分别为1.61×107和64.4 Mbit。实验结果表明,与主流目标检测算法相比,所提算法的检测精度较高,计算开销较低,在综合性能上具有优越性。
机器视觉 交通标志检测 Anchor-Free 残差结构 多尺度特征融合 
激光与光电子学进展
2022, 59(24): 2415002
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
模型压缩可以有效地促进卷积神经网络在资源受限设备上的部署。作为一个研究热点,滤波器剪枝已经受到了从学术界到工业界的广泛关注。滤波器剪枝的本质是对重要滤波器进行选择和保留。然而,现有的研究主要集中在静态滤波器和局部滤波器的选择上,压缩后的模型仍然存在一定的冗余。基于此,提出了一种自适应动态滤波器剪枝方法,该方法通过引入一个激活权值生成模块来生成每个滤波器的激活值。将模块嵌入各种经典网络中,来动态评估卷积层中所有滤波器的重要性,并自适应地选择能提取更丰富信息的滤波器来重构剪枝后的网络。在CIFAR-10和AUC数据集上使用不同卷积神经网络进行了实验,所提方法在CIFAR-10数据集上与目前几种主流的剪枝方法相比具有更优越的性能。在AUC数据集上进行剪枝前后压缩70%左右计算量的情况下,准确率下降不超过0.3个百分点。在不同网络上的实验证明了该方法在不同模型上的泛化能力。
机器视觉 深度学习 卷积神经网络 滤波器剪枝 分类模型 模型压缩 
激光与光电子学进展
2022, 59(24): 2415003
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对交通标志只在图像中占极小的区域且难以准确识别的问题,提出一种基于注意力模型的无锚框交通标志识别算法,利用密集连接网络DenseNet-121作为骨干网络并对特征进行提取。为了解决小型交通标志准确率低的问题,在骨干网络中加入注意力模型,可以对特征图进行空间和通道上的自适应调整,通过加强或抑制特征图中元素的权重可以提升对小型交通标志的识别性能。为了减小编码路径与解码路径间的语义鸿沟,引入残差网络的连接方式并提出一种语义连接路径。为了解决锚框中正负样本不均衡的问题,采用无锚框的检测方式可以定位交通标志的中心点、回归边界框的位置与尺寸信息。对所提算法在TT100K数据集上进行验证,实验结果证明所提算法具有优越性。
图像处理 深度学习 交通标志识别 注意力模型 无锚框 
激光与光电子学进展
2021, 58(16): 1610020
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
提出了一种基于深度学习的3D脑肿瘤核磁共振图像(MRI)自动分割方法。为了降低分割难度,采用三级级联网络的策略分割脑肿瘤的三个子区域;为了进一步提高三维分割的精度,采用帧间卷积和帧内卷积,加入额外的多层特征融合机制和空洞卷积;为了进一步细化分割结果,将条件随机场构建的循环神经网络整合到网络结构中。在模型训练中结合了两种损失函数,进一步提高了准确率。该方法在BraTS 2018 数据集上进行验证,对于脑肿瘤整体、肿瘤核以及增强肿瘤,其分割结果的Dice系数分别达到了0.9093、0.8254 和 0.7855,Hausdorff距离达到3.8188、7.8487和4.3264,优于大多数脑肿瘤图像分割方法。
图像处理 脑肿瘤分割 多层特征融合 空洞卷积 条件随机场 
激光与光电子学进展
2021, 58(8): 0810020
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
提出基于卷积神经网络的驾驶行为分析算法,该算法在人脸定位的基础上实现了驾驶员的疲劳检测和行为检测。针对疲劳检测任务,探究了卷积神经网络的不同感受野对疲劳检测精度的影响,并得到了疲劳检测模型的最佳结构。针对行为检测任务,考虑到不同行为对应作用域的大小不同,提出了一种基于多尺度特征的多支路注意力网络模型,该模型通过提取多尺度特征实现了多尺度分类,并且使用注意力机制来强化判别特征。实验结果证明,该方法能够与多种主流卷积神经网络模型相结合并有效提升驾驶行为分析的准确率。
激光与光电子学进展
2020, 57(14): 141018
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
深度卷积网络提取的表情特征易受背景、个体身份等因素影响,其与无用特征混合在一起对表情识别造成干扰。针对此问题,提出一种基于注意力模型的面部表情识别算法,该方法基于一个轻量级的卷积神经网络以避免过拟合,通过通道注意力模块和空间注意力模块对特征图元素进行加强或抑制,应用残差学习单元使注意力模型学习到更丰富的特征并获得更好的梯度流。此外,还提出一种面部表情关键区域截取方案,以解决非表情区域的噪声干扰问题。在两个常用的表情数据集CK+和MMI上对所提方法进行了验证,实验结果证明了该方法的优越性。
图像处理 表情识别 面部分析 卷积神经网络 注意力模型 
激光与光电子学进展
2020, 57(12): 121015
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津300072
提出了一种基于导师-学生网络的驾驶行为识别模型。考虑到驾驶动作是在局部区域发生的,将驾驶行为识别任务拆分成动作定位和动作分类两个子任务。针对动作定位任务,设计了网络层数较浅和接收高分辨率图像输入的导师网络,导师网络通过特征图的响应对动作区域进行弱定位;在动作定位基础上,针对动作分类任务,设计了网络层数较深的接收低分辨率动作区域图像输入的学生网络,学生网络根据深层网络提取的高层次语义特征实现高准确率分类。实验结果证明,导师-学生网络模型能带来较高的识别准确率,具有强稳健性。
图像处理 深度学习 驾驶行为识别 卷积神经网络 弱定位 动作分类 导师-学生网络 
激光与光电子学进展
2020, 57(6): 061019
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
提出了一种基于级联的2.5维(2.5D)卷积神经网络。将该任务拆分为脑肿瘤整体分割、肿瘤核分割、增强肿瘤分割三个子任务,并将三个结果合并生成最终结果。在每个子任务中,对三维(3D)图像进行轴向、矢向和冠向的裁取,生成2.5D图像;将2.5D图像输入至所提2.5D V-Net中进行训练;将2.5D分割结果拼接成3D结果,生成不同子任务的分割结果图。结果表明,所提方法对肿瘤整体、肿瘤核和增强肿瘤分割的平均dice值分别可达0.9071、0.8542和0.8140,基本满足临床需要。
图像处理 三维图像 图像分割 卷积神经网络 磁共振图像 
激光与光电子学进展
2019, 56(10): 101001
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
医学图像处理是图像处理领域的重点和难点,细节丰富的清晰图像有助于协助专家和计算机辅助诊断。针对磁共振医学图像的特点,提出一种结合小波特征和聚类字典的单帧超分辨率重建方法。在训练阶段,首先分别提取低分辨率图像的多尺度小波特征和高分辨率图像的高频特征,将高低分辨率特征图重叠分块,然后利用K均值算法将特征块聚类,使用K奇异值分解分别训练每一类特征块的高低分辨率字典,形成映射关系;在重建阶段,提取低分辨率图像特征块并分类,使用该类字典原子进行重建。最后,引入迭代反投影算法进行后处理,以进一步提高重建质量。实验结果显示,该算法在内部、外部数据集上,视觉和量化指标都有较好表现,并优于同类算法。
图像处理 超分辨率 小波特征 聚类字典 磁共振图像 
激光与光电子学进展
2018, 55(5): 051009

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!