作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
时序动作检测作为视频理解中的一项基本任务,被广泛应用于人机交互、视频监控、智能安防等领域。基于卷积神经网络,提出了一种改进的编码-解码时序动作检测算法。改进后的算法分两阶段进行:首先,替换特征提取网络,用残差结构网络提取视频帧的深度特征;之后,构建编码-解码时序卷积网络。采用联接的方式进行特征融合,改进上采样的形式,并运用新的激活函数LReLU进行训练,提高网络的检测精度。实验结果表明,所提算法在时序动作检测数据集MERL Shopping和GTEA上取得了优良的效果。
光计算 图像处理 动作检测 时序卷积神经网络 深度学习 
激光与光电子学进展
2021, 58(20): 2020001
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对教室场景小人脸识别准确率低的问题,基于InsightFace算法,结合MobileFaceNet结构和DenseNet结构,提出一种将通道相加和通道级联结合起来的Dual-MobileFaceNet轻量级网络结构,提高了识别速度和小人脸识别准确率。同时,提出一种双重分类算法,进一步改善了InsightFace算法的识别分类能力,在LFW数据集上准确率达99.46%。最后将所提算法移植在Jetson TX2嵌入式开发板上,在8人、18人教室场景下识别准确率分别达96.24%、94.68%,每帧识别速度分别约为0.14 s、0.29 s。相比其他大型网络,所提网络更具实时性和有效性。所提算法为教室人脸识别、无感知考勤系统提供了有效思路。
机器视觉 人脸识别 卷积神经网络 教室场景 深度学习 
激光与光电子学进展
2020, 57(22): 221501
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
关于行为检测的算法有很多,但针对教室场景下的学生行为检测算法却略显缺乏。为了使学生行为检测算法具有较好的准确率和实时性,在MTCNN的基础上改进了网络结构,并提出了一种新的激活函数和损失函数以检测学生图像和关键点。同时,提出了通过图像分类网络和关键点分类网络对学生行为进行联合分类的策略。实验结果表明,所提出的改进措施均有效提升了学生行为检测的准确率,最终模型的检测准确率为78.6%。在嵌入式开发板Jetson TX2上,所提算法的实时检测准确率和速度优于YOLOv3和SSD等算法。
图像处理 机器视觉 神经网络 行为检测 教室场景 
激光与光电子学进展
2020, 57(22): 221016
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对目标检测准确率低,物体位置不精准的缺点,设计了一种基于改进的特征提取网络的目标检测算法。首先将训练集进行数据增强;其次设计了一种双通道网络,用于目标检测算法Faster R-CNN的特征提取;最后在算法的预测部分,对非极大值抑制(NMS)机制进行了改进,并采用加权平均方法获取存在多个相近的预测框的位置。在VOC 2007和VOC 2012数据库上进行实验,表明本文算法比经典的目标检测算法效果要好,准确率达到79.1%,提升了3%~4%,验证了本文算法的有效性。
图像处理 深度学习 目标检测 特征提取 卷积神经网络 
激光与光电子学进展
2019, 56(23): 231008
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
为使通过卷积神经网络学习到的人脸识别特征更容易判别,在角度距离损失函数A-Softmax的基础上进行改进,将人脸属性融入到训练过程中,如性别、年龄和种族。使用属性驱动损失函数,利用属性邻近性对特征映射进行正则化,实验结果表明本方法学习到更多与属性相关的鉴别特征。本文改进算法在人脸验证数据集(包括LFW,CFP,AgeDB和 MegaFace)上均取得不错的效果,验证了该改进算法的有效性。
机器视觉 人脸识别 卷积神经网络 人脸属性 
激光与光电子学进展
2019, 56(24): 241505
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
为解决人脸表情识别任务中存在的类内表情差异性大、类间表情相似度高的问题,基于传统的Softmax损失函数和Island损失函数,提出一种新的基于余弦距离损失函数来指导深度卷积神经网络的学习。该方法不仅可以减小特征空间中类内特征的差异,而且可以增大类间特征分布,从而提升特征判别效果。经过大量的实验和分析,该算法在RAF-DB人脸表情数据集上的准确率达到了83.196%,效果优于Softmax损失函数和Island损失函数,所提算法在人脸表情识别任务中具有较高的优越性。
机器视觉 深度学习 表情识别 卷积神经网络 损失函数 
激光与光电子学进展
2019, 56(24): 241502
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对教室场景下后排学生人脸微小难以检测的情况,提出一种基于卷积神经网络的教室人脸检测算法。采用两阶段检测形式,运用残差神经网络的结构对教室人脸进行特征提取,同时构建特征金字塔,并将Softmax损失函数与中心特征损失函数结合,运用合适的激活函数进行训练。此算法在教室场景下获得95.2%的准确率,且在通用数据集Wider Face的三个等级验证集上分别获得93.0%,87.3%,58.3%的平均精度均值。
机器视觉 人脸检测 教室考勤 卷积神经网络 深度学习 
激光与光电子学进展
2019, 56(21): 211501
作者单位
摘要
天津大学 电气自动化与信息工程学院, 天津 300072
提出一种针对HDR图像的显示方法, 该方法应用于LCD-LED双调制高动态显示器, 旨在使显示器更好地显示HDR图像要求的亮度细节, 提高视觉质量。首先, 建立HDR图像亮度与LED亮度范围对应关系, 使用光扩散函数作为背光LED亮度取值范围的权重。然后, 统计LED的亮度辐射区域内不同LED发光强度等级的权重, 取权重最大者对应的亮度作为该背光LED亮度。最后, 利用依据LED亮度生成LED背光扩散图像与HDR图像计算出LCD显示图像。仿真结果表明, 该算法可以使显示器亮度失真率系数低至0.006以下。在LCD-LED双调制高动态显示器上实验验证结果表明, 该算法可以有效提高图像的层次感, 有效抑制LCD-LED双调制高动态显示器的“光晕”以及亮度截断现象, 提高显示质量。
高动态范围 区域背光 双调制结构 HDR图像 high dynamic range local dimming dual modulation structure HDR image 
液晶与显示
2019, 34(1): 14
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
在开集协议下设计了一种基于角度距离损失函数和密集连接卷积神经网络的人脸识别算法,以实现深度人脸识别。所设计的网络结构使用基于角度距离的损失函数,让人脸特征的区分度更高,符合特征的理想分类标准。同时,所提出的神经网络结构采用先进的密集连接模块,在很大程度上减少了传统网络结构的参数冗余。经过大量的分析和实验,该算法在LFW数据集上的人脸识别准确率达到了99.45%,在MegaFace数据集上的人脸确认任务和人脸验证任务中的人脸识别准确率分别为72.534%和85.348%,因此所提算法在人脸识别任务中具有较高的优越性。
机器视觉 人脸识别 卷积神经网络 深度学习 角度损失函数 密集连接 
激光与光电子学进展
2018, 55(12): 121505

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!