AI高清视频导读  
作者单位
摘要
1 太原理工大学 电子信息与光学工程学院,山西 晋中 030606
2 太原理工大学 电气与动力工程学院,山西 太原 030024
针对光流法无法充分利用微表情面部颜色信息,导致识别准确率不高的问题,本文提出一种基于颜色和光流的多注意力双流网络方法。首先,提出以CIE Luv色差图的形式,初步提取人脸情感生理特征,弥补微表情光流特征的单一性和局限性;然后,将PAM模块和ECA block并行组合得到轻量化的双注意力模块,提取空间和通道关键特征;最后,设计一种交叉注意力机制以获取颜色和光流混合特征,将其与空间通道关键特征融合用于分类。本模型在实验中采用留一交叉验证法进行评估,在SAMM数据集上的准确率和F1分数分别达到69.18%和67.04%,在CASME Ⅱ数据集上的准确率和F1分数分别达到72.38%和70.85%。实验结果均优于目前主流算法,进一步证明本文模型及其模块在识别微表情方面的有效性。
计算机视觉 微表情识别 CIE Luv 颜色特征 光流特征 双流网络 computer vision micro-expression recognition CIE Luv color features optical flow features two-stream network 
液晶与显示
2024, 39(7): 939
AI超清视频导读  
作者单位
摘要
东华大学机械工程学院,上海 201620
由于可见光图和红外光图存在巨大的模态差异,可见光-红外光行人重识别是一个艰巨的任务。当前可见光-红外光行人重识别面临的主要问题是如何有效提取模态共享特征中的有用信息。为解决这个问题,提出了一个基于视觉Transformer的双流跨模态行人重识别网络,通过使用模态令牌嵌入模块和多分辨率特征提取模块来监督模型提取有辨别力的模态共享信息。此外,为了增强模型的辨别力,设计了模态一致性约束损失和特征中心约束损失。模态一致性损失会引导模型学习模态间的不变特征;特征中心约束损失会监督模型降低类内特征的差异性,增加类间特征的差异性。在SYSU-MM01数据集和RegDB数据集上的大量实验结果表明,所提方法优于大多数现有方法。在SYSU-MM01大型数据集上,所提模型的首位命中率和均值平均精度分别达到了67.69%和66.82%。
图像处理 行人重识别 跨模态 双流网络 损失函数 
激光与光电子学进展
2024, 61(12): 1215006
AI超清视频导读  
作者单位
摘要
重庆邮电大学通信与信息工程学院,重庆 400065
跨模态行人重识别是一项具有挑战性的行人检索任务。现有研究侧重于通过提取模态共享特征来减小模态间差异,忽视了对模态内差异和背景干扰的处理。为此,提出了一种掩模重构与动态注意力(MRDA)网络,该网络通过重构人体区域特征来消除背景杂波的影响,从而增强网络对背景变化的鲁棒性。此外,该网络结合了动态注意力机制,以过滤无关信息,动态挖掘并增强具有辨别力的特征表示,消除模态内差异的影响。实验结果显示:该网络在SYSU-MM01数据集的all-search模式下的第一个检索结果匹配成功的概率(Rank-1)和均值平均精度(mAP)分别达到70.55%和63.89%;在RegDB数据集的visible-to-infrared检索模式下的Rank-1和mAP分别达到91.80%和82.08%。在公共数据集上验证了所提方法的有效性。
行人重识别 跨模态 掩模重构 双流网络 动态注意力 
激光与光电子学进展
2024, 61(10): 1015001
作者单位
摘要
1 东南大学, 南京 210000
2 西安电子科技大学, 西安 710000
针对传统视频异常事件检测算法准确率低、鲁棒性差等问题, 提出了一种基于双流残差网络的视频异常事件检测算法。该算法综合运用深层残差网络、时序分割网络以及卷积融合策略。在传统双流网络利用单帧图像和多帧光流图像分别提取运动信息和时序行为的基础上, 进一步加深网络深度, 扩展运动信息建模能力; 同时,利用分段构建网络的方式充分提取时序特征, 提升对长时间视频处理效果; 并且将高维时空特征进行融合, 充分挖掘视频中的时空关联关系, 得到最终检测结果。在公开的UCF-Crime和XD-Violence数据集上训练和验证的实验结果表明, 提出的基于双流残差网络的视频异常事件检测算法相较于仅使用单模态网络(空间流网络)的方法准确率提升约10%, 与传统双流网络相比, 准确率也分别提升3.2%和6.1%。
视频异常事件检测 多模态特征融合 残差网络 双流网络 video anomaly event detection multi-modal feature fusion residual network two-stream network  
电光与控制
2022, 29(8): 88
作者单位
摘要
1 信阳职业技术学院数学与计算机科学学院,河南 信阳 464000
2 信阳农林学院信息工程学院,河南信阳 464000
3 中国人民解放军空军第一航空学院研究生大队,河南 信阳 464000
为了提升复杂背景下红外序列的行人动作识别精度,本文提出了一种改进的空时双流网络,该网络首先采用深度差分网络代替时间信息网络,提高时空特征的表征能力与提取效率;然后,采用基于决策级特征融合机制的代价函数对模型进行训练,可以更大限度地保留不同网络帧间图像的时空特征,更加真实地反映行人的动作类别。仿真结果表明,本文提出的改进网络在自建的红外视频数据集上获得了81%的识别精度,且计算效率也提升了25%,具有较高的工程应用价值。
双流网络 红外序列 动作识别 光流图像 差分网络 深度学习 空时特征 two-stream network infrared sequences action recognition optical-flow differential network 
红外技术
2021, 43(9): 852
 
作者单位
摘要
南通大学电气工程学院, 江苏 南通 226019
由于传统的视觉里程计(VO)存在实现过程繁琐、计算复杂等问题,提出了一种基于改进双流网络结构的VO。所提VO使用双流卷积神经网络结构,能够将RGB图像、深度图像同时馈入模型进行训练,并采用Inception网络结构对卷积层进行改进,减少参数数量。同时,在卷积层中加入注意力机制,提升网络对图像特征的辨识度和系统的鲁棒性。为了评估所提模型,在KITTI数据集上进行了模型的训练与测试,并与VISO2-M、VISO2-S和SfMLearner进行对比。结果表明,相较于同样使用单目相机的VISO2-M和SfMLearner,所提模型在旋转误差和平移误差方面取得了较大的改善,可与使用双目相机的VISO2-S相媲美。
图像处理 成像系统 视觉里程计 注意力机制 深度学习 双流网络 
激光与光电子学进展
2021, 58(20): 2010006
作者单位
摘要
中国民航大学 电子信息与自动化学院,天津300300
针对传统双流网络无法捕捉视频序列中的时序关系从而导致对时序依赖较大的行为识别效果不理想的问题,提出一种基于改进双流时空网络的人体行为识别算法。首先利用时间移位思想,使卷积神经网络对视频中的时序关系建模,从而高效地捕捉视频中的时空信息;同时使用注意力机制改善由于通道信息在时间轴上移动导致的空间特征学习能力下降的问题;在此基础上构建了一个包含时空表观信息流和时空运动信息流的双流网络结构;最后,采用加权平均的方式融合双流网络,得到最终的识别结果。在UCF101和HMDB51数据集上分别进行了实验,识别准确率为96.3%和77.7%,实验结果表明,与传统双流网络方法相比,识别准确率得到了一定的提升,验证了本文算法能够有效捕捉视频中的时序关系,增强网络的特征表达能力,提高对时序依赖较大的行为和近似行为的辨识能力。
计算机视觉 行为识别 双流网络 时间移位 注意力机制 computer vision action recognition two-stream convolution networks temporal shift attention mechanism 
光学 精密工程
2021, 29(2): 420
 
作者单位
摘要
江南大学江苏省模式识别与计算智能工程实验室, 江苏 无锡 214122
针对传统的双流网络不能有效提取视频序列中的有效帧和帧中的有效区域,而导致识别准确率低的问题,提出了一种基于时空交互注意力模型(STIAM)的人体行为识别算法。首先,利用两个不同的深度学习网络分别提取空间和时间特征;其次,设计一种掩模引导的空间注意力模型,用于计算每一帧上的显著性位置;然后,设计一种光流引导的时间注意力模型,用于定位每个视频中的显著性帧;最后,分别将时间、空间注意力获得的权重与空间特征、时间特征进行加权融合,使模型实现时空交互性。在UCF101和Penn Action数据集上与现有的方法进行比较,实验结果表明,STIAM具有较好的特征提取能力,可以明显提升行为识别的精度。
机器视觉 行为识别 双流网络 注意力 深度学习 交互性 
激光与光电子学进展
2020, 57(18): 181506
 
作者单位
摘要
宁波大学信息科学与工程学院, 浙江 宁波 315211
对视网膜血管形态特征的分析有助于视网膜相关疾病的诊断。为了能够更准确地分割出视网膜血管,提出一种基于双流网络的分割视网膜血管的方法。首先用具有编码器-解码器结构的卷积神经网络分别对整个血管和细血管进行分割;再将所得到的两个预测图进行融合,对融合后的图像去除伪影和噪声,得到最终的血管分割图。由于单独对细血管进行了分割,因此所提方法可以更有效地分割出一些难以识别的视网膜血管边缘和低对比度区域的细血管像素。实验结果表明,所提方法在DRIVE、STARE和CHASE_DB1三个数据库上的灵敏度分别达到0.8062、0.8308和0.8135,在性能上比其他方法更优。
图像处理 视网膜 双流网络 血管分割 卷积神经网络 
光学学报
2020, 40(4): 0410002

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!