相同关键词【时空注意力】论文列表 -- 中国光学期刊网

相同关键词【时空注意力】论文列表

期刊

选择下列全部论文 将选定结果：

医用光学与生物技术

基于注意力机制的视频眼震图分类算法研究

下载：652次

周浩军赵晓丽 ^*高永彬李海波程若然

作者单位

摘要

上海工程技术大学电子电气工程学院，上海 201600

现有的良性阵发性位置性眩晕视频眼震图分类算法存在以下不足：人工提取的特征主观性和局限性强；眼球的轴向转动特征提取困难；仅能区分正常人群和患者，或对简单的眼震进行分类。针对上述问题，提出了一种基于注意力机制的视频眼震图分类算法。以轻量级模型三维 MobileNet V2为基础网络进行特征提取，在全局细节特征、时空信息丰富的网络低层引入全局时空注意力模块，融合眼球震颤空间信息和帧间时序信息；在网络高层引入时空通道注意力机制，筛选高级语义特征；采用带有类别调制系数的交叉熵损失函数对网络进行训练，有效缓解了类别数量不平衡的问题。在复旦大学附属眼耳鼻喉科医院提供的包括66种类别的视频眼震图数据集上进行了实验，所提算法的分类准确度达到90.08%，各类别的平均精准度、召回率、F1-score分别为90.50%，92.00%，90.40%，表明了所提算法的优越性。

医用光学图像处理医学图像处理视频眼震图分类时空注意力机制良性阵发性位置性眩晕三维卷积神经网络

PDF全文 Full Text

激光与光电子学进展

2022, 59(16): 1617001

基于轻量级图卷积网络的校园暴力行为识别

李颀 ¹邓耀辉 ^2,*王娇 ²

作者单位

摘要

¹ 陕西科技大学电子信息与人工智能学院，陕西西安 710021

² 陕西科技大学电气与控制工程学院，陕西西安 710021

针对卷积神经网络和图卷积网络的两类算法在校园暴力行为识别中识别速度和识别率不高的问题，本文提出一种结合多信息流数据融合和时空注意力机制的轻量级图卷积网络。以人体骨架为研究对象，首先融合关节点和骨架相关的多信息流数据，通过减少网络参数量来提高运算速度；其次构建基于非局部运算的时空注意力模块关注最具动作判别性的关节点，通过减少冗余信息提高识别准确率；接着构建时空特征提取模块获得关注关节点时空关联信息；最终由Softmax层实现动作识别。实验结果表明：在校园安防实景中对拳打、脚踢、倒地、推搡、打耳光和跪地6种典型动作识别准确率分别为94.5%，97.0%，98.5%，95.0%，94.5%，95.5%，识别速度最大为20.6 fps。在UCF101数据集上对比两类基准网络，识别速度和准确率均有提升，验证了方法对其他动作的通用性，可以满足对校园典型暴力行为识别的实时性和可靠性要求。

校园暴力行为识别图卷积网络数据融合时空注意力模块 campus violence action recognition graph convolution network information flow data fusion spatio-temporal attention module

PDF全文 Full Text

液晶与显示

2022, 37(4): 530

光电技术及应用

基于时空注意力网络的中国手语识别

罗元 ^1,*李丹 ¹张毅 ²

作者单位

摘要

¹ 重庆邮电大学光电工程学院, 重庆 400065

² 重庆邮电大学信息无障碍与服务机器人工程技术研究中心, 重庆 400065

手语识别广泛应用于聋哑人与正常人之间的交流中。针对手语识别任务中时空特征提取不充分而导致识别率低的问题, 提出了一种新颖的基于时空注意力的手语识别模型。首先提出了基于残差3D卷积网络(Residual 3D Convolutional Neural Network, Res3DCNN)的空间注意力模块, 用来自动关注空间中的显著区域; 随后提出了基于卷积长短时记忆网络(Convolutional Long Short-Term Memory, ConvLSTM)的时间注意力模块, 用来衡量视频帧的重要性。所提算法的关键在于在空间中关注显著区域, 并且在时间上自动选择关键帧。最后, 在CSL手语数据集上验证了算法的有效性。

手语识别时空注意力残差3D网络卷积LSTM网络 sign language recognition spatial-temporal attention Res3DCNN ConvLSTM

PDF全文 Full Text

半导体光电

2020, 41(3): 414

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索