相同关键词【multitask learning】论文列表 -- 中国光学期刊网

相同关键词【multitask learning】论文列表

期刊

选择下列全部论文 将选定结果：

图像处理

基于CTC-Attention脱机手写体文本识别

下载：896次

马洋洋肖冰 ^*

作者单位

摘要

陕西师范大学计算机科学学院, 陕西西安 710062

针对脱机手写体书写随意、字符分割困难和识别精度依赖字典等问题,提出了一种基于CTC-Atention脱机手写体文本识别算法。利用卷积神经网络(CNN)与双向长短时期记忆网络(BLSTM)实现对图像的特征编码,然后使用基于链接时序分类(CTC)模型和基于注意力机制(Attention-based)模型的多任务学习(MTL)框架实现对特征序列的解码。在训练过程中利用CTC模型和注意力机制模型同时训练,有效地解决了CTC预测局部信息时忽略了整体信息,以及注意力机制解码不受约束的问题。在经典的手写英文单词数据集IAM上进行实验,结果表明,该方法的字符准确率达到了93.4%,单词准确率达到了81.8%,证明了提出方法的可行性。

图像处理脱机手写体文本识别链接时序分类注意力机制多任务学习

PDF全文 Full Text

激光与光电子学进展

2021, 58(12): 1210007

图像处理

Self-Att-BiLSTM: 一种面向业务流程活动与时间的多任务预测方法

下载：1386次

贺琪 ¹杨巧青 ¹黄冬梅 ²宋巍 ^1,*杜艳玲 ¹

作者单位

摘要

¹ 上海海洋大学信息学院, 上海 201306

² 上海电力大学, 上海 200090

业务流程中事件日志的分析与预测可以为流程监控和管理提供决策信息,现有研究方法多针对特定单个任务预测,不同任务间预测方法的可迁移性不高。多任务预测可以共享多个任务间的信息,提升单个任务预测的精度,但现有研究对重复活动的多任务预测效果有待提高。针对以上问题,提出一种注意力机制与双向长短时记忆结合的深度神经网络模型,实现对业务流程中重复活动和时间的多任务预测。预测模型可以共享不同任务已经学到的特征表示,实现多任务并行训练。在多个数据集中对不同方法进行对比,结果表明,所提方法提高了预测效率和预测精度,尤其对重复活动的预测精度有较好提升。

图像处理业务流程监控预测多任务学习注意力机制双向长短时记忆网络

PDF全文 Full Text

激光与光电子学进展

2021, 58(4): 0410003

信息科学

多模态特征融合与多任务学习的特种视频分类

吴晓雨 ^1,*顾超男 ¹王生进 ²

作者单位

摘要

¹ 中国传媒大学信息与通信工程学院, 北京 100024

² 清华大学电子工程系, 北京 100084

特种视频(本文特指暴力视频)的智能分类技术有助于实现网络信息内容安全的智能监控。针对现有特种视频多模态特征融合时未考虑语义一致性等问题, 本文提出了一种基于音视频多模态特征融合与多任务学习的特种视频识别方法。首先, 提取特种视频的表观信息和运动信息随时空变化的视觉语义特征及音频信息语义特征; 然后, 构建具有语义保持的共享特征子空间, 以实现音视频多种模态特征的融合; 最后, 提出基于音视频特征的语义一致性度量和特种视频分类的多任务学习特种视频分类理论框架, 设计了对应的损失函数, 实现了端到端的特种视频智能识别。实验结果表明, 本文提出的算法在Violent Flow和MediaEval VSD 2015两个数据集上平均精度分别为97.97%和39.76%, 优于已有研究。结果证明了该算法的有效性, 有助于提升特种视频监控的智能化水平。

特种视频识别特征提取多模态特征融合语义一致性度量多任务学习 special video recognition feature extraction multimodal feature fusion semantic correspondence measurement multitask learning

PDF全文 Full Text

光学精密工程

2020, 28(5): 1177

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索