作者单位
摘要
1 内蒙古科技大学 信息工程学院,内蒙古包头市0400
2 内蒙古工业大学 信息工程学院,内蒙古呼和浩特010051
U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首先,将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络,以验证其有效性和泛化性。其次,在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet,利用特征对齐单元强化上采样过程中的特征恢复,3D期望最大化注意力机制同时作用于特征对齐路径和级联路径,用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后,在BraTS2018和BraTS2019公开数据集进行验证,文中所提算法在ET,WT和TC区域的分割精度分别达到80.44%,90.07%,84.57%和78.11%,90.10%,82.21%。相较于当前流行的分割网络,具有对增强肿瘤区域更好的分割效果,更擅长处理细节和边缘信息。
脑肿瘤 图像分割 特征对齐 注意力机制 轻量化 brain tumors image segmentation feature alignment attention mechanism lightweight 
光学 精密工程
2024, 32(4): 565
陈昊 1张宝华 1,3,*吕晓琪 2,3谷宇 1,3[ ... ]张明 1,3
作者单位
摘要
1 内蒙古科技大学信息工程学院,内蒙古自治区包头 014010
2 内蒙古工业大学信息工程学院,内蒙古自治区呼和浩特 010051
3 内蒙古自治区模式识别与智能图像处理重点实验室,内蒙古自治区包头 014010
传统无监督域自适应行人重识别算法,抑制伪标签噪声效果差、域间泛化能力弱。针对这些问题,提出了一种基于软伪标签和多尺度特征融合的无监督域自适应行人重识别算法。为抑制伪标签噪声,利用并行网络的预测值作为软标签,通过交叉校对方式对伪标签噪声进行纠偏,为无监督域自适应任务提供更鲁棒的软伪标签。为增强域间泛化能力,利用多尺度特征重构和哈达玛积特征融合方法对深浅特征层信息进行处理,实现源域数据到目标域的风格转换,并结合实例和批量归一化网络解决残差网络域自适应性差的问题,增强网络对源域和目标域的泛化能力。实验结果表明,所提算法在Market-to-Duke和Duke-to-Market无监督域自适应任务中都取得了较好的性能,明显优于相关算法。
光计算 软伪标签 多尺度特征重构 哈达玛积特征融合 实例和批量归一化网络 行人重识别 
激光与光电子学进展
2022, 59(24): 2420001
作者单位
摘要
内蒙古科技大学 机械工程学院,内蒙古 包头 014010
为了提高人群计数模型对尺度和光噪声的鲁棒性,设计了一种多模态图像融合网络。提出了一种针对夜间人群统计模型,并设计了一个子网络Rgb-T-net,网络融合了热成像特征和可见光图像的特征,增强了网络对热成像和夜间人群特征的判断能力。模型采用自适应高斯核对密度图进行回归,在Rgb-T-CC数据集上完成了夜视训练和测试。经验证网络平均绝对误差为18.16,均方误差为32.14,目标检测召回率为97.65%,计数性能和检测表现优于当前最先进的双峰融合方法。实验结果表明,所提出的多模态特征融合网络能够解决夜视环境下的计数与检测问题,消融实验进一步证明了融合模型各部分参数的有效性。
夜视环境人群计数 Rgb图像 热成像 Rgb-T特征融合 crowd counting in night vision environment Rgb image thermal imaging Rgb-T feature fusion 
应用光学
2022, 43(6): 1088
作者单位
摘要
1 内蒙古科技大学 信息工程学院 模式识别与智能图像处理重点实验室,内蒙古包头0400
2 内蒙古工业大学 信息工程学院,内蒙古呼和浩特010051
医学图像配准在图谱创建和时间序列图像对比等临床应用中具有重要意义。目前,使用深度学习的配准方法与传统方法相比更好地满足了临床实时性的需求,但配准精确度仍有待提升。基于此,本文提出了一种结合残差混合注意力与多分辨率约束的配准模型MAMReg-Net,实现了脑部核磁共振成像(Magnetic Resonance Imaging, MRI)的单模态非刚性图像配准。该模型通过添加残差混合注意力模块,可以同时获取大量局部和非局部信息,在网络训练过程中提取到了更有效的大脑内部结构特征。其次,使用多分辨率损失函数来进行网络优化,实现更高效和更稳健的训练。在脑部T1 MR图像的12个解剖结构中,平均Dice分数达到0.817,平均ASD数值达到0.789,平均配准时间仅为0.34 s。实验结果表明,MAMReg-Net配准模型能够更好地学习脑部结构特征从而有效地提升配准精确度,并且满足临床实时性的需求。
医学图像处理 单模态配准 深度学习 注意力机制 多分辨率约束 medical imaging process unimodal registration deep learning attentional mechanism multi-resolution constraint 
光学 精密工程
2022, 30(10): 1203
武永强 1张宝华 1,3,*吕晓琪 2,3谷宇 1,3[ ... ]张明 1,3
作者单位
摘要
1 内蒙古科技大学信息工程学院,内蒙古 包头 014010
2 内蒙古工业大学信息工程学院,内蒙古 呼和浩特 010051
3 内蒙古模式识别与智能图像处理重点实验室,内蒙古 包头 014010
针对目标跟踪序列背景复杂、目标大尺度变化等导致目标辨识难度大的问题,提出了基于特征优选模型的Siamese网络目标跟踪算法。首先构建深度网络,有效地提取深度语义信息。再利用沙漏网络对多尺度下的特征图进行全局特征编码,将编码后的特征归一化处理,获取有效目标特征。最后构建特征优选模型,将解码获取的特征作为选择器甄别原特征图的有效特征并增强。为了进一步提高模型的泛化能力,引入注意力机制,对目标特征自适应加权,使其适应场景变化。最终提出算法在OTB100标准跟踪数据集测试成功率达到0.648,预测精度达到0.853,实时性为59.5 frame/s;在VOT2018标准跟踪数据集测试精度为0.536,期望平均覆盖率为0.192,实时性为44.3 frame/s,证明了该算法的有效性
机器视觉 深度学习 目标跟踪 Siamese网络 特征优选 特征融合 
激光与光电子学进展
2022, 59(12): 1215003
李克文 1张宝华 1,3,*吕晓琪 2,3谷宇 1,3[ ... ]张明 1,3
作者单位
摘要
1 内蒙古科技大学信息工程学院,内蒙古 包头 014010
2 内蒙古工业大学信息工程学院,内蒙古 呼和浩特 010051
3 内蒙古模式识别与智能图像处理重点实验室,内蒙古 包头 014010
针对遥感图像背景复杂、飞机目标尺寸变化大的问题,提出了基于平滑标签和多路聚合网络的遥感飞机检测方法。考虑到遥感图像中飞机目标辨识难度大,利用联合注意力机制捕获目标区域,缩小搜索范围。再使用改进的路径聚合网络提取主干网络中的4个特征层,可以有效提取浅层特征信息,将各层特征归一化后进行融合,预测目标的位置。为了避免训练模型过度依赖预测标签,造成过拟合,在网络中使用平滑标签技术,减小类内距离,有效提高训练模型的泛化能力。通过在两个公开数据集RSOD和HRRSD上进行大量实验,验证了提出方法的有效性。实验结果表明在RSOD数据集中,提出方法的平均精确率为0.967,在HRRSD数据集中平均精确率为0.993,与相关算法对比,检测精度有明显提升。
图像处理 遥感图像 平滑标签 多路聚合网络 注意力机制 
激光与光电子学进展
2022, 59(12): 1210011
任国印 1,2吕晓琪 1,2,3,*李宇豪 2
作者单位
摘要
1 内蒙古科技大学机械工程学院,内蒙古 包头 014010
2 内蒙古科技大学信息工程学院,内蒙古 包头 014010
3 内蒙古工业大学,内蒙古 呼和浩特 010051
为了实现跨摄像机区域的多人脸图像跟踪,提出了一种基于双三分支孪生网络(DTN)的跨摄像机跟踪网络。具体方法是应用Chinese Whisper(CW)人脸聚类算法对同一行人的人脸图像进行聚类,并根据聚类结果通过智能监控确定捕获的目标人脸。通过改进FaceNet的网络结构和训练函数,实现了行人面部的精确跟踪。在LFW数据集上训练DTN后,通过边缘样本挖掘损失(MSML)和焦点损失难样本平衡训练,人脸识别率可以提高到99.51%。实验结果表明:通过比较同一视频监控场内人脸特征的相似性,所提网络可以通过该区域跟踪行人的人脸目标;通过摄像机间人脸特征的实时传输,实现了跨摄像机的人脸跟踪。
图像处理 人脸聚类 双三分支孪生网络 人脸跟踪 跨摄像机 人脸识别 
激光与光电子学进展
2022, 59(2): 0210004
任国印 1,2,*吕晓琪 1,2,3李宇豪 2
作者单位
摘要
1 内蒙古科技大学 机械工程学院, 内蒙古 包头 014010
2 内蒙古科技大学 信息工程学院, 内蒙古 包头 014010
3 内蒙古工业大学, 内蒙古 呼和浩特 010051
目前, 公安机关刑侦部门大量的离线视频存储在监控网络的服务器中, 为了在这些海量视频帧中提取嫌疑人目标人脸, 设计了人脸检索系统。通过改变CNN网络的RELU结构, 训练新的四分支孪生网络来获取深度特征, 构造了一个新的四分支孪生网络。结合网上发布的逃犯人脸图片发起通缉, 借助深度特征对比展开基于内容的图像检索(CBIR)。新的四分支孪生网络比熟悉的网络, 如Alexnet、Googlenet、VGGNet和ResNet等收敛得更快, 系统鲁棒性好。网络的共享权重设计使得检索具有较高的模型训练精度和检索精度。图像深度特征可以在摄像机之间快速在线共享。实验结果表明, 该方法的平均检索精度(ARP)为98.74%, 模型训练精度为99.51%, 帧率为28 FPS。
四孪生网络 人脸检索 跨摄像机 基于内容的图片检索 quadruplet network face retrieval cross camera content-based image retrieval 
液晶与显示
2021, 36(11): 1583
任国印 1,2吕晓琪 1,2,3,*李宇豪 2
作者单位
摘要
1 内蒙古科技大学机械工程学院, 内蒙古 包头 014010
2 内蒙古科技大学信息工程学院, 内蒙古 包头 014010
3 内蒙古工业大学, 内蒙古 呼和浩特 010051
提出了一种基于二维(2D)转三维(3D)骨架的实时检测双分支子网络,可实现2D骨架关键点的3D估计和2D、3D骨架特征融合的人体3D动作识别。在检测过程采用OpenPose框架实时获取视频中人体骨架的2D关键点坐标。在2D转3D骨架估计过程中,设计了一种输入为难样本且具有反馈功能的孪生网络。在3D动作识别过程中设计了一种2D、3D骨架特征双分支孪生网络,以完成3D姿态识别任务。在Human3.6M数据集上训练3D骨架估计网络,在基于欧拉变换的NTU RGB+D 60多视角增强数据集上训练骨架动作识别网络,最终得到的3D骨架动作识别交叉受试者准确率为88.2%,交叉视野准确率为95.6%。实验结果表明,该方法对3D骨架的预测精度较高,且具有实时反馈能力,可适用于实时监控中的动作识别。
图像处理 三维骨架估计 人体动作识别 多分支网络 多特征融合 
激光与光电子学进展
2021, 58(24): 2410010
作者单位
摘要
1 内蒙古科技大学 信息工程学院 内蒙古自治区模式识别与智能图像处理重点实验室, 包头 014010
2 内蒙古工业大学 信息工程学院, 呼和浩特 010051
3 大连海事大学 信息科学技术学院, 大连116026
为了解决人脸检测存在小目标人脸携带的特征信息少且相对较为模糊, 导致检测难度较高的问题, 采用将尺度不变人脸检测器(S3FD)网络与通道和空间注意力机制相结合的网络作为主干, 在通道和空间上建立了特征之间的权重关系, 强化特征提取能力, 将原本S3FD所输出的特征图经扩大感受野后进行上采样, 使得上一层特征图的输出包含了下一层特征图的特征。结果表明,widerface数据集的3个不同等级的验证集的平均精准率分别为95.0%, 93.7%, 86.4%, 与原S3FD相比分别提高了1.3%, 1.2%, 0.5%。本文中提出的算法在人脸检测中具有较好的检测效果。
图像处理 人脸检测 小目标 注意力机制 深度学习 image processing face detection small target attention mechanism deep learning 
激光技术
2021, 45(6): 722

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!