1 石家庄铁道大学 信息科学与技术学院,河北石家庄050043
2 河北省电磁环境效应与信息处理重点实验室,河北石家庄050043
遥感图像建筑物高效提取在城市规划、灾害救援、**侦察等领域发挥着重要作用。基于深度学习的建筑物提取方法虽然具有很高的精准度,但通常是由复杂的卷积运算和极大的网络模型实现的,提取速度低,难以满足现实需求。为此,设计了一种遥感图像建筑物快速提取方法。在STTNet模型的特征提取网络中引入多尺度卷积,在同一卷积层内提取多尺度特征,进一步提高模型的特征提取能力。改进空间稀疏特征提取器结构,在带有空间注意力权值的特征图中应用通道注意力,有效学习通道注意力权值,进而解决使用骨干网络输出特征图学习时通道注意力权值浮动的问题。为降低模型参数量,加快模型的运算速度,将STTNet模型由并联结构改为串联结构。INRIA建筑物数据集上的实验表明,本文方法在保证精度和IoU的前提下速度比STTNet提升了18.3%,明显优于主流方法。
遥感图像 建筑物提取 多尺度卷积 稀疏特征提取器 remote sensing image building extraction multi-scale convolution sparse feature extractor 光学 精密工程
2023, 31(11): 1700
1 河北工程大学 数理科学与工程学院, 邯郸 056038
2 河北省计算光学成像与光电检测技术创新中心, 邯郸 056038
为了实现高精度的数字全息相位解包裹, 采用基于Unet网络框架中集成MobilenetV3的轻量级深度学习网络, 设计了UMnet网络以实现全息相位的精准解包裹。网络中融和轻量级注意力机制、多尺度卷积来增强网络精度与泛化能力, 同时运用hard-Swish激活函数提高网络学习能力; 运用模拟数据集进行网络训练, 对生成网络模型进行降噪能力测试, 并经过了实际样品全息图的测试验证。结果表明, UMnet比深度学习相位解包裹网络的结构性相似指数值提升了6.6%。UMnet能够简单、快速、高效地实现数字全息相位解包裹。
全息 相位解包裹 注意力机制 多尺度卷积 holography phase unwrapping attention mechanism multi-scale convolution
1 西安邮电大学通信与信息工程学院(人工智能学院),陕西 西安 710121
2 陕西师范大学计算机科学学院,陕西 西安 710119
针对现有眼底血管分割方法难以辨别细小血管及交叉处血管分割断裂的问题,提出了一种基于注意力机制的多尺度U型网络。在编码阶段使用改进的残差块结构提取血管深度特征的同时有效解决过拟合问题,接着依次采用多尺度卷积模块和多尺度注意力模块进一步获取深度特征的多尺度特征信息。然后,使用MaxBlurPool进行池化,对数据进行降维并保证平移不变性。此外,在最后一个编码层引入混合注意力机制和并行空洞卷积,前者从通道和空间维度强调需要重点关注的信息,抑制背景区域的干扰;后者用来获取不同大小感受野的特征信息,且不会引入多余参数而导致计算负担。在解码部分,改进跳跃连接方式以抑制噪声的干扰并获得更加丰富的上下文信息。所提算法在公开的眼底数据集上取得了优于其他算法的分割效果。
图像处理 图像分割 视网膜血管 注意力机制 多尺度卷积 空洞卷积 激光与光电子学进展
2022, 59(18): 1810002
上海理工大学 医疗器械与食品学院 上海介入医疗器械工程技术研究中心, 上海 200093
散斑噪声存在于光学相干层析成像(OCT)中, 影响OCT图像质量。在使用OCT设备诊断各种常见眼科疾病时, 高质量的OCT图像是极为重要的。利用深度神经网络对OCT图像进行降噪处理, 使图像在保留空间结构细节的基础上能展示更多的信息。提出了一种基于残差学习网络的新型OCT图像降噪网络-CMCNN, 其具有多尺度、多权重和多层次特征融合等特点, 并且在保留图像空间结构细节的基础上降低图像噪声; 再将提出的模型与传统降噪算法、深度学习降噪模型进行比较。实验表明, CMCNN在峰值信噪比(PSNR)和结构相似性(SSIM)方面比其他深度学习方法提高了2.5%左右, 验证了方法可以有效地保留OCT图像中的细节信息, 同时有效地抑制噪声, 提高图像质量。
光学相干层析技术 图像降噪 条件卷积 多尺度 optical coherence tomography image noise reduction conditional convolution multi-scale convolution
1 上海交通大学自动化系, 上海 200000
2 海装驻上海地区军事代表局, 上海 201000
3 航天工程研究所, 北京 100000
针对复杂装备建立效能评估指标体系的难题, 引入了一维卷积神经网络模型, 构建了多形态卷积核并行处理框架;从多个观测角度自适应学习装备原始运行数据, 再对数据蕴含的特征加以整合, 进而建立新的效能评估指标体系, 避免了主观因素和计算难度的束缚, 为研究效能评估智能化方法奠定了基础。
一维卷积神经网络 多形态卷积核 指标体系 效能评估 one-dimensional convolution neural network multi-scale convolution kernel indicator system effectiveness evaluation
光子学报
2020, 49(10): 1010002
昆明理工大学信息工程与自动化学院, 云南 昆明 650500
人脸表情会受到姿势、物体遮挡、光照变化以及人种性别年龄等因素的影响,需要卷积神经网络更有效准确地学习特征。AlexNet在表情识别中准确率不高,对输入图像尺寸有限制,针对这些问题,提出了改进AlexNet网络的人脸表情识别算法。在AlexNet网络中引入多尺度卷积更加适用于小尺寸的表情图像,提取出不同尺度的特征信息,并在把多个低层次特征信息在向下传递的同时与高层次特征信息进行跨连接特征融合,从而可以更加完整准确地反映图像信息,构造出更准确的分类器。跨连接会产生参数爆炸,导致网络训练困难,影响识别效果,因此利用全局平均池化对低层次特征信息进行降维,可减少跨连接产生的参数和过拟合现象。本文算法在CK+、JAFFE数据库上的准确率分别为94.25%和93.02%。
图像处理 图像分类 表情识别 AlexNet 特征提取 多尺度卷积 跨连接 全局平均池化 特征融合 激光与光电子学进展
2020, 57(14): 141026
兰州交通大学电子与信息工程学院, 甘肃 兰州 730070
针对传统的单幅图像去雾算法容易受到雾图先验知识制约及颜色失真等问题,提出了一种基于深度学习的多尺度卷积神经网络(CNN)单幅图像去雾方法,即通过学习雾天图像与大气透射率之间的映射关系实现图像去雾。根据大气散射模型形成雾图机理,设计了一个端到端的多尺度全CNN模型,通过卷积层运算提取有雾图像的浅层特征,利用多尺度卷积核并行提取得到有雾图像的深层特征,然后将浅层特征和深层特征进行跳跃连接融合,最后通过非线性回归得到雾图对应的透射率图特征,并根据大气散射模型恢复出无雾图像。采用雾图数据集对该模型进行训练测试。实验结果表明,所提方法在合成有雾图像和真实自然雾天图像的实验中均能取得良好的去雾效果,在主观评价和客观评价上均优于其他对比算法。
图像处理 图像去雾 图像恢复 多尺度卷积神经网络 大气散射模型 光学学报
2019, 39(10): 1010001
1 中国科学院沈阳自动化研究所, 辽宁 沈阳 110016
2 中国科学院机器人与智能制造创新研究院, 辽宁 沈阳 110169
3 中国科学院大学, 北京 100049
4 中国科学院光电信息处理重点实验室 , 辽宁 沈阳 110016
图像盲复原是从一幅观测的模糊图像恢复出模糊核和清晰图像, 传统盲去卷积算法采用简化模型估计模糊核, 导致预测模糊核与真实值误差较大, 最终复原结果不理想。针对此问题提出一种基于改进残差模块的多尺度卷积神经网络模型, 采用端到端模式, 无需估计模糊核。提出了一种基于限制网络输入的改进Wasserstein GAN (WGAN), 增加了一层输入限制层, 能够限定参数初始值, 提高了网络收敛速度。设计了多重损失函数, 融合了基于多尺度网络的感知损失和基于条件式生成对抗网络的对抗损失。实验结果表明: 所提方法在定量和定性评价指标上优于已有的代表性方法, 并且运行速度比相近算法快了4倍。
多尺度卷积神经网络 多重损失函数 生成式对抗网络 噪声模糊图像 multi-scale convolution neural network multiple loss function generative adversarial networks noisy and blurry image 红外与激光工程
2019, 48(4): 0426001