计算成像是融合了光学设计、光学传感和图像处理的新兴技术领域,突破了传统成像技术获取信息的深度和广度限制,成为国际研究热点,是先进光学成像技术的重要发展方向。综合国内外文献和相关报道,以计算成像在信息复原及信息增强应用场景的技术发展为主线,结合新方法、新算法探讨各个子领域的主要进展,介绍端到端相机成像优化模型、衍射光学模型及基于可微光线追踪的复杂透镜模型等。近年来,无论是光学系统硬件加工还是图像处理算法都有着惊人的发展速度,多样化系统结构和先进算法的结合为计算成像提供了强大的发展动力,从人脸识别到物体检测,计算成像技术广泛涵盖了安防监控、医疗诊断、零售和娱乐等众多领域,相信未来也会在更多科学应用领域看到它的价值。
计算成像 全链路 光信息编解码 激光与光电子学进展
2024, 61(2): 0211033
1 南京信息工程大学, 南京 210000南京信息工程大学江苏省大气环境与装备技术协同创新中心, 南京 210000
2 南京信息工程大学, 南京 210000
针对水下图像颜色失真和细节丢失等问题, 提出了一种基于多尺度三重注意力机制的水下图像增强算法。该算法使用生成对抗网络作为基础架构, 生成网络采用编码解码结构, 并设计一个多尺度三重注意力模块, 多尺度结构和三重注意力机制结合可以实现不同层次信息的跨维度交互, 使网络更好地学习水下图像特征和抑制噪声特征, 判别网络采用类似马尔可夫判别器的结构; 构建了多个损失函数, 使生成的图像在结构、内容、色彩上和参考图像保持一致。实验结果表明, 所提算法在主观视觉和客观评价指标上均优于比较算法, 可以有效地提升网络的特征提取能力, 实现对不同场景水下图像的色彩恢复, 增强图像的对比度和清晰度。
水下图像增强 三重注意力 生成对抗网络 编码解码结构 多尺度结构 underwater image enhancement Triple Attention Generative Adversarial Network codec structure multi-scale structure
1 天津城建大学 计算机与信息工程学院,天津300384
2 天津城建大学 地质与测绘学院,天津300384
针对高分辨率遥感影像中建筑物形状多样、大小不一引起建筑物提取精度低及传统分割模型存在参数量大等问题,提出一种基于编码-解码的轻型多尺度差异网络LMD-Net(Lightweight Multi-scale Difference Network)。首先,为了避免单一的特征处理单元堆叠使得模型性能弱化而产生无效参数,通过融合编解码结构的功能差异性,设计出一种轻型差异模型优化性能。其次,引入一种多尺度膨胀感知模块(Multi-Scale Dilation Perception,MSDP)来增强网络捕捉多尺度目标特征的能力。最后,通过双融合机制有效聚合深层跳跃连接和深层解码器两组的特征信息,从而实现增强解码器的特征恢复能力。为验证轻型多尺度差异网络LMD-Net的有效性和适用性,以开源WHU building dataset数据集作为数据源,对LMD-Net网络与常用语义分割网络及近年相关文献研究成果进行了精度、效率方面的评估实验。结果表明:LMD-Net网络在效率与精度两方面均表现出明显优势,不仅很大程度上减少模型的参数量和计算量,而且交并比、准确率分别提高了3.23%,2.57%。表明在基于高分辨率遥感影像建筑物提取领域中,该模型所表现的优势具有良好的城市空间信息库价值。
高分辨率遥感影像 多尺度 建筑物提取 编码-解码 轻型 high resolution remote sensing image multi-scale building extraction coding-decoding light weight 光学 精密工程
2023, 31(22): 3371
1 天津大学精密仪器与光电子工程学院,天津 300072
2 天津市生物医学检测技术与仪器重点实验室,天津 300072
在功能性近红外光谱(fNIRS)成像技术的实现中,扩散光学层析成像(DOT)具有改善定量性和分辨率的巨大潜力,但其效果受制于生理干扰(呼吸、心跳和低频振荡等)、检测系统的随机噪声以及有限测量数据量带来的不适定性。为增强fNIRS-DOT成像的性能,本文提出了一种基于模型先验信息的深度卷积编解码网络重建方法,利用分层半三维重建算法实现对表层和深层脑血氧变化信息的初步区分,发挥卷积、编解码网络对空间特征的学习能力,实现对深层脑激活信息的提取重建。为验证所提重建方法的有效性,开展了数值模拟和仿体实验,并将其与传统重建方法进行对比。结果表明,所提重建法不仅可以显著提高重建精度,极大地缩短重建时间,而且具有优异的泛化能力,为实现动态fNIRS成像提供了重要参考。
生物光学 功能性近红外光谱成像 分层半三维重建 深度卷积编解码网络 中国激光
2023, 50(21): 2107107
光学 精密工程
2023, 31(18): 2700
黄冬青 1,2,3徐伟铭 1,2,3,*许文迪 1,2,3何小英 1,2,3潘凯祥 1,2,3
1 福州大学数字中国研究院(福建),福建 福州 350108
2 福州大学空间数据挖掘与信息共享教育部重点实验室,福建 福州 350002
3 福州大学地理空间信息技术国家地方联合工程研究中心,福建 福州 350002
针对卷积神经网络在遥感影像分类时遇到的模型参数量过大和分类精度低等问题,在DeeplabV3+网络的基础上,将编码器中的深层特征提取器替换为轻量化网络MobilenetV2和Xception_65,将解码器结构改为逐层特征融合实现解码区上采样的细化,引入通道注意力模块加强编解码器之间的信息关联,引入多尺度监督实现感受野自适应。构建4种具有不同编解码结构的网络,在CCF数据集上对网络进行验证测试。实验结果表明,编码器采用Xception_65,解码器同时引入逐层连接、通道注意力模块和多尺度监督的MS-XDeeplabV3+网络在减少模型参数量、加快模型训练速度的同时能更细化地物的边缘信息,提高对道路、水体等线状地物和草地的分类精度,像素总体精度和Kappa系数分别达0.9122和0.8646,在遥感影像分类中效果最佳。
遥感影像分类 卷积神经网络 编解码结构 逐层特征融合 通道注意力模块 多尺度监督 激光与光电子学进展
2023, 60(16): 1628001
红外与激光工程
2023, 52(3): 20220378
1 四川轻化工大学 自动化与信息工程学院,四川 宜宾 644000
2 四川轻化工大学 人工智能四川省重点实验室,四川 宜宾 644000
针对人脸图像修复的深度学习网络存在修复后的人脸图像面部语义信息不合理和面部轮廓不协调的问题,提出了一种基于人脸结构信息引导的人脸图像修复网络。首先,采用编码器-解码器网络技术构建人脸结构草图生成网络,并在结构草图生成网络的生成器中加入跳跃连接和引入带膨胀卷积的残差块以生成待修复区域的结构草图。其次,在构建人脸修复网络时,在修复网络生成器中引入注意力机制,让修复网络在修复过程中更多关注待修复区域,并以生成的人脸结构草图为引导从而实现人脸图像面部语义结构和纹理信息的生动修复。最后,在结构草图生成网络的损失函数中引入特征匹配损失进行模型训练,从而约束生成器生成与真实结构草图更相似的结果;在修复网络的损失函数中联合感知损失和风格损失进行模型训练,从而更好地重建待修复区域的人脸图像面部轮廓结构和颜色纹理,使修复后的图像更接近真实图像。对比实验结果表明,在人脸图像数据集中,本文所设计的网络模型的修复性能有较高的提升。
人脸修复 解码器-编码器 膨胀卷积 跳跃连接 注意力机制 face inpating encoder-decoder dilated convolution skip connections attention mechanism
1 上海海洋大学信息学院,上海 201306
2 农业农村部渔业信息重点实验室,上海 201306
为了提高影像阴影去除的效果,提出一种基于最小噪声分离(MNF)和生成对抗网络(GAN)的影像阴影去除算法。它以GAN作为基本框架,在生成器和判别器中分别引入条件信息,采用端到端共同学习的多任务模式。生成网络采用编码解码结构,判别网络采用马尔可夫判别器结构。此外,此算法使用MNF,将消除噪声的影像灰度化后与阴影影像一起训练,进而恢复无阴影的影像。这样的网络在训练时可以专注于MNF变换后的单独特征嵌入,而非传统的跨任务共享嵌入。实验结果表明,在指定数据集上,所提算法的结构相似性(SSIM)的平均值达0.9780,像素均方根误差(RMSE)的平均值减小到9.8717。在主观感知和客观评价指标上,所提算法的实验结果均优于对比算法。
阴影去除 最小噪声分离 生成对抗网络 编码解码结构 激光与光电子学进展
2023, 60(4): 0428004