Yiwei Chen 1,2Yi He 1,2,*Hong Ye 1Lina Xing 1,2[ ... ]Guohua Shi 1,2,3
Author Affiliations
Abstract
1 Jiangsu Key Laboratory of Medical Optics, Suzhou Institute of Biomedical Engineering and Technology, Chinese Academy of Sciences, Suzhou 215163, P. R. China
2 School of Biomedical Engineering (Suzhou), Division of Life Sciences and Medicine, University of Science and Technology of China Hefei 230026, P. R. China
3 Center for Excellence in Brain Science and Intelligence Technology, Chinese Academy of Sciences, Shanghai 200031, P. R. China
The prediction of fundus fluorescein angiography (FFA) images from fundus structural images is a cutting-edge research topic in ophthalmological image processing. Prediction comprises estimating FFA from fundus camera imaging, single-phase FFA from scanning laser ophthalmoscopy (SLO), and three-phase FFA also from SLO. Although many deep learning models are available, a single model can only perform one or two of these prediction tasks. To accomplish three prediction tasks using a unified method, we propose a unified deep learning model for predicting FFA images from fundus structure images using a supervised generative adversarial network. The three prediction tasks are processed as follows: data preparation, network training under FFA supervision, and FFA image prediction from fundus structure images on a test set. By comparing the FFA images predicted by our model, pix2pix, and CycleGAN, we demonstrate the remarkable progress achieved by our proposal. The high performance of our model is validated in terms of the peak signal-to-noise ratio, structural similarity index, and mean squared error.
Fundus fluorescein angiography image fundus structure image image translation unified deep learning model generative adversarial networks 
Journal of Innovative Optical Health Sciences
2024, 17(3): 2450003
作者单位
摘要
1 西京学院 材料与能源科学技术研究院,陕西 西安 710123
2 北京星航机电装备有限公司,北京 100074
3 西北工业大学 光电与智能研究院,陕西 西安 710072
在计算机视觉领域中,基于孪生网络的跟踪算法相比于传统算法提高了精度和速度,但是仍会受到目标遮挡、变形、环境变化等影响,导致孪生网络的跟踪算法的性能降低。为了深入了解基于孪生网络的单目标跟踪算法,本文对现有基于孪生网络目标跟踪算法进行了总结和分析,主要包括在孪生网络中引入注意力机制方法、超参数推理方法和模板更新方法,对这3种方法的目标跟踪算法进行了综述,详细介绍了国内外近几年基于孪生网络的算法研究和发展现状。对3个方面的代表算法采用VOT2016、VOT2017、VOT2018和OTB-2015数据集进行实验对比,获得了多种基于孪生网络的目标跟踪算法的性能。最后对基于孪生网络的目标跟踪算法进行了总结,并对未来的发展方向进行了展望。
计算机视觉 目标跟踪 孪生网络 深度学习 computer vision target tracking Siamese networks deep learning 
液晶与显示
2024, 39(2): 192
作者单位
摘要
1 辽宁工程技术大学 软件学院,辽宁 葫芦岛 125105
2 汕头职业技术学院 计算机系,广东 汕头 515071
现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取,上采样过程本质是卷积运算,卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制,但依然存在图像细节缺失、图像结构性错误等问题。针对上述存在的问题,提出一种基于自监督注意和图像特征融合的生成对抗网络模型SAF-GAN。将基于ContNet的自监督模块加入到初始特征生成阶段,利用注意机制进行图像特征之间的自主映射学习,通过特征的上下文关系引导动态注意矩阵,实现上下文挖掘和自注意学习的高度结合,提高低分辨率图像特征的生成效果,后续通过不同阶段网络的交替训练实现高分辨率图像的细化生成。同时加入了特征融合增强模块,通过将模型上一阶段的低分辨率特征与当前阶段的特征进行融合,生成网络可以充分利用低层特征的高语义信息和高层特征的高分辨率信息,更加保证了不同分辨率特征图的语义一致性,从而实现高分辨率的逼真的图像生成。实验结果表明,相较于基准模型(AttnGAN),SAF-GAN模型在IS和FID指标上均有改善,在CUB数据集上的IS分数提升了0.31,FID指标降低了3.45;在COCO数据集上的IS分数提升了2.68,FID指标降低了5.18。SAF-GAN模型能够有效生成更加真实的图像,证明了该方法的有效性。
计算机视觉 生成对抗网络 文本生成图像 CotNet 图像特征融合 computer vision generative adversarial networks text-to-image cotnet image feature fusion 
液晶与显示
2024, 39(2): 180
作者单位
摘要
宁夏大学 物理与电子电气工程学院,宁夏 银川 750021
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。
文本生成图像 XLnet模型 生成对抗网络 通道注意力 text-to-image XLnet model generate adversarial networks attention of channel 
液晶与显示
2024, 39(2): 168
Wei Yin 1,2,3†Yuxuan Che 1,2,3†Xinsheng Li 1,2,3Mingyu Li 1,2,3[ ... ]Chao Zuo 1,2,3,****
Author Affiliations
Abstract
1 Smart Computational Imaging Laboratory (SCILab), School of Electronic and Optical Engineering, Nanjing University of Science and Technology, Nanjing 210094, China
2 Smart Computational Imaging Research Institute (SCIRI) of Nanjing University of Science and Technology, Nanjing 210019, China
3 Jiangsu Key Laboratory of Spectral Imaging & Intelligent Sense, Nanjing 210094, China
4 Department of Electrical and Electronic Engineering, The University of Hong Kong, Pokfulam, Hong Kong SAR 999077, China
Recently, deep learning has yielded transformative success across optics and photonics, especially in optical metrology. Deep neural networks (DNNs) with a fully convolutional architecture (e.g., U-Net and its derivatives) have been widely implemented in an end-to-end manner to accomplish various optical metrology tasks, such as fringe denoising, phase unwrapping, and fringe analysis. However, the task of training a DNN to accurately identify an image-to-image transform from massive input and output data pairs seems at best na?ve, as the physical laws governing the image formation or other domain expertise pertaining to the measurement have not yet been fully exploited in current deep learning practice. To this end, we introduce a physics-informed deep learning method for fringe pattern analysis (PI-FPA) to overcome this limit by integrating a lightweight DNN with a learning-enhanced Fourier transform profilometry (LeFTP) module. By parameterizing conventional phase retrieval methods, the LeFTP module embeds the prior knowledge in the network structure and the loss function to directly provide reliable phase results for new types of samples, while circumventing the requirement of collecting a large amount of high-quality data in supervised learning methods. Guided by the initial phase from LeFTP, the phase recovery ability of the lightweight DNN is enhanced to further improve the phase accuracy at a low computational cost compared with existing end-to-end networks. Experimental results demonstrate that PI-FPA enables more accurate and computationally efficient single-shot phase retrieval, exhibiting its excellent generalization to various unseen objects during training. The proposed PI-FPA presents that challenging issues in optical metrology can be potentially overcome through the synergy of physics-priors-based traditional tools and data-driven learning approaches, opening new avenues to achieve fast and accurate single-shot 3D imaging.
optical metrology deep learning physics-informed neural networks fringe analysis phase retrieval 
Opto-Electronic Advances
2024, 7(1): 230034
郭鹏星 1,2游正容 1,2侯维刚 1,2,*郭磊 1,2
作者单位
摘要
1 重庆邮电大学通信与信息工程学院,重庆 400065
2 重庆邮电大学智能通信与网络安全研究院,重庆 400065
提出了一种渐进式训练方案来重新配置马赫-曾德尔干涉仪(MZI)前馈光学神经网络(ONN)的相移,从而对抗MZI的相位误差和分束器误差,提高识别准确率。为了验证所提方案,利用Neuroptica Python仿真平台搭建了3层MZI-ONN结构,并在考虑到MZI相位误差和分束器误差的情况下,利用Iris和MNIST数据集验证了所提方案的有效性。仿真结果表明:在Iris数据集下,对于3层4×4 MZI-ONN结构,所提方案的识别准确率能够提升64.15百分点;在MNIST数据集下,对于4×4、6×6、8×8和16×16规模的MZI-ONN,所提方案的识别准确率能够提升2.00~37.00百分点。所提方案极大地提高了MZI-ONN的抗误差性能,有助于未来大规模、高准确率MZI-ONN的实现。
光计算 马赫-曾德尔干涉仪 光学神经网络 相位误差 分束器误差 渐进式训练 抗误差 
光学学报
2024, 44(7): 0720001
作者单位
摘要
1 西安理工大学 自动化与信息工程学院,西安 710048
2 西安邮电大学 通信与信息工程学院,西安 710061
3 西安工程大学 电子信息学院,西安 710600
紫外光技术在**和民用领域有着广泛的应用,如空间探测、紫外光制导、紫外干扰、电晕放电检测和**通信等领域。文章从紫外光的单次和多次散射出发,介绍了紫外光通信的国内外进展,分析了紫外光通信中的不同链路情况,针对非直视链路紫外通信的脉冲展宽效应和大气湍流影响进行了探讨,总结了紫外光Ad Hoc网络,最后对紫外光通信的发展进行了展望。
Ad Hoc网络 信道建模 脉冲展宽 紫外光通信 Ad Hoc networks channel modeling pulse broadening ultraviolet optical communication 
光通信研究
2024, 50(2): 22008801
作者单位
摘要
1 国网新疆电力有限公司 电力科学研究院,乌鲁木齐 830000
2 北京邮电大学 信息光子学与光通信国家重点实验室,北京 100876
3 国网新疆电力有限公司 电力调度控制中心,乌鲁木齐 830000
【目的】

地震等自然灾害具有持续性和大范围的特性。灾害在发生过程中会持续性损伤光网络的链路资源,造成其链路风险不断变化。面对持续变化的链路风险,业务恢复规划不当可能导致恢复业务再次发生故障。从业务角度来看,重复故障将导致数据传输的多次中断,且随着灾害发生,后续的链路状态损伤加剧可能导致无法恢复此业务。从网络管控方面来看,重复恢复会造成算路资源浪费,占用其他业务的恢复资源。同时,由于业务传输的数据重要性不同,不同业务对传输可靠性的需求存在差异,在发生故障时,高重要度业务应优先恢复。因此,在大规模持续性灾害场景下,综合考虑灾害对链路风险的持续性影响以及不同业务对路径可靠性需求的差异性进行业务恢复是一个值得研究的问题。文章针对此问题提出了一种持续性灾害下基于链路风险感知的业务恢复算法——动态链路风险重路由算法(DLRRA)。

【方法】

首先,针对业务重要度和链路风险,文章建立了业务重要度与链路风险评估模型,并在此基础上提出了优化目标路由可靠度。DLRRA结合优化目标充分考虑了灾害对链路持续性影响造成的链路风险度变化,通过优先为高重要度的故障业务分配低风险的恢复资源,避免了在灾害持续发生过程中同一高重要度业务发生2次故障的风险。

【结果】

仿真结果表明,DLRRA恢复的首次业务较传统算法的2次故障概率降低了11%,且在高负载下的平均重要度提高了10%。

【结论】

因此,该算法有效避免了持续性故障造成的业务多次中断带来的损失,保证了重要业务在灾害环境中的持续稳定运行。

光网络 光纤损伤 链路风险 故障恢复算法 optical networks optical fiber damage link risk fault recovery algorithm 
光通信研究
2024, 50(2): 22006901
作者单位
摘要
沈阳航空航天大学 电子信息工程学院,辽宁沈阳110136
不同于普通图像压缩,多光谱图像压缩除了需要去除空间冗余同时还需要去除光谱间冗余,近年来研究表明端到端的卷积神经网络模型在图像压缩方面具有很好的性能,但对于多光谱图像压缩其编解码器并不能有效解决同时高效提取到多光谱图像空间和光谱间特征的问题,同时也会忽略图像局部特征信息。针对以上问题,本文提出了一种融合多尺度特征卷积神经网络的多光谱图像压缩方法。所提出网络在压缩模型的编解码器中嵌入了可以提取出不同尺度下空间和光谱间特征信息的多尺度特征提取模块,以及可以用来捕捉局部空间信息和光谱信息的空间光谱间非对称卷积模块。实验表明,与传统算法如JPEG2000和3D-SPIHT以及深度学习方法相比,在Landsat-8的7波段和Sentinel-2的8波段数据集上所提出模型的峰值信噪比(PSNR)指标高于传统算法1-2dB。在平均光谱角度(MSA)指标的衡量下,所提出的模型在Landsat-8数据集上优于传统算法约8×10-3 rad,在Sentinel-2数据集上优于传统算法约2×10-3 rad。满足了多光谱图像压缩对空间和光谱间特征提取以及局部特征提取的要求。
空间光谱间特征 非对称卷积 卷积神经网络 多光谱图像压缩 spatial-spectral features asymmetric convolution Convolutional Neural Networks(CNN) multispectral image compression 
光学 精密工程
2024, 32(4): 622
作者单位
摘要
1 西安工业大学 光电工程学院, 陕西西安70032
2 西安交通大学 机械制造系统工程国家重点实验室, 陕西西安710049
为满足点衍射干涉测量对解包算法高精度、高效以及抗干扰的检测需求。提出一种基于空洞空间卷积的相移点衍射干涉图像的相位解包方法,通过将自编码器结构和空洞空间卷积结合获得更高的相位解包精度,实现对包裹相位图像可控的多尺度特征提取。根据点衍射图像特点制作的大量多样化数据集对其进行训练和优化,从而实现准确识别包裹相位所在阶次,最终可以快速处理包裹图像得到高精度的解包结果。利用所提方法对实际点衍射干涉图像进行处理,并与ESDI专业干涉图像处理软件以及其他解包算法处理结果进行比对,结果表明:本文解包结果与软件枝切法解包处理结果均方根误差值为0.022 2 rad,面形拟合结果与软件面形拟合结果峰谷差值仅为0.012 1λ、均方根差值仅为0.004 2λ;时间效率上,完成一幅图像的处理平均仅需0.035 s,而传统方法均大于1 s。与其他方法相比,所提方法在处理包裹相位方面具有快速、高精度的特性,为点衍射干涉图像处理的高精度相位解包提供了新的可行方案。
干涉测量 面形检测 干涉成像 神经网络 相位解包 interferometry surface measurement interference fringe neural networks phase unwrapping 
光学 精密工程
2024, 32(2): 208

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!