AI高清视频导读  
张荐 1,2,3梁奥 1,2,3花海洋 1,2,*刘天赐 1,2李峙含 1,2,3
作者单位
摘要
1 中国科学院 光电信息处理重点实验室,辽宁沈阳006
2 中国科学院 沈阳自动化研究所,辽宁沈阳110016
3 中国科学院大学,北京100049
针对可见光红外图像的匹配算法中因不同成像体制导致的关键点不对应的问题,提出一种基于策略梯度和伪孪生网络的异源图像匹配算法PCMM-Net。该算法由关键点检测器和描述子提取器两部分组成。首先,引入策略梯度方法对模型的关键点检测器进行优化,将像素转化为归一化概率来过滤低纹理区域,使网络模型学习可靠且可重复的关键点;然后,为了适应可见光和红外图像的辐射差异,采用伪孪生网络来提取局部图像块的相似特征;最后,使用一个融合层,融合相似特征和来自关键点检测器的特征,生成适应异源图像匹配的描述子。在VEDAI近红外数据集和MTV热红外数据集上对提出的算法进行匹配性能验证,实验结果表明所提算法在VEDAI和MTV数据集上的平均匹配准确度分别为97.77%和95.88%,相比于算法DALF,在VEDAI和MTV数据上平均匹配准确度分别提高了2.26%和14%。具有更好的匹配性能。
可见光与红外图像 异源图像匹配 深度学习 卷积神经网络 visible and infrared images multi-source image matching deep learning Convolutional Neural Network(CNN) 
光学 精密工程
2025, 33(6): 945
AI高清视频导读  
作者单位
摘要
北京航空航天大学 人工智能研究院,北京100191
针对现有的基于序列图像的空间目标识别方法难以在特征层级进行融合的问题,提出了将深度卷积网络(CNN)与循环神经网络(RNN)相结合的方法,并对网络模型加以改进。针对单幅图像如何作为序列特征输入的问题,对卷积网络的末端进行修改,将特征图作为序列特征输入;针对序列特征如何映射到目标类别的问题,对长短期记忆网络(LSTM)网络末端进行修改,增加了新的全连接层,得到输出类别。使用0.001~0.006高斯噪声水平训练,以0.007~0.010作为测试集,识别平均准确率(mAP)由90.7%提升至99.16%;训练集与测试集在不同姿态情况下,mAP为94.71%。网络参数量仅为283.0 M。现有的仅在结果层级融合进行识别的问题得到了有效解决。
目标识别 序列图像 空间目标 卷积网络(CNN) 循环神经网络(RNN) object recognition sequence image space target convolutional neural network (CNN) recurrent neural network (RNN) 
上海航天
2025, 42(2): 186
AI高清视频导读  
仲慧 1朱正为 1,2,*
作者单位
摘要
1 西南科技大学信息工程学院,四川 绵阳 621010
2 特殊环境机器人技术四川省重点实验室,四川 绵阳 621010
现有的基于卷积神经网络(convolutional neural network,CNN)的图像超分辨率(super-resolution,SR)重建方法通常在全分辨率或渐进式低分辨率(low-resolution,LR)表示上进行操作。前者可实现空间上精确但上下文信息较弱的超分辨率重建结果,后者可生成语义上可靠但空间上不太精确的输出。针对上述问题,本文提出了一种新的基于跨多分辨率信息流和多重注意力机制 (across-multi-resolution information flow and multiple attention mechanism,AMRMA)的超分辨率重建模型和方法。该方法采用跨多分辨率信息流和信息交互机制实现多尺度特征提取和聚合,利用多重注意力机制捕捉上下文信息以增强图像高频信息,设计一种新的加权损失函数以优化模型参数。在Set5等5个公开数据集上的实验结果表明,与Bicubic、SRCNN、VDSR、RDN和MuRNet 等经典和现有方法相比,本文方法峰值信噪比(peak signal-to-noise ratio,PSNR)和结构相似度(structural similarity,SSIM)分别提升了0.33 dB和0.004 8,具有更好的超分辨率重建效果。
超分辨率重建 卷积神经网络(CNN) 跨多分辨率信息流 多重注意力机制 多尺度特征融合 super-resolution reconstruction convolutional neural network (CNN) across-multi-resolution information flow multiple attention mechanism multi-scale feature fusion 
光电子·激光
2025, 36(4): 391
AI高清视频导读  
卢莹莹 1,2,3孙翔宇 1,2,*计炜梁 1,2邢占强 1,2
作者单位
摘要
1 中国工程物理研究院 电子工程研究所,四川 绵阳 621999
2 中国工程物理研究院 微系统与太赫兹研究中心,四川 成都 610200
3 中国工程物理研究院 研究生院,北京 100088
基于冯·诺伊曼架构的卷积神经网络(CNN)实现方案难以满足高性能与低功耗的要求,本文设计了一种基于“存算一体”架构的卷积神经网络加速器。利用可变电阻式存储器(RRAM)阵列实现“存算一体”架构,采用高效的数据输入管道及硬件处理单元进行大批量图像数据的处理,实现了高性能的数字图像识别。仿真结果表明,该卷积神经网络加速器有着更快的计算能力,其时钟频率可达100 MHz;此外,该结构综合得到的面积为300 742 μm2,为常规设计方法的56.6%。本文设计的加速模块在很大程度上提高了CNN加速器的速率并降低了能耗,仿真结果对高性能神经网络加速器设计有指导意义和参考作用。
存算一体 卷积神经网络(CNN) 加速器 输入管道 处理单元 computing in memory Convolutional Neural Network (CNN) accelerator input pipeline processing unit 
太赫兹科学与电子信息学报
2025, 23(2): 170
AI高清视频导读  
作者单位
摘要
1 大连民族大学 计算机科学与工程学院,辽宁 大连 116600
2 大连理工大学 电子信息与电气工程学部,辽宁 大连 116024
针对既有深度学习方法在乳腺癌病理图像全局与局部特征统一表达上的不足,将长距离建模的Transformer和强局部感知的卷积神经网络(convolutional neural network, CNN)相结合,提出一种多层级深度特征融合的乳腺癌病理图像分类方法。该方法以双分支并行的Deit-B和ResNet-18模型作为骨干架构,在双分支网络中间层和末端位置分别引入特征融合操作,有效加强了乳腺癌病理图像全局与局部深度特征的联合学习;此外,在CNN支流的残差模块间引入密集连接操作来提升中间层融合特征的信息传递。通过全局-局部特征提取与支流间-支流内特征交互,可更有效捕获用于乳腺癌病理图像分类的判别特征。在乳腺癌病理图像公共数据集BreakHis上的消融实验与对比实验结果证明所提出方法的有效性,此外可获得99.83%的最优分类结果。
病理图像分类 乳腺癌 卷积神经网络(CNN) 特征融合 histopathology image classification breast cancer convolutional neural network (CNN) Transformer Transformer feature fusion 
光电子·激光
2025, 36(2): 185
AI高清视频导读  
作者单位
摘要
西北工业大学,陕西西安710129
针对高光谱图像(Hyperspectral Images, HSI)地面覆盖类的像素级分类问题,提出一种3D-ConvFormer的混合结构模型,该模型通过在浅层使用三维卷积(3D-CNN)操作提取高光谱图像的局部空间光谱特征,在深层利用自注意力(Slef-attention)机制在卷积窗口内提取空间光谱特征,实现了卷积网络的平移不变性与self-attention对特征的灵活提取能力的有效融合。在Indian Pines,PaviaU和WHU Hi Longkou 3组公开的高光谱图像数据集上进行实验,采用总体分类精度(OA)、平均分类精度(AA)和Kappa系数3个指标,对地物类别的像素级分类结果进行量化评估。实验结果表明,模型在Indian Pines数据集上OA为98.41%,AA为97.56%,Kappa为98.16%;在PaviaU数据集上OA为99.39%,AA为99.30%,Kappa为99.18%;在WHU-Hi-Longkou数据集上OA为98.53%,AA为98.97%,Kappa为98.06%。模型在3组高光谱图像分类任务中展示出的性能均优于对比的模型方法,取得了良好的分类性能,有效提升高光谱图像的分类精度。
计算机视觉 高光谱图像 卷积神经网络 视频转换 自注意力机制 computer vision hyperspectral image 3D Convolutional Neural Network(CNN) vision transformer self-attention 
光学 精密工程
2024, 32(23): 3504
AI高清视频导读  
作者单位
摘要
1 国网安徽省电力有限公司,安徽 合肥 230061
2 国家电网有限公司,北京 100032
3 国家电网有限公司大数据中心,北京 100032
4 北京国网信通埃森哲信息技术有限公司,北京 100053
针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词的概念;为提高语义分析的质量,设计了改进LDA算法的电力用户咨询文本分类算法执行流程。实验表明,所提模型表现出优异性能,平均精确度和平均召回率为90.91%和85.03%。所提模型可充分发挥多模型集成优势,有效提升模型性能。
电力咨询 文本分类 主题分析 卷积神经网络 潜在狄利克雷分配 power consulting text classification theme analysis Convolutional Neural Network (CNN) Latent Dirichlet Allocation 
太赫兹科学与电子信息学报
2024, 22(12): 1400
AI高清视频导读  
吴龙 1朱昊伟 1杨旭 1徐璐 1[ ... ]张勇 3
作者单位
摘要
1 浙江理工大学 计算机与技术学院,浙江 杭州 310018
2 浙江理工大学 科技与艺术学院,浙江 绍兴 312369
3 哈尔滨工业大学 光学目标仿真与测试技术研究所,黑龙江 哈尔滨 150001
自动驾驶汽车和移动机器人均依靠激光雷达等传感器技术的快速发展而进入实际应用过程,但是激光雷达在云雾环境下测距精度和探测范围差,限制了其全天候的应用。本文根据激光在雾中的传播和后向散射模型,建立了雾中目标回波信号的模型,同时提出了一种基于卷积神经网络(convolutional neural network,CNN)的联合注意力机制网络(combined attention mechanism network,CAMN),用于实现雾中目标回波信号的检测。仿真和实验结果表明,CAMN网络可以有效消除雾气对脉冲激光信号检测的干扰。在30%的散射率下,在10 m范围内检测的绝对误差平均值达到3.13 cm。激光雷达系统探测范围可以达到42 m,是其他方法探测范围的两三倍。该方法能有效提高雾天激光雷达测距精度和探测范围,为激光雷达的实际应用奠定基础。
激光雷达 卷积神经网络(CNN) 光信号处理 雾中检测 联合注意力机制网络(CAMN) lidar convolutional neural network (CNN) optical signal processing detection in fog combined attention mechanism network (CAMN) 
光电子·激光
2024, 35(11): 1155
AI高清视频导读  
作者单位
摘要
华东交通大学 信息工程学院,江西 南昌 330013
针对基于卷积神经网络(convolutional neural network,CNN)的图像超分辨重建(super-resolution,SR)模型存在特征提取不充分、网络太深导致的参数量大以及冗余信息对网络最终重建性能影响等问题,设计了一种轻量级密集连接图像超分辨网络(lightweight densely connected image super-resolution network,LDCN)。该网络设计了多尺度迭代特征提取模块(multi-scale iterative feature extraction module,MIFEM),实现在较低参数的情况下充分提取多尺度特征;根据残差收缩思想构建的关键信息提取模块(key information extraction module,KIEM),相较原始模块可以去除更多的冗余信息,使网络充分关注到关键信息且模块整体参数下降72%;最后,在密集残差网络中引入特征传输模块(feature transfer module,FTM),进一步降低模型复杂度,解决了模型层数深、参数大的问题。实验结果表明,LDCN在重建性能和视觉观感上均优于主流模型。4个测试集上,与轻量化模型MADNet相比,PSNR分别提升0.1 dB、0.11 dB、0.06 dB、0.26 dB,参数量仅为MADNet的47.6%。
图像超分辨率 卷积神经网络(CNN) 多尺度特征提取 残差收缩网络 冗余信息 密集残差连接 image super-resolution convolutional neural network (CNN) multi-scale feature extraction residual shrinkage network redundant information dense residual connection 
光电子·激光
2024, 35(11): 1145
AI高清视频导读  
作者单位
摘要
1 西安邮电大学 电子工程学院,陕西 西安 710121
2 西安邮电大学 通信与信息工程学院,陕西 西安 710121
随着通信系统向高速率、超带宽不断发展,适应这种发展的高性能拉曼放大器的设计逐渐成为研究重点。然而,由于输出拉曼增益、噪声和泵浦参数之间复杂的非线性关系,设计高性能的拉曼放大器具有挑战性。传统的数值优化方法在解决这个问题上效率不佳。为了解决这个问题,本文提出了一个使用卷积神经网络(convolutional neural network,CNN)和长短期记忆网络(long-short term memory,LSTM)的二阶拉曼光纤放大器(Raman fiber amplifier,RFA)增益和噪声预测模型。研究了不同预测模型性能对设计拉曼光纤放大器的影响,并利用海马算法优化模型,以准确反映泵浦参数、光纤长度和目标增益和噪声分布之间的映射关系。实验结果表明,本文提出的模型在增益和噪声预测方面的均方根误差分别只有0.043 1和0.022 4 dB,预测值和目标值之间的误差小于0.25 dB,平均耗时小于0.133 7 s。该设计方案为未来RFA的快速设计提供了方法和思路。
二阶拉曼光纤放大器(RFA) 卷积神经网络(CNN) 长短期记忆网络(LSTM) 海马优化(SHO)算法 拉曼增益 second-order Raman fiber amplifier (RFA) convolutional neural network (CNN) long-short term memory (LSTM) sea horse optimizer (SHO) algorithm Raman gain 
光电子·激光
2024, 35(10): 1009

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!