作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室,上海 201800
2 中国科学院大学,北京 100049
由于尺寸有限、外观和几何线索较少以及缺少大规模小目标数据集,从图像中检测小目标仍然是计算机视觉领域中一个具有挑战性的难题。针对这个问题,提出一种自适应特征增强的目标检测网络(YOLO-AFENet)来改善小目标的检测精度。首先,通过引入特征融合因子,设计改进的自适应双向特征融合模块,充分利用各个尺度的特征图,提高网络的特征表达能力;其次,结合网络自身的特点,提出空间注意力生成模块,通过学习图像中感兴趣区域的位置信息以提高网络的特征定位能力。在UAVDT数据集上实验结果表明:所提YOLO-AFENet的平均精度(AP)比改进前的YOLOv5提高了6.3个百分点,同时也优于其他目标检测网络。
图像处理 目标检测 小目标 多尺度特征融合 空间注意力 UAVDT 
激光与光电子学进展
2023, 60(6): 0610004
宋嘉宇 1,2,3王超懿 1,2刘华巍 1,2李宝清 1,2袁晓兵 1,2,3,*
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室,上海 201800
2 中国科学院大学,北京 100049
3 上海科技大学信息学院,上海 201210
基于麦克风阵列的波达方向估计在野外传感网络的理论研究和工程实践领域有着重要的战略意义,多通道麦克风阵列在进行声源定向时往往因为各个通道存在幅度和相位的不一致而产生定向误差。针对这一问题,提出了一种自适应的麦克风阵列通道不一致校正方法。该方法基于子空间分解原理构造了信号谱空间的目标代价函数,结合模拟退火算法模型,通过对代价函数最小化的方法,求得阵列的校正矩阵。通过计算机使用上述方法对8元麦克风阵列进行仿真模拟,并采用4元麦克风阵列进行实际测试,仿真及实际测试结果验证了该校正方法的可行性。
光信号处理 麦克风阵列 波达方向估计 频谱分析 模拟退火 自适应校正 
激光与光电子学进展
2022, 59(17): 1707001
李翔 1,2王艳 1,2李宝清 1,2
作者单位
摘要
1 中国科学院 上海微系统与信息技术研究所 微系统技术重点实验室, 上海 201800
2 中国科学院大学, 北京 100049
针对野外环境下微声传感器采集的小型轮式车、大型轮式车和履带车3种车辆声信号受风噪影响严重、分类性能较低的问题, 提出了一种长短时记忆网络(LSTM)与多尺度、多层次特征融合卷积神经网络(CNN)相结合的分类算法——野外车辆识别算法(FVNet)。该算法先采用一层LSTM网络提取声信号的时序特征, 充分利用声信号的长时依赖关系; 再用CNN并行提取多尺度特征, 避免网络加深过程中特征的流失; 引入通道注意力机制进行多尺度和多层次特征融合, 增强多尺度、多层次关键特征信息; 最后在相同数据集上进行验证。实验结果表明, FVNet算法对3种车辆的总识别率可达94.95%, 与传统方法相比, 其总识别率提高了14.61%, 取得了较好的分类效果。
车辆声信号分类 长短时记忆网络(LSTM) 卷积神经网络(CNN) 并行多尺度特征提取 通道注意力机制 特征融合 vehicle acoustic signal classification long short-term memory modal(LSTM) convolutional neural network(CNN) parallel multi-scale feature extraction channel attention mechanism feature fusion 
压电与声光
2021, 43(3): 379
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室, 上海 201800
2 中国科学院大学, 北京 100049
针对目前常用的目标检测算法计算复杂度高,在嵌入式平台检测速度低的问题,提出一种适用于嵌入式平台的轻量化目标检测网络(BENet)。首先,该网络在MobileNetv2轻量化网络的基础上加入通道特征交织模块,来设计骨干网络,有效地增强了轻量化骨干网络的特征表达;其次,提出自适应多尺度加权特征融合模块,通过对不同尺度的特征进行权重分配,学习各个尺度特征之间的相关性;最后,尝试引入空间金字塔池化结构来获取不同感受野的上下文信息。在VOC数据集上的实验结果表明:所提BENet在保持较高目标检测精度和检测速度的同时,具有较低的计算复杂度和较小的参数量,更适合应用于嵌入式平台。
图像处理 目标检测 轻量化网络 通道特征交织 特征融合 
激光与光电子学进展
2021, 58(16): 1610023
赵琼 1,2李宝清 1,*李唐薇 1,2
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室, 上海 201800
2 中国科学院大学, 北京 100049
随着深度学习的不断发展与广泛运用,基于深度学习的目标检测算法已成为新的主流。为了进一步提高卷积神经网络YOLO v3(You only look once v3)的检测精度,在原算法的网络结构上添加卷积层模块对样本进行目标背景分类,并粗略调整特征图上的锚框大小。该模块输出目标背景概率后,过滤掉背景概率值低于设定阈值的样本,从而解决原算法中存在的正负样本比例失衡的问题。使用调整过的锚框替代原算法中直接由聚类生成固定大小的锚框,该过程为边界框的预测提供更优的初始值。在VOC数据集上的实验结果表明,相较于原算法,改进的YOLO v3具有更高的检测精度。
机器视觉 目标检测 卷积神经网络 YOLO v3 锚框 
激光与光电子学进展
2020, 57(12): 121502
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室, 上海 201800
2 中国科学院大学, 北京 100049
目标精确感知与识别为信息化战争提供了一个重要的技术增长点,全景视觉传感设备因其拥有大视场(LFOV)范围优势而逐渐被应用于安防及**领域中的目标检测与识别任务。首先从相机成像模型、图像成像质量以及目标物体的非对称性三个方面对存在的困难以及挑战进行阐述。基于是否进行畸变校正预处理,将近年来LFOV域的目标检测与识别算法分为基于畸变校正的目标检测与识别算法和基于原始LFOV图像的目标检测与识别算法两类,并针对这两类算法进行了全面梳理和总结,对当前LFOV域的目标检测与识别各类算法的统一性和差异性进行思考分析,探讨其未来发展趋势。
图像处理 目标检测与识别 大视场图像 畸变校正 
激光与光电子学进展
2020, 57(12): 120002
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室, 上海 201800
2 中国科学院大学, 北京 100049
闭环检测算法可消除视觉同时定位与建图(VSLAM)系统的累计误差,并对构建全局一致性地图有重要作用。针对现有传统闭环检测算法在视角与场景外观变化下准确率与稳健性降低,及部分基于深度学习方法特征提取与闭环识别实时性不佳的问题,设计了一种融合Gist特征与卷积自编码的闭环检测算法,将Gist特征作为卷积自编码网络重构目标,可增强模型在外观变化下的场景特征表达能力;同时通过透视变换构造视角变化训练图像对,以提升模型在视角变化下闭环检测的准确率与稳健性。所设计的模型较精简,可实现实时关键帧特征提取与闭环检测。在Gardens Point与Nordland数据集的实验结果表明,相较于传统视觉词袋模型(BoVW)、Gist算法及现有部分深度学习方法,本文算法可以达到更高的准确率和稳健性。
机器视觉 同时定位与建图 闭环检测 卷积自编码 深度学习 
激光与光电子学进展
2019, 56(18): 181501
作者单位
摘要
1 中国科学院 上海微系统与信息技术研究所 微系统技术重点实验室, 上海 201800
2 中国科学院大学, 北京 100049
由于传统分布式跟踪方法在先验噪声协方差与其实际值不相匹配时跟踪误差较大, 提出了一种采用自适应一致性无迹卡尔曼滤波的分布式目标跟踪方法, 该方法首先执行分布式UKF算法得到对当前移动目标状态的估计值, 然后通过一个系统错误检测机制, 确定是否需要对噪声协方差值进行更新。如需要, 则根据当前获得的测量信息去估计当前噪声协方差, 并联合该估计值和先前的噪声协方差值获得一个新的先验噪声协方差值。最后根据新获得的噪声协方差值对获得的目标状态估计值进行修正。实验结果表明该方法具有较好的准确性和鲁棒性: 在噪声未知环境下, 基于ACUKF的分布式跟踪方法相比于基于容积信息滤波和基于分布式无迹卡尔曼滤波的跟踪方法, 最大跟踪误差值分别减少了49.93%和 51.46%; 在目标过程噪声发生动态变化的情况下, 提出的方法相比于上述两种传统跟踪方法, 跟踪误差值分别减少了40.67%和40.06%。
分布式跟踪 图像传感器网络 自适应滤波 不确定性噪声 非线性估计 distributed tracking camera sensor networks adaptive filter uncertain noise nonlinear estimation 
光学 精密工程
2019, 27(1): 260
作者单位
摘要
1 中国科学院上海微系统与信息技术研究所微系统技术重点实验室, 上海 201800
2 中国科学院大学, 北京 100049
针对现有的卷积神经网络方法所生成的视差图中细节损失严重的问题,提出了在结构上改进的新方法。将原有网络中特征提取部分的4层卷积结构提升到7层,最大化提高了精度;在网络中引入了双金字塔结构,将多尺度降采样信息和特征信息进行了融合,保持了输入图像中的原始细节信息。实验结果表明,改进后网络的错误率从3.029%降到了2.795%,生成的视差图具有更好的连通性。
图像处理 视差获取 深度学习 卷积神经网络 立体匹配 
激光与光电子学进展
2018, 55(12): 121004

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!