1 宁波大学信息科学与工程学院,浙江 宁波 315000
2 浙江万里学院信息与智能工程学院,浙江 宁波 315100
受光学结构的限制,光场相机捕获的图像存在视场较窄的问题。针对该问题,提出了一种基于深度感知的无监督大视场光场内容生成方法。首先,所提方法采用了一种光场子孔径阵列中心绘制方法,结合卷积神经网络来估计光场图像的深度信息,再通过深度信息使光场子孔径图像的中心对齐,从而增强子孔径图像之间的相关性,并有效减少角度冗余;其次,构建了一个单应性估计网络,通过提取多尺度特征金字塔,利用深层特征预测全局单应性,配合浅层特征进行网格级调整,实现精细化的图像配准;然后,设计了一种深度感知的损失函数用于辅助单应性矩阵的估计;最后,通过合成掩模来引导配准后的视图实现自然融合,再利用先前估计的深度信息进行角度复原,生成了最终的大视场光场图像。实验结果表明,所提方法不仅能实现高精度的配准,还能保证拼接后的光场图像的角度一致性。此外,所提方法在自建数据集上的主客观指标均表现出较好的性能。
光场成像 大视场 光场拼接 深度信息 无监督单应性估计 激光与光电子学进展
2025, 62(12): 1211001
红外与激光工程
2025, 54(2): 20240373
东南大学仪器科学与工程学院,江苏 南京 210096
针对传统利用交并比(IOU)进行关联的多目标跟踪方法在目标遮挡下性能不佳以及特征重识别关联在处理外观相似目标时的局限性,提出了一种基于伪深度信息的层级匹配多目标跟踪算法。所提算法采用了立体几何方法获取图像中目标的伪深度信息,根据伪深度的大小,将检测框和轨迹划分为多个不同的子集。当一些目标相互遮挡但其伪深度差异较大时,它们将被分类到不同的伪深度等级中,从而避免了匹配冲突的问题。接下来,利用伪深度信息计算伪深度代价矩阵,在同一伪深度等级下执行交并比伪深度(IOU-D)匹配,以关联处于相同伪深度等级下的被遮挡目标。实验结果显示,所提算法在MOT17测试集和DanceTrack测试集上分别实现了65.1%和58.5%的高阶跟踪准确度(HOTA),与基线模型ByteTrack相比,在两个数据集上分别提升了2.0%和10.8%。该研究结果表明,有效利用图像中潜在的伪深度信息,可显著提升对被遮挡目标的跟踪准确性。
多目标跟踪 目标遮挡 伪深度信息 层级匹配 激光与光电子学进展
2024, 61(18): 1837003
1 深圳大学物理与光电工程学院,广东 深圳 518060
2 福州大学物理与信息工程学院平板显示技术国家地方联合工程实验室,福建 福州 350108
3 南阳利达光电有限公司,河南 南阳 473003
近眼显示光学系统是增强现实(AR)技术的核心基础,是接收虚拟画面信息和融合现实环境进行显示的直接载体。辐辏调节是人眼生理机能的辐辏距离和晶状体聚焦调节距离相匹配的基本生理反应。当前AR近眼显示方案仅提供具有左、右眼视差片源形成的3D显示效果,相对于正常环境的目视观察有极大差距,造成人眼辐辏调节冲突(VAC)。缓解或消除VAC是AR近眼显示系统发展和普及的必由之路,其主要解决方案包括:部分深度信息的光学显示系统,如两焦面或多焦面近眼显示光学方案;完整深度信息的光学方案,如集成成像光场显示技术和计算全息波前重建的近眼显示方案;无深度信息的光学显示方案,如基于Maxwellian显示技术的近眼显示光学系统。本文综述了当前技术发展过程中缓解或消除VAC的近眼显示光学方案,分析了各技术的特点、实现方式,以及优缺点,最后总结了当前AR近眼显示中解决VAC问题面临的挑战,并对未来技术和显示方案的发展前景进行了展望。
近眼显示 增强现实 辐辏调节冲突 增强现实 深度信息 光学学报
2023, 43(23): 2300001
1 西安工业大学机电工程学院,陕西 西安 710021
2 西安工业大学电子信息工程学院,陕西 西安 710021
结合三角测量原理和视觉激光器的优点,针对地形的纹理映射问题,设计一种基于多点式结构光的三维地形纹理映射系统。系统保持激光器与相机相对位置固定,可以同时采集深度信息及纹理信息,经过图像处理等可以生成具有纹理细节信息的三维虚拟地形,提高纹理映射结果的实时性。其中,系统在深度测量时Zw方向的误差可控制在1.3 mm以内,且平台简单,不需要额外相机采集纹理信息,相较于传统的三维测量系统,成本降低,建模效率提高。
三角测量原理 多点式结构光 深度信息 纹理信息 angulation principle multi point structured light depth information texture information
1 吉林交通职业技术学院管理工程学院, 吉林 长春 130012
2 长春理工大学电子信息工程学院, 吉林 长春 130022
针对行人头部易受光照变化和遮挡的影响而导致目标检测准确率较低的问题,提出一种基于多尺度融合的双通道SSD(Single Shot Multibox Detector)行人头部检测算法。首先在SSD网络上增加一条深度通道,将带有深度信息的头部特征与SSD网络的特征进行融合,形成双通道SSD网络;然后在双通道SSD网络的基础上,将具有丰富语义信息的高层特征图与低层特征图进行特征融合,实现更精确的头部定位;最后重新调整SSD的先验框以减少SSD网络的计算量。实验结果表明,在光照和遮挡的情况下,相比于传统SSD目标检测算法,改进后算法的检测精度提高了12.9个百分点,其可有效解决光照变化和遮挡对行人头部检测的影响。
机器视觉 行人头部检测 SSD网络 深度信息 多尺度特征融合 激光与光电子学进展
2021, 58(24): 2415009
1 长春工业大学机电工程学院, 吉林长春 130012
2 中国科学院长春光学精密机械与物理研究所, 吉林长春 130033
基于飞行时间法(Time-of-Flight, TOF)的 3D相机是一种体积小、误差小、抗干扰能力强、可直接输出深度信息的新型立体成像设备。目前, 该类相机已成为测量成像领域的研究热点。本文首先介绍了 TOF相机的发展历程及测量原理;随后对 TOF相机测量误差来源及类型进行分析;接着将 TOF技术与其他主流的三维成像技术进行对比分析;最后对 TOF相机的应用与发展趋势进行了阐述。
飞行时间法 3D-TOF相机 深度信息 测量误差 time-of-flight method 3D -TOF camera depth information measurement error
长春理工大学电子信息工程学院, 吉林 长春 130022
传统方法是建立从光场到显示面的映射计算生成元素图像,但会存在很多冗余映射。针对这一问题,提出沿光路逆向迭代的算法,建立从元素图像显示面到重建光场的单射,使元素图像中的每个像素只对应唯一的光场像素,这可以提高像素的匹配精度,消除深度阶跃处的空洞。所提算法的核心是以元素图像显示面每一点为始点,经过透镜的光心作射线,通过迭代搜索求出射线与光场曲面距离观察者最近的交点,并作为元素图像的匹配点。所提算法的时间复杂度主要受控于元素图像阵列的像素总和,元素图像的计算生成速率是现有算法的8倍以上,图像中的像素总数越大,所提算法的速率优势越明显,且实验结果验证理论推导的正确性。
成像系统 集成成像 微透镜阵列 元素图像 深度信息 光学学报
2020, 40(19): 1911002
为了获取眼科激光手术中规划手术部位的深度空间信息,搭建了双光纤环形器结构的扫频光相干断层成像(SS-OCT)系统。在样品臂中加入二向色镜,将其与互补金属氧化物半导体(CMOS)相机系统进行整合。对OCT坐标系与相机图像坐标系的几何关系进行匹配,设计了多角度线性扫描、环形扫描等模式,实现了相机视频图像下任意指定位置的多模式扫描成像。该成像系统的纵向分辨率为13.68 μm,横向分辨率为29.8 μm,在空气中的成像深度为17.25 mm,测量的最大横向偏差为275 μm,最大纵向偏差为70 μm,能够满足手术的定位要求。该研究初步实现了眼内指定部位深度信息的快速获取,有望应用于眼科疾病诊断和白内障手术导航。
医用光学 眼科激光手术 光相干断层成像系统 定位成像 深度信息
1 黑龙江八一农垦大学电气与信息学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学农学院, 黑龙江 大庆 163319
为高通量地计算农作物株高,克服传统测量方法低效、耗时耗力等不足, 以抗线9号、13号和富豆6号寒地大豆为研究对象,构建了基于Kinect 2.0的大豆冠层图像同步采集平台,并在三维重建大豆冠层结构形态的基础上,提出了基于深度信息的个体和群体大豆株高计算方法。实验结果表明,与实测值相比,计算得到的个体和群体大豆株高的平均误差分别为0.14 cm和0.54 cm,抗线9号、13号和富豆6号株高计算值与实测值之间的决定系数依次为0.9717,0.9730,0.9697。所提方法能够较为精确地计算大豆植株的株高特征。
机器视觉 大豆冠层 深度信息 Kinect 2.0 三维重建 表型参数 株高