北京航空航天大学仪器科学与光电工程学院, 北京 100191
为降低双目立体匹配算法在视差不连续区域和噪声干扰情况下的误匹配率,提出了一种基于改进Census变换和动态规划的立体匹配算法。采用支持区域为十字交叉形状窗口且设有噪声容限的改进Census 变换进行代价计算,提高了单像素匹配代价的可靠性;利用引导图滤波器快速有效地完成代价聚合;在视差选择阶段,设计了一种改进的动态规划算法,消除了扫描线效应,提高了匹配速度和正确率;经过视差后处理得到最终视差图。实验结果表明,该算法在Middlebury测试平台上的平均误匹配率为5.31%,在低纹理区域和视差不连续区域均能得到准确的视差,运算复杂度低且具有较好的稳健性。
机器视觉 立体匹配 Census变换 动态规划 引导图滤波 视差
北京航空航天大学仪器科学与光电工程学院测控与信息技术系, 北京 100191
立体匹配技术是计算机视觉领域的研究热点,由于问题本身的病态性,一直没有得到很好地解决。针对现有局部立体匹配算法精度不高以及易受光照失真影响的问题,提出了一种基于改进梯度匹配代价和自适应窗口的匹配算法。在传统梯度向量仅包含幅度信息的基础上,引入相位信息,并对原始匹配代价进行变换,进一步消除异常值;利用图像结构和色彩信息构建自适应窗口进行代价聚合;提出了一种局部视差直方图的视差精化方法,获得了高精度的视差图。实验结果表明,所提算法在Middlebury 测试平台上平均误匹配误差为6.1%,且对光照失真条件具有较高的稳健性。
机器视觉 立体匹配 梯度匹配代价 自适应窗口 光照失真
北京航空航天大学 仪器科学与光电工程学院 测控与信息技术系, 北京100191
提出了一种基于图像相关性和最优模式概率统计的帧内预测优化算法, 用于降低视频编码的复杂度。首先, 介绍了新一代视频编码标准(HEVC)帧内预测算法中的Angular预测模式、Planar预测模式、LM 预测模式, 以及帧内率失真代价最优化(RDO)计算方法。采用绝对误差和(SAD)作为代价函数处理残差, 初步筛选得到最佳候选预测模式, 然后利用简化率失真代价模型与最有可能预测模式(MPM)判断得到RDO候选预测模式, 利用RDO得到最佳预测模式。最后在HEVC测试模型HM4.0的平台上对改进算法进行验证, 并采用不同分辨率的视频序列进行了仿真实验。实验结果表明: 在峰值信噪比(PSNR)影响可以忽略的情况下(平均降低0.06 dB), 提出的帧内预测优化算法比HM4.0中方法的压缩时间平均减少了30.18%, 码率平均增加了1.97%。与文献<参考文献原文>提出的帧内预测编码方法相比, 其复杂度平均减少了11.45%, 码率平均减少了0.46%, PSNR平均增加了0.01 dB, 压缩性能均有所提高。
视频压缩 帧内预测 视频编码标准 预测模式 率失真代价最优化 video compression intra prediction High Efficiency Video Coding(HEVC) prediction mode Rate Distortion Optimization(RDO)
北京航空航天大学 仪器科学与光电工程学院 测控与信息技术系, 北京 100191
基于具有快速编解码速度的分形编码技术, 提出了新的H.264中P帧预测方法, 用于减少视频压缩编码时间并降低码流输出。首先, 分析了H.264的帧内预测算法、帧间预测算法和P帧预测算法的优缺点, 介绍了本文提出的基于分形编码的新型视频压缩编码方法, 讨论了该方法的优缺点。然后, 结合H.264和分形的优点, 用分形预测的方式对H.264中的P帧进行预测。最后, 给出了在H.264中用分形预测改进P帧编码所产生的分形系数的编码和残差的编码。实验结果表明:与目前国际视频压缩标准H.264的标准测试模型JM15.1相比, 在忽略峰值信噪比的情况下(平均降低0.09 dB), 改进的P帧预测方法的码流和压缩时间分别降低为JM15.1的65%和19%, 并且能够适应各种运动类型的视频序列。研究显示, 改进的P帧预测方法显著提高了H.264的总体编码性能。
视频压缩 视频编码 分形编码 帧间预测 P帧预测 video compression video coding H.264 H.264 fractal coding inter prediction P frame prediction
北京航空航天大学仪器科学与光电工程学院测控与信息技术系, 北京 100191
基于对现有图割算法的研究,设计了基于自适应分水岭算法并使用非参数深度平滑模型来建立图割能量方程的立体匹配方法。提出了新的自适应局部阈值方法,并将其应用于分水岭结合Prim算法的区域融合中。该方法选取相同亮度的像素作为同一个特征矢量形成像素组层,这样两幅或多幅图像的匹配可以在特征区域像素组层来计算,大大减少了数据量。在最小化能量方程时,基于像素组层优化现有的α扩展算法,降低运行时间。通过Middlebury测试平台对算法定量评估得出在所有区域的误匹配率、非遮挡区域以及深度不连续区域的误匹配率都控制在8.5%以内,在Middlebury测试平台135组数据中排名第19位。
机器视觉 自适应分水岭 图割 能量函数 立体匹配
北京航空航天大学 仪器科学与光电工程学院 测控与信息技术系, 北京 100191
设计了基于预搜索的高效双目分形视频编码,并成功应用于立体视频编码之中。对基本分形双目视频编码进行了改进。利用了树状划分准则,起始帧采用块离散余弦变换(DCT)编码,简化了块搜索范围并提前减少了重复运算。在双目立体视频编码中,以左通道为基本层,采用单独的运动补偿预测(MCP)方式进行编码,充分利用了预搜索限制条件、改进的非对称十字形多层次六边形格点搜索算法、去方块环路滤波和分数像素块匹配算法;以右通道为增强层,采用MCP加视差补偿预测(DCP)方式进行编码,选择误差最小的匹配块作为预测结果。在进行DCP编码时,充分利用视差分布约束条件,提出了快速的视差估计算法。实验结果表明,提出的编码方法在保证一定的峰值信噪比(PSNR)前提下,平均压缩时间是基本分形双目视频编码的18%~23%,压缩比提高了15.13~47.49,显著地改善了基本分形视频压缩算法的性能,使分形视频压缩的应用具有更大的灵活性和实用性。
双目分形视频编码 预搜索 运动估计 视差估计 环路滤波 分数像素块匹配 stereo fractal video coding pre-searching motion estimation disparity estimation deblocking loop filter sub-pixel block matching
北京航空航天大学 仪器科学与光电工程学院 测控与信息技术系, 北京 100191
提出了一种基于分形视频编码的快速立体视频编码算法。首先,对传统分形视频编码方法进行了改进:采用基于DCT变换的方式对I帧图像进行编码,同时采用树状划分方法对非I帧图像进行块匹配。在立体视频编码中以左通道为基本层,右通道为增强层;左通道采用单独的运动补偿预测方式(MCP)进行编码,右通道采用MCP加视差补偿预测方式(DCP)进行编码。在进行DCP编码方式时,充分利用立体平行摄像结构中的偏振性和方向性简化DCP搜索方式,由此提出了一种快速搜索算法。实验结果表明,在保证峰值信噪比(PSNR)和压缩比(CR)基本不变的前提下,本文所提出的快速编码算法能够将运算复杂度降低为全搜索算法的0.028~0.029倍,增强了立体视频编码的实用性。
分形编码 立体视频 视差匹配 极线几何 fractal encoding stereo video disparity correspondence epipolar geometry 光学 精密工程
2010, 18(11): 2505
1 北京航空航天大学宇航学院第五研究室, 北京 100083
2 哈尔滨工业大学电气工程与自动化学院自动化测试与控制系, 哈尔滨 150001
利用单目视觉算法确定摄像机相对于被测点的聚焦位置的方法,提出了一种新的能量谱-熵函数图像聚集锋利性测度评价函数以及新的单目视觉测量方法,即将单目视觉方法中的离焦法和聚焦法结合起来,进行聚焦位置的测量。并给出了用于摄像机定位的单目视觉离集法和聚焦法的计算模型。实验验证结果证明了算法的稳定性和可靠性。
单目视觉 离焦法 聚焦法 图像聚焦锋利性测度评价函数 图像处理