无波前传感自适应波前校正系统的图形处理器加速 下载: 1097次
1 引言
在无线光相干通信系统中,当激光信号经过大气信道时,大气湍流将导致光束的抖动、闪烁、光束扩展和像点抖动[1],从而引起混频效率下降。而自适应光学(AO)技术可以对波前畸变进行校正[2],抑制大气湍流的影响。自适应光学校正分为有波前传感校正和无波前传感校正,有波前传感的自适应校正系统易受没有聚焦的散光干扰[3],而无波前传感自适应校正系统结构简单,无需波前测量,不受闪烁效应等因素的影响[4]。
无波前传感的自适应校正系统将CCD相机探测到的畸变光斑中心光强值作为系统性能指标,利用随机并行梯度下降(SPGD)算法生成波前校正器的控制电压向量实现对畸变波前的校正。基于SPGD算法的无波前传感自适应波前校正系统的适应性强,但计算复杂度大,实用性差,很难满足无线光通信系统实时性要求较高的场合。而图形处理器(GPU)的开发周期短,拥有强大的并行计算能力[5],其浮点运算能力十倍甚至百倍于中央处理器(CPU)。随着GPU和通用图形处理机(GPGPU)编程技术的发展,GPU广泛应用于实时数据处理。2011年,Xiao等[6]利用GPU并行运算对机器学习中的随机梯度下降算法实现了速度提升;2012年,Reguera-Salgado等[7]针对推扫式航空影像提出了一种基于GPU的实时几何校正方法;2014年,吴振华等[8]在GPU上采用统一计算设备架构(CUDA)实现了AO系统成像的数值算法;2016年,全吉成等[9]利用GPU并行运算对光学航空影像的正射校正进行加速;2016年,Oyama等[10]提出一种基于GPU多线程运算的小批量随机梯度下降算法的优化方法。以上研究多为成像校正的GPU加速,而国内外对自适应波前校正的GPU加速研究甚少。
本文对随机并行梯度下降算法进行分析,设计出一种并行运算方案,并借助GPU强大的多线程运算能力将并行SPGD算法应用于无波前传感自适应波前校正,提升算法的收敛速度并增强校正系统的高动态补偿能力。通过室内实验和外场相干光学实验验证GPU加速的校正系统的校正能力和加速效果。
2 基本原理
2.1 系统结构
图 1. 无线光相干光通信系统结构图
Fig. 1. Structural diagram of wireless optical coherent communication system
2.2 随机并行梯度下降算法并行处理
随机并行梯度下降算法的主要思想是,利用系统性能指标的变化量δ
式中:
图 2. 无波前传感自适应校正结构图
Fig. 2. Structural diagram of wave-front sensorless adaptive correction
第
式中:正负性能指标分别为δ
2.3 计算复杂度分析
根据(1)式,SPGD算法需要进行
对SPGD算法进行并行化处理后,如
2.4 系统评价指标
选用斯特列尔比(SR)作为无波前传感波前校正系统的评价指标,其定义式为[13]
式中:
3 GPU并行计算加速
3.1 GPU并行计算架构
GPU具备强大的浮点计算能力,虽然没有CPU庞大的控制单元,但拥有大量的执行单元和存储器控制单元而得以获得优良的并行处理性能以及存储带宽[14]。如
3.2 均值滤波GPU加速处理
在无波前传感器自适应波前校正实验中,CCD相机采集图像后,使用均值滤波滤除噪声可以提高定位光斑形心的准确度。均值滤波是一种常见的图像滤波方法,其主要思想是计算邻域平均[16],需要求取像素点周围9点像素的均值。对图像进行均值滤波处理时,单个像素点的处理是相互独立的,可以将每一个像素的处理映射到GPU的每个线程中,从而实现并行化。计算公式为
式中:
3.3 形心算法GPU加速处理
在计算过程中,光斑形心坐标的计算是主要的耗时模块。形心算法是对二值化后的图像求取图像形心,图像二值化后的表达式为[17]
式中:
将二值化图像视为一个矩形区域,左上角设为原点坐标(
式中:
如
图 7. 加速前后形心算法标记示意图。(a)加速前; (b)加速后
Fig. 7. Mark diagrams before and after acceleration by centroid algorithm. (a) Before acceleration; (b) after acceleration
4 实验研究
4.1 室内实验
为了验证GPU对无波前传感自适应光学系统的加速效果,搭建无波前自适应光学实验系统。
图 8. 无波前传感自适应光学实验光路图
Fig. 8. Beam path diagram of wave-front sensorless adaptive optical experiment
在实验中,分别使用经过GPU加速处理的SPGD算法和未经过处理的SPGD算法用于校正系统中。
图 9. 校正前后CCD采集的光斑示意图。(a)校正前; (b)加速前校正效果; (c)加速后校正效果
Fig. 9. Spots by CCD before and after correction. (a) Before correction; (b) correction effect before acceleration; (c) correction effect after acceleration
图 10. 斯特列尔比变化趋势图。(a)强湍流; (b)中湍流; (c)弱湍流
Fig. 10. Variation trend of Strehl ratio. (a) Strong turbulence; (b) middle turbulence; (c) weak turbulence
为了更好地评价加速后的算法,本文使用时间加速比评价加速效果。加速比[9]的公式为
式中:
4.2 相干光实验
为了验证GPU加速的实际效果,将GPU加速的无波前传感校正应用到相干光通信系统中。本次相干光通信系统的接收端和发送端相隔距离为10 km,发送端在白鹿原351乡道附近,接收端在西安理工大学金花校区的教学六楼,具体地理位置如
表 1. 室内实验加速前后的运行时间
Table 1. Running time of indoor experiments before and after acceleration
|
图 13. 校正前后光斑示意图。(a)校正前; (b)校正后
Fig. 13. Spots before and after correction. (a) Before correction; (b) after correction
表 2. 相干光实验加速前后的运行时间
Table 2. Running time of coherent light experiments before and after acceleration
|
5 结论
通过分析SPGD算法的并行性,在CPU+GPU平台上通过多线程运算进行并行化处理,实现了无波前传感自适应波前校正加速。在室内实验中,GPU加速的波前校正系统的斯特列尔比达到了0.8,时间加速比达到了2.5;在相干光通信实验中,斯特列尔比达到了0.8以上,时间加速比达到了8.6。结果表明,在室内实验中,GPU并行加速的校正系统的收敛速度明显提升,具备和加速前校正系统相似的校正效果;在外场实验中,收敛速度的提升可使得校正系统具备更强的实时校正能力,以处理由动态变化的大气湍流引起的波前畸变;同时,所提方案拥有更低的计算复杂度和更高的运算效率,可应用于无波前传感自适应波前校正系统中。
[1] 吴晗玲, 李新阳, 严海星, 等. 大气光通信信道特性及相位补偿技术研究[J]. 光通信技术, 2008, 32(7): 58-61.
[4] 杨慧珍, 蔡冬梅, 陈波, 等. 无波前传感自适应光学技术及其在大气光通信中的应用[J]. 中国激光, 2008, 35(5): 680-684.
[5] 丁祥武, 陈金鑫, 王梅. 异构计算平台上列存储系统的并行连接优化策略[J]. 计算机工程与应用, 2017, 53(5): 73-80.
[6] Xiao FZ, MccreathE, WebersC. Fast on-line statistical learning on a GPGPU[C]//Australasian Symposium on Parallel & Distributed, 2011: 35- 42.
[8] 吴振华, 唐秋艳, 王中杰, 等. 自适应光学数值仿真成像在GPU上的实现[J]. 大气与环境光学学报, 2014, 9(3): 237-243.
[9] 全吉成, 王平, 王宏伟. 计算机图形处理器加速的光学航空影像正射校正[J]. 光学精密工程, 2016, 24(11): 2863-2871.
[10] OyamaY, NomuraA, SatoI, et al. Predicting statistics of asynchronous SGD parameters for a large-scale distributed deep learning system on GPU supercomputers[C]//IEEE International Conference on Big Data, 2016: 66- 75.
[11] 李兴珂, 何云涛. 相干合成中的随机并行梯度下降算法性能研究[J]. 光学学报, 2016, 36(12): 1201001.
[13] 韩立强, 王志斌. 自适应光学校正下空间光通信的光纤耦合效率及斯特列尔比[J]. 红外与激光工程, 2013, 42(1): 125-129.
[14] 杜竹君, 高天欣, 唐晓英. 图形处理器在实时光学相干断层成像中的应用[J]. 激光生物学报, 2017, 26(2): 97-103.
[15] 关宏灿, 李传荣, 周梅, 等. 基于CUDA的三维成像载荷快速融合处理方法研究[J]. 遥感技术与应用, 2017, 32(3): 443-448.
[16] 宋清昆, 马丽, 曹建坤, 等. 基于小波变换和均值滤波的图像去噪[J]. 黑龙江大学自然科学学报, 2016, 33(4): 555-560.
[17] 柯熙政, 雷思琛, 杨沛松. 大气激光通信光束同轴对准检测方法[J]. 中国激光, 2016, 43(6): 0606003.
[18] 韩成, 白宝兴, 杨华民, 等. 自由空间激光通信四象限探测器性能研究[J]. 中国激光, 2009, 36(8): 2030-2034.
Article Outline
柯熙政, 张云峰, 张颖, 雷思琛. 无波前传感自适应波前校正系统的图形处理器加速[J]. 激光与光电子学进展, 2019, 56(7): 070101. Xizheng Ke, Yunfeng Zhang, Ying Zhang, Sichen Lei. GPU Acceleration in Wave-Front Sensorless Adaptive Wave-Front Correction System[J]. Laser & Optoelectronics Progress, 2019, 56(7): 070101.