无波前传感自适应波前校正系统的图形处理器加速

柯熙政; 张云峰; 张颖; 雷思琛

doi:doi:10.3788/LOP56.070101

激光与光电子学进展, 2019, 56 (7): 070101, 网络出版: 2019-07-30

无波前传感自适应波前校正系统的图形处理器加速下载： 1097次

GPU Acceleration in Wave-Front Sensorless Adaptive Wave-Front Correction System

论文大纲

柯熙政张云峰 ^*张颖雷思琛

作者单位

西安理工大学自动化与信息工程学院, 陕西西安 710048

AI 词云图 AI一句话精读 AI短摘要

注：本部分内容由 AI 自动生成，请您知悉。

摘要

基于随机并行梯度下降(SPGD)算法的无波前传感自适应波前校正系统的收敛速度较慢,很难满足无线光相干通信系统对实时性的要求。介绍了SPGD算法的并行化处理,利用图形处理器(GPU)并行计算提高校正系统的收敛速度。选用CCD相机采集的实时光斑形心的周围400个像素平均灰度值作为系统性能指标;利用GPU多线程运算,对性能指标求解过程和变形镜控制电压向量更新过程进行加速处理。室内实验和外场相干光实验结果表明,斯特列尔比达到了0.8以上,时间加速比最大达到了8.6,GPU加速的波前校正系统在提升收敛速度的同时保证了校正效果。

Abstract

As for the wave-front sensorless adaptive wave-front correction system based on the stochastic parallel gradient descent (SPGD) algorithm, its convergence speed is too slow to satisfy the real-time requirement of a wireless optical coherent communication system. The parallel processing base on the SPGD algorithm is introduced and the graphics processing unit (GPU) parallel computing is used to improve the convergence speed of the correction system. The average gray value of the surrounding 400 pixels centered on the centroid of the real-time spot detected by CCD camera is employed as the value of system performance index. GPU multithreading operation is used to accelerate the solving process of the performance index and the updating process of the deformable mirror control voltage vector. The results from the indoor experiments and the external coherent light experiments show that the Strehl ratio is larger than 0.8 and the maximum time acceleration ratio is up to 8.6. Moreover, the convergence speed of the GPU accelerated wave-front correction system is improved and simultaneously the correction effect is ensured.

1 引言

在无线光相干通信系统中,当激光信号经过大气信道时,大气湍流将导致光束的抖动、闪烁、光束扩展和像点抖动^[1],从而引起混频效率下降。而自适应光学(AO)技术可以对波前畸变进行校正^[2],抑制大气湍流的影响。自适应光学校正分为有波前传感校正和无波前传感校正,有波前传感的自适应校正系统易受没有聚焦的散光干扰^[3],而无波前传感自适应校正系统结构简单,无需波前测量,不受闪烁效应等因素的影响^[4]。

无波前传感的自适应校正系统将CCD相机探测到的畸变光斑中心光强值作为系统性能指标,利用随机并行梯度下降(SPGD)算法生成波前校正器的控制电压向量实现对畸变波前的校正。基于SPGD算法的无波前传感自适应波前校正系统的适应性强,但计算复杂度大,实用性差,很难满足无线光通信系统实时性要求较高的场合。而图形处理器(GPU)的开发周期短,拥有强大的并行计算能力^[5],其浮点运算能力十倍甚至百倍于中央处理器(CPU)。随着GPU和通用图形处理机(GPGPU)编程技术的发展,GPU广泛应用于实时数据处理。2011年,Xiao等^[6]利用GPU并行运算对机器学习中的随机梯度下降算法实现了速度提升;2012年,Reguera-Salgado等^[7]针对推扫式航空影像提出了一种基于GPU的实时几何校正方法;2014年,吴振华等^[8]在GPU上采用统一计算设备架构(CUDA)实现了AO系统成像的数值算法;2016年,全吉成等^[9]利用GPU并行运算对光学航空影像的正射校正进行加速;2016年,Oyama等^[10]提出一种基于GPU多线程运算的小批量随机梯度下降算法的优化方法。以上研究多为成像校正的GPU加速,而国内外对自适应波前校正的GPU加速研究甚少。

本文对随机并行梯度下降算法进行分析,设计出一种并行运算方案,并借助GPU强大的多线程运算能力将并行SPGD算法应用于无波前传感自适应波前校正,提升算法的收敛速度并增强校正系统的高动态补偿能力。通过室内实验和外场相干光学实验验证GPU加速的校正系统的校正能力和加速效果。

2 基本原理

2.1 系统结构

图1为无线光相干通信系统框图,激光器发射的光信号经调制后从发射端发射到信道中;在接收端,无波前传感波前校正系统对接收天线接收到的信号光进行畸变波前校正,再经光纤耦合器耦合进单模光纤,与本振激光器产生的光信号经混频器进行相干混频,再由双平衡探测器探测,解调出基带信号。

图 1. 无线光相干光通信系统结构图

Fig. 1. Structural diagram of wireless optical coherent communication system

下载图片查看所有图片

图2为无波前传感自适应波前校正的结构框图,系统主要由成像探测器(CCD工业相机),变形镜(DM)和波前控制器组成。从图2可看出,光束在传输过程中受大气湍流的影响产生波前畸变;变形镜对畸变光束进行校正后,反射校正过的畸变光束到CCD相机进行光斑采集;波前控制器根据采集的实时光斑获取系统性能指标,再利用SPGD算法迭代生成变形镜的控制信号,实现畸变光束多次校正。在波前控制器模块中使用GPU可以提升光斑处理的速度,进而提高系统的收敛速度。

2.2 随机并行梯度下降算法并行处理

随机并行梯度下降算法的主要思想是,利用系统性能指标的变化量δJ和控制参数的变化量δu进行控制参数的迭代寻优搜索,从而得到性能指标的最优值^[11]。SPGD算法的迭代公式为^[12]

\begin{matrix} u^{(m + 1)} = u^{(m)} + kδ J^{(m)} δ u^{(m)}, (1) \end{matrix}

式中:u⁽^m⁾={u₁,u₂,…,u_N}⁽^m⁾为第m次迭代后N单元校正器的电压向量;δu⁽^m⁾={δu₁,δu₂,…,δu_N}⁽^m⁾为第m次迭代时对应变形镜的各校正单元的随机扰动幅度;δJ⁽^m⁾为性能指标变化量;k为增益系数。(1)式并行计算的内涵是采用并行数据处理的方式,同时更新N个相互独立的电压向量,如图3所示,调用GPU线程对N个电压向量的迭代更新过程并行计算,提高计算效率。

图 2. 无波前传感自适应校正结构图

Fig. 2. Structural diagram of wave-front sensorless adaptive correction

下载图片查看所有图片

图 3. 电压向量并行处理

Fig. 3. Parallel processing of voltage vector

下载图片查看所有图片

第m次性能指标的变化量δJ⁽^m⁾的计算公式为

\begin{matrix} δ J^{(m)} = δ J_{+}^{(m)} - δ J_{-}^{(m)}, (2) \end{matrix}

式中:正负性能指标分别为δ $\begin{matrix} J_{+}^{(m)} \end{matrix}$ =J[u⁽^m⁾+δu⁽^m⁾]和δ $\begin{matrix} J_{-}^{(m)} \end{matrix}$ =J[u⁽^m⁾-δu⁽^m⁾],选用光斑形心周围20 pixel×20 pixel的平均灰度值作为系统性能指标。根据(1)式可知,当增益系数和随机扰动幅度固定时, δJ⁽^m⁾的计算速度越快,系统的收敛速度也越快。并行计算可以调用多个线程同时处理图像的多个像元,加速求取性能指标。

2.3 计算复杂度分析

根据(1)式,SPGD算法需要进行m次迭代计算,每次迭代需要依次更新N个校正单元的控制电压,所以整个算法的执行时间与基本操作重复执行的次数mN成正比,时间复杂度可记作T(m)=O[f(m)]=O(mN),f(m)是T(m)的同数量级函数。

对SPGD算法进行并行化处理后,如图3所示,每次迭代更新N个校正单元控制电压可以采用并行计算的方式同时进行,将N次计算转换为一次计算,时间复杂度可记作T(m)=O[f(m)]=O(m)。随着m的增大,算法执行时间的增长率和f(m)的增长率成正比,所以f(m)越小,算法的时间复杂度越低,算法的效率越高。由于m<mN,所以O(m)<O(mN),可得出对SPGD算法进行并行化处理后,降低了原有算法的计算复杂度,提高了运行效率。

2.4 系统评价指标

选用斯特列尔比(SR)作为无波前传感波前校正系统的评价指标,其定义式为^[13]

\begin{matrix} R_{SR} = I (x_{0}, y_{0}) / I_{0} (x_{0}, y_{0}), (3) \end{matrix}

式中:I(x₀,y₀)为有像差的高斯像面像点对应的最大光强度;I₀(x₀,y₀)为无像差的高斯像面像点对应的最大光强度;SR值的大小反映波前畸变的严重程度,当通过校正,SR值得以增加,表明波前校正发挥了效果。

3 GPU并行计算加速

3.1 GPU并行计算架构

GPU具备强大的浮点计算能力,虽然没有CPU庞大的控制单元,但拥有大量的执行单元和存储器控制单元而得以获得优良的并行处理性能以及存储带宽^[14]。如图4所示,在CUDA编程模型中,分为设备端和主机端,CPU与GPU合作运行,其中CPU主要负责串行代码的执行以及各种事务逻辑的判断执行等,而GPU主要承担可以并行计算密集型的任务^[15]。

图 4. CPU和GPU的协作模式图

Fig. 4. Pattern diagram of cooperative mode between CPU and GPU

下载图片查看所有图片

3.2 均值滤波GPU加速处理

在无波前传感器自适应波前校正实验中,CCD相机采集图像后,使用均值滤波滤除噪声可以提高定位光斑形心的准确度。均值滤波是一种常见的图像滤波方法,其主要思想是计算邻域平均^[16],需要求取像素点周围9点像素的均值。对图像进行均值滤波处理时,单个像素点的处理是相互独立的,可以将每一个像素的处理映射到GPU的每个线程中,从而实现并行化。计算公式为

\begin{matrix} \begin{matrix} FX & [i] [j] = (X [i - 1] [j - 1] + X [i - 1] [j] + \\ X [i - 1] [j + 1] + X [i] [j - 1] + \\ X [i] [j] + X [i] [j + 1] + X [i + 1] [j - 1] + \\ X [i + 1] [j] + X [i + 1] [j + 1]) / 9, (4) \end{matrix} \end{matrix}

式中:i和j分别为像元的横、纵坐标;X为像元的像素值;F为邻域像素的均值。如图5所示,调用GPU线程对每个像素点的环绕像素进行并行处理,将像素映射到二维坐标空间,然后使用(i×图像宽度+j)的方式进行索引,分配线程寻找每个像素单元以及其领域像素,然后求取平均值。

图 5. 调用线程处理像素

Fig. 5. Transfer thread processing pixel

下载图片查看所有图片

3.3 形心算法GPU加速处理

在计算过程中,光斑形心坐标的计算是主要的耗时模块。形心算法是对二值化后的图像求取图像形心,图像二值化后的表达式为^[17]

\begin{matrix} F (x_{i}, y_{i}) = \{\begin{matrix} 1, P_{ij} \geq T \\ 0, P_{ij} < T \end{matrix}, (5) \end{matrix}

式中:T为阈值;P_ij为光斑所在像元的灰度值。

将二值化图像视为一个矩形区域,左上角设为原点坐标(i₀,j₀),右下角设为终点坐标(i_f,j_f),建立二维平面坐标系,形心坐标公式为^[18]

\begin{matrix} \begin{matrix} \bar{x} = \overset{i_{f}}{\sum_{i_{0}}} \overset{j_{f}}{\sum_{j_{0}}} x_{i} F (x_{i}, y_{j}) / \overset{i_{f}}{\sum_{i_{0}}} \overset{j_{f}}{\sum_{j_{0}}} F (x_{i}, y_{j}), (6) \\ \bar{y} = \overset{i_{f}}{\sum_{i_{0}}} \overset{j_{f}}{\sum_{j_{0}}} y_{j} F (x_{i}, y_{j}) / \overset{i_{f}}{\sum_{i_{0}}} \overset{j_{f}}{\sum_{j_{0}}} F (x_{i}, y_{j}), (7) \end{matrix} \end{matrix}

式中: $\begin{matrix} \bar{x} \end{matrix}$ 、 $\begin{matrix} \bar{y} \end{matrix}$ 分别对应形心坐标的行、列值;x_i和y_j分别为对应像素的横、纵坐标。根据(6)式和(7)式,结合GPU并行计算的思想,可视其为二维矩阵并行乘法的形式,假定矩阵乘法为C=A×B,在GPU上,带状划分是矩阵乘法的基本实现过程,矩阵A的x行元素和矩阵B的x列元素由一组线程分别读入,再将各个对应的元素相乘,相乘的结果求和即为矩阵C中对应位置的元素。

如图6所示,在整个GPU内置函数kernel中,要想完成对矩阵C的计算,全局存储器需要对矩阵A进行B_width次读取,对B矩阵进行A_height次读取。每个线程均负责C中一个位置的元素值计算,循环完成A中第x行与B中第x列对应元素的乘加运算。其中,矩阵A可赋值为光斑的纵横坐标,矩阵B可赋值为阈值分割后的光斑二值化公式。

图 6. 并行矩阵运算

Fig. 6. Parallel matrix operation

下载图片查看所有图片

图7所示为GPU加速前后的形心位置对比图,图7(a)为之前的形心算法标记,图7(b)为GPU加速后使用的形心算法标记。对比可知,形心标记位置极为接近,而些许偏差主要由GPU执行单元的计算精度跟CPU的计算精度不同所致。

图 7. 加速前后形心算法标记示意图。(a)加速前; (b)加速后

Fig. 7. Mark diagrams before and after acceleration by centroid algorithm. (a) Before acceleration; (b) after acceleration

下载图片查看所有图片

4 实验研究

4.1 室内实验

为了验证GPU对无波前传感自适应光学系统的加速效果,搭建无波前自适应光学实验系统。图8所示为系统光路图,激光光源A1选择650 nm的激光器,功率为30 mW;将Zernike多项式模拟生成的大气湍流相位屏映射到空间光调制器(SLM)液晶显示屏上,利用空间光调制器A6(型号:RL-SLM-R2)模拟大气湍流,在调制器显示屏反射光束的同时给光束施加像差;使用的GPU型号为NVIDIA GeForce GTX 1050Ti,选用工作频率为50~60 Hz的69单元ALPAO变形镜校正像差。由图8可知,激光器A1发出的平行激光先通过偏振片A2使光束趋向于一个偏振方向,再经过两个透镜A3和A4实现扩束准直,这两个透镜的焦距分别为30 mm和75 mm,然后通过分光棱镜A5分出一束光到空间光调制器A6上,接着光束被空间光调制器反射到反射镜A7上,再经反射镜反射,经过偏振片A8打到分光棱镜A10上,再通过分光棱镜,分出一束垂直打到变形镜A9上,变形镜对畸变光束进行校正,然后反射出残余畸变光束透过分光棱镜传到CCD相机A12的镜头中,CCD相机开始畸变光斑采集。采集到的畸变光斑回传到电脑中,结合GPU加速求取光斑中心强度值,再利用SPGD算法迭代产生变形镜的控制信号对畸变光束进行多次闭环校正。CCD相机旁边的衰减片A11的主要作用是滤除背景光,可根据实验台背景光的影响选择是否添加衰减片。

图 8. 无波前传感自适应光学实验光路图

Fig. 8. Beam path diagram of wave-front sensorless adaptive optical experiment

下载图片查看所有图片

在实验中,分别使用经过GPU加速处理的SPGD算法和未经过处理的SPGD算法用于校正系统中。图9所示为系统经400次闭环迭代校正后的光斑图,其中图9(a)依次为平行光经过空间光调制器模拟弱湍流、中湍流和强湍流下的畸变光斑结果图;图9(b)依次为经过弱湍流、中湍流和强湍流的畸变光斑采用没经过加速的SPGD算法进行校正的结果;图9(c)依次为经过弱湍流、中湍流和强湍流的畸变光斑采用GPU加速的SPGD算法进行校正的结果。对比实验结果可以看出,经过GPU加速后的校正效果未变差,畸变光斑由发散状态转为会聚集中的状态,光斑中心光强值得到增强。

图10为校正系统的斯特列尔比变化趋势图,根据参考文献[ 19],光学系统受波前畸变影响较小的前提是保证SR值至少为0.8^[19]。图10(a)给出了经过强湍流的光束校正后SR值的变化趋势,在校正60 s后,GPU加速的校正系统SR值约为0.8,未加速的校正经过140 s后,SR值达到0.8;图10(b)给出了经过中湍流的光束校正后SR值的变化趋势,在校正不足30 s的情况下,GPU加速的校正系统的SR值达到0.8并维持稳定,而未加速的校正60 s后,SR值达到0.8;图10(c)给出了经过弱湍流下的光束校正后SR值的变化趋势,如要校正系统SR值达到0.8,GPU加速的校正系统用时为30 s,未加速校正系统的用时为70 s。通过图10中SR值的变化趋势可知,经过GPU加速处理的校正系统具备和未加速处理的校正系统相似的校正效果,并且用时更少即可达到校正良好的标准。

图 9. 校正前后CCD采集的光斑示意图。(a)校正前; (b)加速前校正效果; (c)加速后校正效果

Fig. 9. Spots by CCD before and after correction. (a) Before correction; (b) correction effect before acceleration; (c) correction effect after acceleration

下载图片查看所有图片

图 10. 斯特列尔比变化趋势图。(a)强湍流; (b)中湍流; (c)弱湍流

Fig. 10. Variation trend of Strehl ratio. (a) Strong turbulence; (b) middle turbulence; (c) weak turbulence

下载图片查看所有图片

为了更好地评价加速后的算法,本文使用时间加速比评价加速效果。加速比^[9]的公式为

\begin{matrix} S_{P} = T_{0} / T_{P}, (8) \end{matrix}

式中:T_P为GPU加速后的波前校正运行时间;T₀为加速前的波前校正运行时间。

表1为室内实验中不同校正次数对应的校正系统运行时间和加速比,GPU加速处理后的校正系统比之前的校正系统节省了一半以上的运行时间,时间加速比达到了2.5。

4.2 相干光实验

为了验证GPU加速的实际效果,将GPU加速的无波前传感校正应用到相干光通信系统中。本次相干光通信系统的接收端和发送端相隔距离为10 km,发送端在白鹿原351乡道附近,接收端在西安理工大学金花校区的教学六楼,具体地理位置如图11所示。将无波前传感校正应用于接收端,对波长为971 nm的光信号进行波前畸变校正。所使用的GPU型号是NVIDIA Quadro K2000。

表 1. 室内实验加速前后的运行时间

Table 1. Running time of indoor experiments before and after acceleration

Correction times	Time consumption before acceleration /s	Time consumption after GPU acceleration /s	Acceleration ratio
200	77.99	31.07	2.51
300	115.85	46.12	2.51
400	154.31	61.14	2.52

查看所有表

图 11. 实验场地

Fig. 11. Experimental site

下载图片查看所有图片

图12为外场试验中的无波前传感波前校正系统光路图。信号光从光学天线B1到反射镜B3,再反射到变形镜B2,经变形镜校正后,反射到分束镜B4上,分束镜将信号光分成两束,一束分到缩束系统B5上,另一束分到反射镜B6上,再反射进4F缩束系统B7中,缩束系统对光斑起到缩小的作用,以保证进入CCD相机的激光光斑在探测尺寸范围内。光路中的变形镜是ALPAO公司的69单元高速可变形镜,光学天线是西光威信光电的折反式光学天线接收系统。实验中算法的随机扰动步长δu=0.03,增益系数k=1.25/(0.01+J),其中J为系统性能指标。

图13为使用基于GPU的无波前传感校正的光斑示意图,图13(a)为校正前的光斑,图13(b)为校正后的光斑。相较于图13(a),图13(b)的光斑能量更会聚,光束质量得到提升。

图14为GPU加速的波前校正系统斯特列尔比变化趋势图,在校正300次后,斯特列尔比大致保持在0.8以上,因大气湍流的动态变化存在起伏。

表2给出了相干光实验中不同校正次数对应的校正系统运行时间和加速比,经过GPU加速处理后的校正系统时间加速比达到了8.6。

图 12. 无波前传感校正光路图

Fig. 12. Beam path diagram of wave-front sensorless correction

下载图片查看所有图片

图 13. 校正前后光斑示意图。(a)校正前; (b)校正后

Fig. 13. Spots before and after correction. (a) Before correction; (b) after correction

下载图片查看所有图片

图 14. 相干光斯特列尔比的变化趋势图

Fig. 14. Variation trend of coherent light Strehl ratio

下载图片查看所有图片

表 2. 相干光实验加速前后的运行时间

Table 2. Running time of coherent light experiments before and after acceleration

Correction times	Time consumption before acceleration /s	Time consumption after GPU acceleration /s	Acceleration ratio
300	475.12	55.02	8.63
400	660.17	76.32	8.65
500	765.61	88.51	8.65

查看所有表

5 结论

通过分析SPGD算法的并行性,在CPU+GPU平台上通过多线程运算进行并行化处理,实现了无波前传感自适应波前校正加速。在室内实验中,GPU加速的波前校正系统的斯特列尔比达到了0.8,时间加速比达到了2.5;在相干光通信实验中,斯特列尔比达到了0.8以上,时间加速比达到了8.6。结果表明,在室内实验中,GPU并行加速的校正系统的收敛速度明显提升,具备和加速前校正系统相似的校正效果;在外场实验中,收敛速度的提升可使得校正系统具备更强的实时校正能力,以处理由动态变化的大气湍流引起的波前畸变;同时,所提方案拥有更低的计算复杂度和更高的运算效率,可应用于无波前传感自适应波前校正系统中。

参考文献

[1] 吴晗玲, 李新阳, 严海星, 等. 大气光通信信道特性及相位补偿技术研究[J]. 光通信技术, 2008, 32(7): 58-61.

Wu H L, Li X Y, Yan H X, et al. Study of channel characteristics and its phase compensation technology for atmospheric optical communication[J]. Optical Communication Technology, 2008, 32(7): 58-61.

[2] Ellerbroek B L, Rhoadarmer T A. Adaptive wavefront control algorithms for closed loop adaptive optics[J]. Mathematical and Computer Modelling, 2001, 33(1/2/3): 145-158.

[3] Booth M J. Wavefront sensorless adaptive optics for large aberrations[J]. Optics Letters, 2007, 32(1): 5-7.

[4] 杨慧珍, 蔡冬梅, 陈波, 等. 无波前传感自适应光学技术及其在大气光通信中的应用[J]. 中国激光, 2008, 35(5): 680-684.

Yang H Z, Cai D M, Chen B, et al. Analysis of adaptive optics techniques without a wave-front sensor and its application in atmospheric laser communications[J]. Chinese Journal of Lasers, 2008, 35(5): 680-684.

[5] 丁祥武, 陈金鑫, 王梅. 异构计算平台上列存储系统的并行连接优化策略[J]. 计算机工程与应用, 2017, 53(5): 73-80.

Ding X W, Chen J X, Wang M. Optimizing parallel join of column-stores on heterogeneous computing platform[J]. Computer Engineering and Applications, 2017, 53(5): 73-80.

[6] Xiao FZ, MccreathE, WebersC. Fast on-line statistical learning on a GPGPU[C]//Australasian Symposium on Parallel & Distributed, 2011: 35- 42.

[7] Reguera-Salgado J, Calvino-Cancela M, Martin-Herrero J. GPU geocorrection for airborne pushbroom imagers[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(11): 4409-4419.

[8] 吴振华, 唐秋艳, 王中杰, 等. 自适应光学数值仿真成像在GPU上的实现[J]. 大气与环境光学学报, 2014, 9(3): 237-243.

Wu Z H, Tang Q Y, Wang Z J, et al. Numerical simulation of adaptive optical imaging on GPUs[J]. Journal of Atmospheric and Environmental Optics, 2014, 9(3): 237-243.

[9] 全吉成, 王平, 王宏伟. 计算机图形处理器加速的光学航空影像正射校正[J]. 光学精密工程, 2016, 24(11): 2863-2871.

Quan J C, Wang P, Wang H W. Orthorectification of optical aerial images by GPU acceleration[J]. Optics and Precision Engineering, 2016, 24(11): 2863-2871.

[10] OyamaY, NomuraA, SatoI, et al. Predicting statistics of asynchronous SGD parameters for a large-scale distributed deep learning system on GPU supercomputers[C]//IEEE International Conference on Big Data, 2016: 66- 75.

[11] 李兴珂, 何云涛. 相干合成中的随机并行梯度下降算法性能研究[J]. 光学学报, 2016, 36(12): 1201001.

Li X K, He Y T. Performance of stochastic parallel gradient descent algorithm in coherent combination[J]. Acta Optica Sinica, 2016, 36(12): 1201001.

[12] Vorontsov M A, Carhart G W, Cohen M, et al. Adaptive optics based on analog parallel stochastic optimization: analysis and experimental demonstration[J]. Journal of the Optical Society of America A, 2000, 17(8): 1440-1453.

[13] 韩立强, 王志斌. 自适应光学校正下空间光通信的光纤耦合效率及斯特列尔比[J]. 红外与激光工程, 2013, 42(1): 125-129.

Han L Q, Wang Z B. Fiber coupling efficiency and Strehl ratio for space optical communication based on adaptive optics correction[J]. Infrared and Laser Engineering, 2013, 42(1): 125-129.

[14] 杜竹君, 高天欣, 唐晓英. 图形处理器在实时光学相干断层成像中的应用[J]. 激光生物学报, 2017, 26(2): 97-103.

Du Z J, Gao T X, Tang X Y. The usage of graphics processing unit in real-time imaging of optical coherence tomography[J]. Acta Laser Biology Sinica, 2017, 26(2): 97-103.

[15] 关宏灿, 李传荣, 周梅, 等. 基于CUDA的三维成像载荷快速融合处理方法研究[J]. 遥感技术与应用, 2017, 32(3): 443-448.

Guan H C, Li C R, Zhou M, et al. Research on fast fusion of 3D imaging payload based on CUDA[J]. Remote Sensing Technology and Application, 2017, 32(3): 443-448.

[16] 宋清昆, 马丽, 曹建坤, 等. 基于小波变换和均值滤波的图像去噪[J]. 黑龙江大学自然科学学报, 2016, 33(4): 555-560.

Song Q K, Ma L, Cao J K, et al. Image denoising based on wavelet transform and mean filtering[J]. Journal of Natural Science of Heilongjiang University, 2016, 33(4): 555-560.

[17] 柯熙政, 雷思琛, 杨沛松. 大气激光通信光束同轴对准检测方法[J]. 中国激光, 2016, 43(6): 0606003.

Ke X Z, Lei S C, Yang P S. Beam coaxial alignment detection in atmospheric laser communication[J]. Chinese Journal of Lasers, 2016, 43(6): 0606003.

[18] 韩成, 白宝兴, 杨华民, 等. 自由空间激光通信四象限探测器性能研究[J]. 中国激光, 2009, 36(8): 2030-2034.

Han C, Bai B X, Yang H M, et al. Study four-quadrant detector in the free space laser communication[J]. Chinese Journal of Lasers, 2009, 36(8): 2030-2034.

[19] van den Bos A. Aberration and the Strehl ratio[J]. Journal of the Optical Society of America A, 2000, 17(2): 356-358.

柯熙政, 张云峰, 张颖, 雷思琛. 无波前传感自适应波前校正系统的图形处理器加速[J]. 激光与光电子学进展, 2019, 56(7): 070101. Xizheng Ke, Yunfeng Zhang, Ying Zhang, Sichen Lei. GPU Acceleration in Wave-Front Sensorless Adaptive Wave-Front Correction System[J]. Laser & Optoelectronics Progress, 2019, 56(7): 070101.

无波前传感自适应波前校正系统的图形处理器加速 下载： 1097次

1 引言

2 基本原理

2.1 系统结构

图 1. 无线光相干光通信系统结构图

Fig. 1. Structural diagram of wireless optical coherent communication system

2.2 随机并行梯度下降算法并行处理

图 2. 无波前传感自适应校正结构图

Fig. 2. Structural diagram of wave-front sensorless adaptive correction

图 3. 电压向量并行处理

Fig. 3. Parallel processing of voltage vector

2.3 计算复杂度分析

2.4 系统评价指标

3 GPU并行计算加速

3.1 GPU并行计算架构

图 4. CPU和GPU的协作模式图

Fig. 4. Pattern diagram of cooperative mode between CPU and GPU

3.2 均值滤波GPU加速处理

图 5. 调用线程处理像素

Fig. 5. Transfer thread processing pixel

3.3 形心算法GPU加速处理

图 6. 并行矩阵运算

Fig. 6. Parallel matrix operation

图 7. 加速前后形心算法标记示意图。(a)加速前; (b)加速后

Fig. 7. Mark diagrams before and after acceleration by centroid algorithm. (a) Before acceleration; (b) after acceleration

4 实验研究

4.1 室内实验

图 8. 无波前传感自适应光学实验光路图

Fig. 8. Beam path diagram of wave-front sensorless adaptive optical experiment

图 9. 校正前后CCD采集的光斑示意图。(a)校正前; (b)加速前校正效果; (c)加速后校正效果

Fig. 9. Spots by CCD before and after correction. (a) Before correction; (b) correction effect before acceleration; (c) correction effect after acceleration

图 10. 斯特列尔比变化趋势图。(a)强湍流; (b)中湍流; (c)弱湍流

Fig. 10. Variation trend of Strehl ratio. (a) Strong turbulence; (b) middle turbulence; (c) weak turbulence

4.2 相干光实验

表 1. 室内实验加速前后的运行时间

Table 1. Running time of indoor experiments before and after acceleration

图 11. 实验场地

Fig. 11. Experimental site

图 12. 无波前传感校正光路图

Fig. 12. Beam path diagram of wave-front sensorless correction

图 13. 校正前后光斑示意图。(a)校正前; (b)校正后

Fig. 13. Spots before and after correction. (a) Before correction; (b) after correction

图 14. 相干光斯特列尔比的变化趋势图

Fig. 14. Variation trend of coherent light Strehl ratio

表 2. 相干光实验加速前后的运行时间

Table 2. Running time of coherent light experiments before and after acceleration

5 结论

Article Outline

相关论文

相关资讯

关于本站 Cookie 的使用提示

全站搜索

无波前传感自适应波前校正系统的图形处理器加速下载： 1097次