基于并行计算优化的WindSTORM PLUS算法

肖文; 吴天琦; 李仁剑; 唐黎; 陈玲玲

doi:doi:10.3788/CJL202047.0607001

中国激光, 2020, 47 (6): 0607001, 网络出版: 2020-06-03

基于并行计算优化的WindSTORM PLUS算法下载： 1034次

WindSTORM PLUS Algorithm with Parallel Computing Optimization

论文大纲

肖文 ^1,2吴天琦 ^1,2李仁剑 ^1,2唐黎 ^1,2,*陈玲玲 ^1,2

作者单位

¹ 深圳大学物理与光电工程学院,光电子器件与系统广东省/教育部重点实验室, 广东深圳 518060

² 深圳技术大学健康与环境工程学院, 广东深圳 518118

AI 词云图 AI一句话精读 AI短摘要

注：本部分内容由 AI 自动生成，请您知悉。

摘要

随机光学重建显微镜(STORM)关键技术包括大量随机闪烁图像的数据定位与重建算法,而现有的常用开源算法在大数据量情况下存在用时过长或内存受限等限制,影响了STORM技术的进一步推广应用。基于MATLAB和并行计算的方法构建了WindSTORM PLUS开源算法,采用该算法进行单分子定位数据处理。在模拟数据集下,对比WindSTORM和ThunderSTORM,WindSTORM PLUS算法的处理速度提高了1000%,且对比WindSTORM,内存需求降低了60%。此外,搭建了easySTORM系统,在实验数据的处理耗时对比中,WindSTORM PLUS只有WindSTORM和Gauss-WLS的9%,验证了其在超大数据集下处理速度的优越性。WindSTORM PLUS开源算法为超分辨图像处理提供了一个新的高速处理方案。

Abstract

The major stochastic optical reconstruction microscope (STORM) techniques include data localization and reconstruction algorithms with respect to a large number of images. However, the existing open source algorithms are limited by their slow speed or computer memory when processing an ultralarge dataset, restricting the extensive application of STORM techniques. Therefore, we propose WindSTORM PLUS for performing single-molecule localization data processing using MATLAB and parallel computation. The outcomes obtained using the simulated large datasets demonstrate that the data processing speed of WindSTORM PLUS is greater than those of the existing WindSTORM and ThunderSTORM by 1000%. Furthermore, the memory requirements are reduced by 60% compared with those in case of WindSTORM. In addition, we establish an easySTORM system and conduct a test using some samples to verify the superiority of our algorithm. The time-consuming of WindSTORM PLUS is only 9% of WindSTORM and Gauss-WLS. We believe that this open source algorithm can provide a novel high-speed STORM data processing approach.

1 引言

超分辨显微成像技术具有突破光学衍射极限的特性,可对细胞内的超精细结构进行清晰成像,已成为生命科学领域强有力的研究手段之一^[1-4]。光学重建显微镜(STORM)^[5]作为一种单分子定位显微成像技术,相对于其他超分辨显微成像(如受激发射损耗显微镜成像等^[6-7]),具有成像系统结构复杂度低、分辨率高等优点。随着直接随机光学重建显微镜(dSTORM)^[8]的出现,荧光分子的闪烁条件被进一步降低,STORM被进一步推广应用。STORM成像效果不仅受限于荧光分子的闪烁条件,也与定位重建和数据处理的方法息息相关^[9]。随着科研级互补金属氧化物半导体(sCMOS)等传感器在超分辨显微成像领域的逐渐应用^[10-11],STORM也面临着大视场下大数据集高速处理的挑战。

自STORM技术于2006年被提出以来,单分子定位重建的每一个步骤都涌现出了各类预处理及拟合方法,如空间滤波和小波滤波等滤波算法^[12-13]、局部最大值和非极大值抑制等分子检测算法^[14]、迭代高斯拟合和非迭代的压缩感知等定位点拟合算法^[13,15];而且这些算法集成在了不同的单分子定位处理软件中,如FALCON、DAOSTORM和Peak Fit等^[16-19]。Ovesny等^[20]在2014年发表的开源ThunderSTORM软件中集成了多种滤波及定位算法,使得该软件在STORM领域得到广泛应用。2018年,Martens等^[21]提出的Phasor法使单分子单拟合速度达到MHz级别,并将其补充进了ThunderSTORM软件中。2015年和2019年,洛桑联邦理工学院的生物医学成像小组^[22-23]对已有的30多款单分子定位软件进行了对比,分析了它们在不同条件下的定位准确性,为超分辨定位的数据处理提供了参考,但此对比集中在小视场数据集下(例如128×128)。2019年,Ma等^[24]基于频域卷积滤波及梯度定位的思想,提出了非迭代计算的WindSTORM,其在数据处理速度上相比于传统的迭代算法提高了2~3个数量级,尤其适合用于复杂噪声下的超分辨图像处理;但目前该算法只适用于固定数据尺寸(例如2^N)的数据,且对计算机的内存要求较高,例如,内存为256 GB的计算机单次最大数据处理能力约为8 GB。

为了解决上述算法存在的不足,并迎合大视场范围下的超大数据集处理,本文构建了WindSTORM PLUS算法;该算法可对数据集实现智能分组以及计算模式的选择,并因采用并行加速计算而大幅提升了重建速度。本文在高低密度和各尺寸的模拟数据集下进行了验证实验,实验结果表明,在512×512和1024×1024大尺寸成像范围的超大数据集(例如,5~20 GB)下,相比WindSTORM和ThunderSTORM中的最小二乘法高斯拟合(Gauss-WLS),WindSTORM PLUS将定位速度提高了1000%;相比Phasor,WindSTORM PLUS将定位速度提高了50%。此外,本文基于easySTORM^[25]方法搭建了STORM成像系统并进行了实验,实验结果表明,WindSTORM PLUS的耗时只有WindSTORM和Gauss-WLS的9%,Phasor拟合方法的70%左右,表明了所提算法在STORM数据处理速度上的优越性。本文构建的WindSTORM PLUS开源算法为单分子定位的超分辨图像提供了一个全新的高速处理方案,特别适合用于大成像视场下采集的超大数据集重组。

2 WindSTORM PLUS算法与模拟验证

2.1 WindSTORM算法

WindSTORM是一套用于二维STORM超分辨数据处理的算法^[24],该算法的流程主要分为四部分:1)基于时间极小值和荧光衰减因子进行背景的估计与去除;2)结合频域与光学传递函数的去卷积频率滤波,恢复重叠区域的环绕发射点;3)根据重叠区域环绕发射点确定重叠区域中心发射点并对重叠区域的感兴趣区域(ROI)进行提取;4)在点扩展函数(PSF)梯度方向实施定位的非迭代单分子定位算法^[26]。目前,WindSTORM提供了两种方式进行超分辨数据处理,一种是基于MATLAB只采用中央处理器(CPU)进行数据处理,另一种是采用图形处理器(GPU)对CUDA(compute unified device architecture)编译后的可执行文件进行数据处理^[23]。但目前的GPU版本只能处理raw格式的数据,而普通科研级相机(例如Photometrics的Andor)均不能直接导出该格式,需花费大量额外的时间进行格式转换。而且,采用英伟达GeForce GT 730、Quadro M4000、Quadro K2000和Quadro P5000这四种显卡对WindSTORM(GPU)进行测试后发现,其在Quadro P5000下无法运行,在GeForce GT 730、Quadro M4000和Quadro K2000下得到的结果与在WindSTORM(CPU)下得到的结果存在较大差异,不具有广泛的稳定适用性。所以,本文使用WindSTORM(CPU)进行算法的对比以及并行优化。

2.2 并行架构

GPU特殊的硬件结构设计使其可以同时运行数千个并发结构线程,因此多被用于数据并行和计算密集的算法中,其处理架构如图1(a)展示。在单分子定位重建算法领域,GPU的并行加速目前已被用在最大似然估计(MLE)的高斯拟合等算法中^[13]。MATLAB提供的并行计算工具箱(PCT)可利用并行循环、特殊数组类型和并行化矩阵函数等高级结构对程序进行并行优化。PCT用于多核CPU的工作原理如图1(b)所示,包含多个MATLAB计算引擎(MATLAB worker)的并行计算池,将数据或任务分解后进行并行处理。对于并行计算,需要根据实际数据选择设计任务并行或数据并行的结构,并需要考虑数据串扰。值得注意的是,只有满足并行执行数量多、全局内存访问次数少、逻辑运算少和数值计算强度高等特点的算法才能充分利用GPU的性能。

图 1. 架构示意图。(a) GPU架构;(b) MATLAB CPU并行架构

Fig. 1. Schematics of architecture. (a) GPU architecture; (b) MATLAB CPU parallel architecture

下载图片查看所有图片

2.3 WindSTORM PLUS设计

针对WindSTORM算法的特点,本文将数据处理任务分解为数据预处理、流程控制(根据尺寸选择对应的并行加速方式)、并行计算(背景去除、去卷积频率滤波、梯度方向拟合定位)以及数据后处理等步骤。本文将WindSTORM PLUS设计成如图2所示的CPU结合GPU的混合编程模式,并将其结构分成串行计算和并行计算两部分。

图 2. WindSTORM PLUS程序设计流程图

Fig. 2. Flow chart of WindSTORM PLUS program design

下载图片查看所有图片

串行计算部分主要包括数据预处理、流程控制及数据后处理。在数据的预处理中,本文引入开源显微镜环境(OMERO)工具bfmatlab^[27],用它替代MATALB图像处理工具箱提供的图像读取函数,这样就可以解决MATALB无法一次性读取4 GB内存以上的图像堆栈的问题。然后,对图像尺寸进行补零调整,以匹配滤波去卷积过程中的截止频率,使WindSTORM PLUS能够处理任意尺寸的数据集。在串行计算的流程控制上,对数据集的并行处理方式是读入后智能选择。在背景去除、去卷积频率滤波和梯度方向拟合定位步骤中,分别采用CPU和GPU对不同尺寸数据集的运行速度进行测试,结果发现:去卷积运算中使用的快速傅里叶变换(FFT)及反变换在处理小尺寸数据集时,CPU的计算速度比GPU更快;在处理大尺寸数据以及其余两个步骤时,GPU的计算速度更快。这是因为在CPU下,FFT的计算时间复杂度为Nlog₂N(N为计算点数),CPU下的FFT运算时间随尺寸呈对数增长;而GPU运算的底层使用的是CUDA的cuFFT运算库,其计算时间随尺寸的变化相对平稳。基于此计算分析,本文综合各数据集所有步骤的运行速度,采用读入后智能选择的方式对数据集进行处理,对图像长、宽小于256的小尺寸数据集只使用CPU进行并行计算,对大尺寸数据集择则选择CPU与GPU混合并行计算的模式。在数据后处理中对并行计算结果进行元胞数组数据结构的调整与合并,确保定位点顺序与实际一致,以保证进一步漂移校正等后处理结果的正确性。

并行计算部分主要是算法的计算过程。如图2中的并行计算结构部分所示,WindSTORM PLUS在多核CPU上的并行逻辑是利用并行循环结构,将分块后的子堆栈图像分配给多个MATLAB计算引擎并行执行计算,开启的并行池所包含的MATLAB计算引擎数与CPU的核心数相同。其中,针对运行在CPU上的ROI提取步骤中存在的多层循环,对循环修改为向量化结构后计算速度更快的部分进行了结构调整,将该算法中大量的三维矩阵索引问题优化为线性索引,缩短了该步骤的计算用时。对于大数据集下需要用到GPU的步骤,同样保持并行池的每一个计算引擎与GPU进行独立交互,将GPU的CUDA多核心的计算能力最大化。针对GPU的特性,对GPU上运行的算法分别进行了以下优化:1)对于背景估计算法,利用向量化减少GPU中的循环迭代,其中衰减因子的融合利用逐元素句柄操作完成;2)对于去卷积算法,除保证在GPU上为单精度浮点数计算和向量化替代循环外,将部分复数运算调整为实数运算(这不会影响结果);对非中间运算变量进行提取,以减少原算法的重复计算;3)针对梯度拟合部分,修正了少数定位点数下的错误计算。针对并行计算的全部过程,小尺寸数据集所有的计算都只在并行计算池的MATALB worker中进行计算。而对于大尺寸数据集,首先在并行计算池的每一个MATLAB worker中对分割的子数据集进行GPU数据转换和传递;然后在GPU上执行背景估计和滤波去卷积,并将滤波后的图像传递回各自的CPU线程,进行峰值查找和ROI提取;最终在GPU上进行单分子点的梯度拟合。

2.4 模拟验证

模拟数据的获取由ImageJ插件ThunderSTORM中的模拟数据生成(generator of simulated data)实现,分别在低密度0.2 emitter/μm^-2和高密度1 emitter/μm^-2下随机产生成像视野为128×128、256×256、512×512、1024×1024的10000张堆栈数据集,每个图像尺寸下获取5组数据。其余条件均保持一致性,相机模型像素对应物面大小为108 nm,增益值为0.67,基准背景为120,量子效率为95%,电子读取噪声为1.3,发射器模型为高斯模型,半峰全宽(FWHM)为200~350 nm,强度为700~2000,背景平均噪声为50。

本文所有对比结果的数据处理都在惠普Z840工作站上进行,其CPU为Intel(R)-Xeon(R)E5-2643v4,256 GB内存,GPU为NVIDIA Quardra P5000。程序运行环境为MATLAB 2018b。分别选用ThunderSTORM的最小二乘法的高斯拟合(Gauss-WLS)和向量法(Phasor)以及WindSTORM、WindSTORM PLUS进行对比,每秒钟的定位点结果如图3所示。在低密度下,WindSTORM PLUS在小尺寸视野范围数据集下的数据处理速度与Gauss-WLS基本持平,相较于WindSTORM提高了4倍左右;在大尺寸视野范围数据集下的数据处理速度约是Phasor的1.5倍,相较于WindSTORM提高了10倍左右。在高密度下,WindSTORM PLUS在小尺寸视野范围数据集下的数据处理速度约为Gauss-WLS的5倍;在大尺寸视野范围数据集下的数据处理速度是Phasor的1.5倍,是Gauss-WLS的9倍,相较于WindSTORM提高了10倍左右。综合对比后发现,WindSTORM PLUS的数据处理速度明显提升,尤其是在超大数据集下,计算优势更明显。

图 3. 模拟数据集下不同算法的处理速度对比。(a)低密度模拟数据集;(b)高密度模拟数据集

Fig. 3. Comparison of processing speed of different algorithms using simulated data sets. (a) Data set with low density; (b) data set with high density

下载图片查看所有图片

本文选用F₁分数(F₁ score)^[28]对上述不同方法下处理模拟数据的准确度进行评价。F₁分数是用来评估模型准确度的一个参数,同时兼顾了召回率与准确率。其计算公式为

\begin{matrix} F_{1} = 2 \times \frac{P \times R}{P + R}, (1) \end{matrix}

式中:P为精确率,P= $\begin{matrix} \frac{T_{L}}{T_{L} + F_{L}} \end{matrix}$ ;R为召回率,R= $\begin{matrix} \frac{T_{L}}{S_{L}} \end{matrix}$ ;T_L为正确的定位点数;F_L为错误的定位点数;S_L为仿真得到的定位点数。

由表1可知,WindSTORM PLUS与ThunderSTORM(Gauss-WLS)的重组准确度相当,且都远高于ThunderSTORM(Phasor),尤其是在低密度情况下。ThunderSTORM(Gauss-WLS)迭代拟合算法在低密度下比较准确,但密度高时会受临近点强度的影响,准确度下降;ThunderSTORM(Phasor)在高密度下相比低密度下的分数有所上升,这可能是由于它会对定位点进行额外补充;WindSTORM PLUS在高低密度下的准确性几乎一致,体现了该算法的稳定性。

表 1. 模拟数据集下不同算法的准确度评估(F₁分数)

Table 1. Accuracy evaluation (F₁ score) of different algorithms using simulated data sets%

Data set	ThunderSTORM(Phasor)	ThunderSTORM(Gauss-WLS)	WindSTORM PLUS(and WindSTORM)
Low density (0.2 emitter/μm²)	62.6	97.1	94.7
High density (1 emitter/μm²)	81.4	92.9	94.3

查看所有表

为进一步比较,在高密度下选取128×128×10000的数据集,对常用STORM算法FALCON、Peak Fit和ThunderSTORM中的最大似然估计(MLE)的高斯拟合进行了测试。FALCON每秒钟定位点数为22左右,ThunderSTORM(Gauss-MLE)每秒钟定位点数为129左右,Peak Fit每秒钟定位点数为110左右。FALCON、Peak Fit和ThunderSTORM(Gauss-MLE)这三种算法的处理速度较慢,所以并未作进一步对比。

综合图3与表1可以发现,WindSTORM PLUS在数据处理速度和处理效果上存在优势。其在数据处理上的速度优势源于其所采取的非迭代算法以及并行软件结构及硬件的使用这两方面。它对不同的数据规模采取不同的并行加速方式,在小数据集上依靠MATLAB并行池充分利用多核CPU的能力,使其基本达到了CPU核心数减一的加速比;在大数据集下,它通过引入GPU大幅缩减傅里叶变换运算的时间,进而减少反卷积的运算时间。在数据处理效果上的优势主要来源于背景估计算法和反卷积算法进行的重叠发射器分割这两方面。对呈泊松分布的背景荧光噪声信号进行分析拟合,然后利用时间极小值进行背景估计,并引入实际采集过程中的荧光衰减因子进行校正,更好地去除了自发荧光和结构性信号造成的干扰;反卷积基于光学系统传递函数的高斯模型对去除背景噪声的图像进行频域滤波,分离出荧光分子重叠区域的环绕闪烁点,减少了临近发射点对定位拟合算法的干扰。

3 系统及结果分析

3.1 dSTORM成像系统

本文基于easySTORM^[24]搭建的STORM成像系统如图4所示。该dSTORM系统的激发光由405 nm(Lasertack,LDM-405-350-C)、462 nm(Lasertack, LDM-462-1400-C)、638 nm(Laser-tack,LDM-638-700-C)波长的激光组成。激发光通过透镜(Thorlabs,AC254-100-A)耦合进多模光纤(Thorlabs,FG105UGA,0.22NA),最后光纤出射光被耦合进IX73倒置荧光显微镜照明光路。采用开源显微镜软件Micro-manager配置激光驱动板和相机,将激光功率控制与数据采集进行集成。激光散斑带来的非均匀照明由安装在光纤上的高频振动器进行时间上的平均,以减小影响。

图 4. STORM实验装置示意图

Fig. 4. Schematic of STORM system

下载图片查看所有图片

3.2 数据采集

本文中的dSTORM样本由帝国理工学院物理系光学组提供。数据采集所用相机为sCMOS(Photometrics Prime BSI,像元尺寸6.5 μm,量子效率95%)。物镜为60倍油镜(Olympus UPlanFLN 60x/1.25 Oil Iris)。采样间隔为108.3 nm。在数据采集过程中,使用的功率约为1 kW/cm²,曝光时间为30 ms,采样频率为33.3 Hz。根据单分子点闪烁密度,设置常规采集张数为5000帧或10000帧,采集时间为2.5 min或5 min左右。

3.3 结果分析

对采集到的Alexa Fluor 647染色微管的图像进行重建,采集10000帧图像,分别用WindSTORM PLUS、ThunderSTORM(Phasor)、ThunderSTORM(Gauss-WLS)定位方法进行处理,重建区域为512×512。

图5(b)~(d)分别给出了ThunderSTORM(Phasor)、ThunderSTORM(Gauss-WLS)和WindSTORM PLUS的超分辨图像。对比可以看出,WindSTORM PLUS的数据处理时间为87 s,为ThunderSTORM(Phasor)法和ThunderSTORM(Gauss-WLS)法耗时的65%和10%。同样使用WindSTORM对采集的微管数据数据进行处理,发现WindSTORM PLUS的耗时只有WindSTORM的9%,且其对内存的需求只有WindSTORM的30%。图5(e)是沿着图5(b)~(d)中的实线得到的横截面强度信息的归一化曲线。根据总体曲线的宽度对比可以看出,ThunderSTORM(Gauss-WLS)定位结果的线宽较大,说明其最终的定位点分布相对分散。图5(f)为利用傅里叶环相关(FRC)^[29]计算得到的超分辨图像的分辨率。其中ThunderSTORM(Phasor)、ThunderSTORM(Gauss-WLS)和WindSTORM PLUS的分辨率分别为95.6,108.2,80.2 nm,与图5(e)得到的归一化曲线的宽度相对一致。以上在进行FRC计算前,均对所有算法得到的单分子定位点序列进行了横向漂移校正。同时,从成像结果来看,WindSTORM PLUS对微管的重组细节优于ThunderSTORM(Phasor)、ThunderSTORM(Gauss-WLS)。

Alexa Fluor 647染色微管图像的重建结果。(a)明场荧光图像;(b) ThunderSTORM(Phasor)重建图像;(c) ThunderSTORM(Gauss-WLS)重建图像;(d) WindSTORM PLUS重建图像;(e) ROI区域实线的归一化强度拟合; (f)计算的FRC分辨率(R)

图 5. Alexa Fluor 647染色微管图像的重建结果。(a)明场荧光图像;(b) ThunderSTORM(Phasor)重建图像;(c) ThunderSTORM(Gauss-WLS)重建图像;(d) WindSTORM PLUS重建图像;(e) ROI区域实线的归一化强度拟合; (f)计算的FRC分辨率(R)

Fig. 5. Reconstruction results of microtubule stained by Alexa Fluor 647. (a) Wide-field fluorescence image; (b) super-resolution image reconstructed by ThunderSTORM(Phasor); (c) super-resolution image reconstructed by ThunderSTORM(Gauss-WLS); (d) super-resolution image reconstructed by WindSTORM PLUS; (e) normalized intensity fitting of the line of ROI; (f) calculated FRC resolution (R)

下载图片查看所有图片

为进一步验证大视野范围成像及定位结果,使用Phalloidin atto 647对人胚胎肾细胞(HEK-293)的肌动蛋白进行染色,然后进行STORM成像,重建区域为1024×1024,重建帧数为5000。分别采用ThunderSTORM(Phasor)、ThunderSTORM(Gauss-WLS)、WindSTORM PLUS算法进行重组处理,得到的超分辨图像分别如图6(b)~(d)所示。WindSTORM PLUS耗时为117 s,分别为ThunderSTORM(Phasor)、ThunderSTORM(Gauss-WLS)计算耗时的70%和9%;使用WindSTORM对采集的肌动蛋白数据进行处理,WindSTORM PLUS的耗时只有WindSTORM的9%,且对内存的需求也只有WindSTORM的30%。利用FRC计算超分辨图像分辨率,其中ThunderSTORM(Phasor)、ThunderSTORM(Gauss-WLS)和WindSTORM PLUS的FRC分辨率分别为46.5,43.1,48.8 nm。上述结果进一步验证了WindSTORM PLUS在超大数据集下的运行优势。

图 6. 人胚胎肾细胞(HEK-293)肌动蛋白的超分辨图像。(a)明场荧光图像;(b) ThunderSTORM(Phasor)重建图像;(c) ThunderSTORM(Gauss-WLS)重建图像;(d) WindSTORM PLUS重建图像

Fig. 6. Super-resolution image of HEK-293 actin. (a) Wide-field fluorescence image; (b) super-resolution image reconstructed using ThunderSTORM (Phasor); (c) super-resolution image reconstructed using ThunderSTORM (Gauss-WLS); (d) super-resolution image reconstructed using WindSTORM PLUS

下载图片查看所有图片

4 结论

本文构造了开源WindSTORM PLUS算法,该算法采用并行计算大幅提升了重组速度,并可适用于STORM任意尺寸数据集的处理。通过对不同尺寸和不同密度的模拟数据进行处理后发现,在大数据集下,WindSTORM PLUS相较WindSTORM和ThunderSTORM(Gauss-WLS),定位速度提高了1000%,相较ThunderSTORM(Phasor)提高了50%。此外,本文采用搭建的easySTORM成像系统对实际样本进行了成像和数据处理,在512×512×10000和1024×1024×5000的数据集下,WindSTORM PLUS的耗时只有WindSTORM和ThunderSTORM(Gauss-WLS)的9%,ThunderSTORM(Phasor)的70%,且利用FRC计算的分辨率略有提高。本文构建的WindSTORM PLUS算法为超分辨图像处理提供了一个全新的高速处理方案,其程序已发布到开源社区(https:∥github.com/Northstar1994/WindSTORM_PLUS)。可以相信,STORM数据处理速度还可通过CUDA编程编译的MEX文件加强并行计算以及引入深度学习等方式得到进一步提高。

参考文献

[1] Jans D C, Wurm C A, Riedel D, et al. STED super-resolution microscopy reveals an array of MINOS clusters along human mitochondria[J]. Proceedings of the National Academy of Sciences of the United States of America, 2013, 110(22): 8936-8941.

[2] Han J J, Kunde YA, Hong-Geller E, et al. Actin restructuring during Salmonella typhimurium infection investigated by confocal and super-resolution microscopy[J]. Journal of Biomedical Optics, 2014, 19(1): 016011.

[3] 付芸, 王天乐, 赵森. 超分辨光学显微的成像原理及应用进展[J]. 激光与光电子学进展, 2019, 56(24): 240002.

Fu Y, Wang T L, Zhao S. Imaging principles and applications of super-resolution optical microscopy[J]. Laser & Optoelectronics Progress, 2019, 56(24): 240002.

[4] 林丹樱, 屈军乐. 超分辨成像及超分辨关联显微技术研究进展[J]. 物理学报, 2017, 66(14): 148703.

Lin D Y, Qu J L. Recent progress on super-resolution imaging and correlative super-resolution microscopy[J]. Acta Physica Sinica, 2017, 66(14): 148703.

[5] Rust M J, Bates M, Zhuang X W. Sub-diffraction-limit imaging by stochastic optical reconstruction microscopy (STORM)[J]. Nature Methods, 2006, 3(10): 793-796.

[6] Gustafsson M G L. Surpassing the lateral resolution limit by a factor of two using structured illumination microscopy[J]. Journal of Microscopy, 2000, 198(2): 82-87.

[7] Westphal V, Rizzoli S O, Lauterbach M A, et al. Video-rate far-field optical nanoscopy dissects synaptic vesicle movement[J]. Science, 2008, 320(5873): 246-249.

[8] Heilemann M. Van de Linde S, Schüttpelz M, et al. Subdiffraction-resolution fluorescence imaging with conventional fluorescent probes[J]. Angewandte Chemie International Edition, 2008, 47(33): 6172-6176.

[9] Small A, Stahlheber S. Fluorophore localization algorithms for super-resolution microscopy[J]. Nature Methods, 2014, 11(3): 267-279.

[10] Huang F. Hartwich T M P,Rivera-Molina F E, et al. Video-rate nanoscopy using sCMOS camera-specific single-molecule localization algorithms[J]. Nature Methods, 2013, 10(7): 653-658.

[11] 桂丹, 商明涛, 黄振立. 基于sCMOS相机的超分辨定位成像技术[J]. 中国激光, 2018, 45(2): 0207016.

Gui D, Shang M T, Huang Z L. Super-resolution localization microscopy with scientific complementary metal oxide semiconductor camera[J]. Chinese Journal of Lasers, 2018, 45(2): 0207016.

[12] Izeddin I, Boulanger J, Racine V, et al. Wavelet analysis for single molecule localization microscopy[J]. Optics Express, 2012, 20(3): 2081-2095.

[13] Huang F, Schwartz S L, Byars J M, et al. Simultaneous multiple-emitter fitting for single molecule super-resolution imaging[J]. Biomedical Optics Express, 2011, 2(5): 1377-1393.

[14] Nandy K, Chellappa R, Kumar A, et al. Segmentation of nuclei from 3D microscopy images of tissue via graphcut optimization[J]. IEEE Journal of Selected Topics in Signal Processing, 2016, 10(1): 140-150.

[15] Zhu L, Zhang W, Elnatan D, et al. Faster STORM using compressed sensing[J]. Nature Methods, 2012, 9(7): 721-723.

[16] Holden S J, Uphoff S, Kapanidis A N. DAOSTORM: an algorithm for high- density super-resolution microscopy[J]. Nature Methods, 2011, 8(4): 279-280.

[17] Min J H, Vonesch C, Kirshner H, et al. FALCON: fast and unbiased reconstruction of high-density super-resolution microscopy data[J]. Scientific Reports, 2015, 4: 4577.

[18] Smith C S, Joseph N, Rieger B, et al. Fast, single-molecule localization that achieves theoretically minimum uncertainty[J]. Nature Methods, 2010, 7(5): 373-375.

[19] Brede N, Lakadamyali M. GraspJ: an open source, real-time analysis package for super-resolution imaging[J]. Optical Nanoscopy, 2012, 1(1): 11.

[20] Ovesny M, Kiizek P, Borkovec J, et al. ThunderSTORM: a comprehensive ImageJ plug-in for PALM and STORM data analysis and super-resolution imaging[J]. Bioinformatics, 2014, 30(16): 2389-2390.

[21] Martens K J A, Bader A N, Baas S, et al. Phasor based single-molecule localization microscopy in 3D (pSMLM-3D): an algorithm for MHz localization rates using standard CPUs[J]. The Journal of Chemical Physics, 2018, 148(12): 123311.

[22] Sage D, Kirshner H, Pengo T, et al. Quantitative evaluation of software packages for single-molecule localization microscopy[J]. Nature Methods, 2015, 12(8): 717-724.

[23] Sage D, Pham T A, Babcock H, et al. Super-resolution fight club: assessment of 2D and 3D single-molecule localization microscopy software[J]. Nature Methods, 2019, 16(5): 387-395.

[24] Ma H Q, Xu J Q. 5(4): eaaw0683[J]. Liu Y. WindSTORM: robust online image processing for high-throughput nanoscopy. Science Advances, 2019.

[25] Kwakwa K, Savell A, Davies T, et al. EasySTORM: a robust, lower-cost approach to localisation and TIRF microscopy[J]. Journal of Biophotonics, 2016, 9(9): 948-957.

[26] Ma H Q, Long F, Zeng S Q, et al. Fast and precise algorithm based on maximum radial symmetry for single molecule localization[J]. Optics Letters, 2012, 37(13): 2481-2483.

[27] Allan C, Burel J M, Moore J, et al. OMERO: flexible, model-driven data management for experimental biology[J]. Nature Methods, 2012, 9(3): 245-253.

[28] SepulvedaJ, Velastin SA. F1 score assesment of Gaussian mixture background subtraction algorithms using the MuHAVi dataset[C]∥6th International Conference on Imaging for Crime Prevention and Detection (ICDP-15), London, UK. [S.l.]: IEEE, 2015: 15382044.

[29] Nieuwenhuizen R P J, Lidke K A, Bates M, et al. Measuring image resolution in optical nanoscopy[J]. Nature Methods, 2013, 10(6): 557-562.

1 引言

2 WindSTORM PLUS算法与模拟验证

肖文, 吴天琦, 李仁剑, 唐黎, 陈玲玲. 基于并行计算优化的WindSTORM PLUS算法[J]. 中国激光, 2020, 47(6): 0607001. Xiao Wen, Wu Tianqi, Li Renjian, Tang Li, Chen Lingling. WindSTORM PLUS Algorithm with Parallel Computing Optimization[J]. Chinese Journal of Lasers, 2020, 47(6): 0607001.

基于并行计算优化的WindSTORM PLUS算法下载： 1034次

1 引言

2 WindSTORM PLUS算法与模拟验证

2.1 WindSTORM算法

2.2 并行架构

图 1. 架构示意图。(a) GPU架构;(b) MATLAB CPU并行架构

Fig. 1. Schematics of architecture. (a) GPU architecture; (b) MATLAB CPU parallel architecture

2.3 WindSTORM PLUS设计

图 2. WindSTORM PLUS程序设计流程图

Fig. 2. Flow chart of WindSTORM PLUS program design

2.4 模拟验证

图 3. 模拟数据集下不同算法的处理速度对比。(a)低密度模拟数据集;(b)高密度模拟数据集

Fig. 3. Comparison of processing speed of different algorithms using simulated data sets. (a) Data set with low density; (b) data set with high density

表 1. 模拟数据集下不同算法的准确度评估(F₁分数)

Table 1. Accuracy evaluation (F₁ score) of different algorithms using simulated data sets%

3 系统及结果分析

3.1 dSTORM成像系统

图 4. STORM实验装置示意图

Fig. 4. Schematic of STORM system

3.2 数据采集

3.3 结果分析

图 5. Alexa Fluor 647染色微管图像的重建结果。(a)明场荧光图像;(b) ThunderSTORM(Phasor)重建图像;(c) ThunderSTORM(Gauss-WLS)重建图像;(d) WindSTORM PLUS重建图像;(e) ROI区域实线的归一化强度拟合; (f)计算的FRC分辨率(R)

图 6. 人胚胎肾细胞(HEK-293)肌动蛋白的超分辨图像。(a)明场荧光图像;(b) ThunderSTORM(Phasor)重建图像;(c) ThunderSTORM(Gauss-WLS)重建图像;(d) WindSTORM PLUS重建图像

Fig. 6. Super-resolution image of HEK-293 actin. (a) Wide-field fluorescence image; (b) super-resolution image reconstructed using ThunderSTORM (Phasor); (c) super-resolution image reconstructed using ThunderSTORM (Gauss-WLS); (d) super-resolution image reconstructed using WindSTORM PLUS

4 结论

Article Outline

关于本站 Cookie 的使用提示

全站搜索

基于并行计算优化的WindSTORM PLUS算法 下载： 1034次

1 引言

2 WindSTORM PLUS算法与模拟验证

2.1 WindSTORM算法

2.2 并行架构

图 1. 架构示意图。(a) GPU架构;(b) MATLAB CPU并行架构

Fig. 1. Schematics of architecture. (a) GPU architecture; (b) MATLAB CPU parallel architecture

2.3 WindSTORM PLUS设计

图 2. WindSTORM PLUS程序设计流程图

Fig. 2. Flow chart of WindSTORM PLUS program design

2.4 模拟验证

图 3. 模拟数据集下不同算法的处理速度对比。(a)低密度模拟数据集;(b)高密度模拟数据集

Fig. 3. Comparison of processing speed of different algorithms using simulated data sets. (a) Data set with low density; (b) data set with high density

表 1. 模拟数据集下不同算法的准确度评估(F1分数)

Table 1. Accuracy evaluation (F1 score) of different algorithms using simulated data sets%

3 系统及结果分析

3.1 dSTORM成像系统

图 4. STORM实验装置示意图

Fig. 4. Schematic of STORM system

3.2 数据采集

3.3 结果分析

图 5. Alexa Fluor 647染色微管图像的重建结果。(a)明场荧光图像;(b) ThunderSTORM(Phasor)重建图像;(c) ThunderSTORM(Gauss-WLS)重建图像;(d) WindSTORM PLUS重建图像;(e) ROI区域实线的归一化强度拟合; (f)计算的FRC分辨率(R)

图 6. 人胚胎肾细胞(HEK-293)肌动蛋白的超分辨图像。(a)明场荧光图像;(b) ThunderSTORM(Phasor)重建图像;(c) ThunderSTORM(Gauss-WLS)重建图像;(d) WindSTORM PLUS重建图像

Fig. 6. Super-resolution image of HEK-293 actin. (a) Wide-field fluorescence image; (b) super-resolution image reconstructed using ThunderSTORM (Phasor); (c) super-resolution image reconstructed using ThunderSTORM (Gauss-WLS); (d) super-resolution image reconstructed using WindSTORM PLUS

4 结论

Article Outline

相关论文

相关资讯

关于本站 Cookie 的使用提示

全站搜索

基于并行计算优化的WindSTORM PLUS算法下载： 1034次

表 1. 模拟数据集下不同算法的准确度评估(F₁分数)

Table 1. Accuracy evaluation (F₁ score) of different algorithms using simulated data sets%