基于卷积神经网络的混合颗粒分类法研究 下载: 840次
1 引言
颗粒特性研究在工业生产及环境检测等方面具有非常重要的意义。混合颗粒系作为一种常见的颗粒存在体系,其分析往往较单一颗粒系更为复杂,对于具有一定形状或纹理特征的混合颗粒,如何获取每种颗粒的粒径分布或形状信息至关重要。例如,机械润滑系统中通常含有不同形状的磨损颗粒,其特性可以间接反映机械运转状态,对润滑油中的磨损颗粒进行分类可以更好地对机械进行摩擦诊断[1-5]。此外,颗粒在团聚过程中会形成团聚颗粒和单个颗粒的混合颗粒系,对其进行分类就可以得到颗粒系的团聚度,进而对结晶过程中的晶体团聚和生长加以区分[6-7]。在一些药品加工过程中,可通过制作薄膜包衣来改善药物颗粒的性能,而颗粒的团聚度会严重影响包衣的质量,因此团聚度的获取具有重要意义[8-10]。在对颗粒系进行分析时,经常会受到气泡和杂质颗粒的干扰,从而严重影响了颗粒系特征分析的准确性。
经典的混合颗粒分类问题依托于颗粒特征和分类器的设计,而颗粒特征设计则建立在基本的图像处理算法上,通过预处理去除图像噪声,之后对图像进行二值化、图像形态学处理以及粘连颗粒分割,进而提取颗粒特征,形成一系列的特征描述子作为分类器的输入。通常分类器主要采用线性判别因子分析(DFA)或非线性神经网络以及支持向量机(SVM)等对不同类别的颗粒进行分类,这种结合特征设计的混合颗粒分类过程作为先前主流的方法,不少学者对此进行了研究[11-13]。Yuan等[1]根据颗粒的外轮廓建立了一种径向凹偏差特征描述子,并结合线性判别分析(LDA)以及分类回归树(CART)等算法对磨损颗粒的分类问题进行了探究;Heisel等[7]通过建立颗粒的特征描述子,并利用判别因子分析和人工神经网络方法对含有聚合晶体、单个晶体以及气泡的混合颗粒进行了对比研究。在其他的混合颗粒分类中,同样有大量基于特征和分类器设计的研究方法[14-15],但此类方法的不足之处在于难以准确地提取颗粒特征。因为颗粒图像处理常常会受到光照、噪声、颗粒粘连等因素的影响。此外,颗粒特征描述子也难以准确设计,并会受到特征不足或特征冗余的干扰,造成分类器欠拟合或过拟合,大大降低了分类的准确率。卷积神经网络(CNN)是一种深度神经网络,其完全自动的特征提取避免了人工特征设计的不确定性和繁杂性,通过结合分类器以及与全卷积神经网络的融合,可以实现分类和像素分割等任务[16-21]。目前,鲜有对于混合颗粒的分类,尤其是对颗粒进行像素级的分割应用的研究。
本文首先介绍了混合颗粒分类的基本方法,然后引入基于CNN的颗粒分类和分割方法,对由球形、长条形颗粒以及非规则颗粒组成的三种混合颗粒样品进行循环流动实验,同时对采集到的颗粒图像进行分类分析,并结合颗粒的粒径分布以及长宽比特征对不同的分类方法进行对比研究。
2 混合颗粒分类的基本方法
传统算法在对混合颗粒进行分析时,主要考虑颗粒特征及分类器的设计,常见分类器包括BP(back propagation)神经网络以及SVM等。SVM是一种基于小样本学习的模式识别方法,在保证正确分割正、负样本的前提下,根据最大化支持向量到分割超平面的距离来分割正、负样本。对于颗粒特征设计,则主要考虑如下两方面:选取不同类别间差距较大的特征,以提高分类效果,降低错分的概率;特征过多会增加计算的复杂度,分类结果不易收敛,分类效率降低。因此在保证正确分类的情况下,应尽量减少特征数,尤其是避免使用相似特征。两类特征描述子如
表 1. 颗粒的特征描述子
Table 1. Feature descriptors of particles
|
3 基于CNN的混合颗粒分类方法
3.1 网络结构
3.2 网络结构优化
考虑到混合颗粒的特征相对简单,同时为了提高模型的预测效率,对ResNet-101的conv3_x和conv4_x的结构配置进行调整,如
表 2. conv3_x和conv4_x的结构配置
Table 2. Structure configurations of conv3_x and conv4_x
|
3.3 RPN网络和FCN网络
RPN网络主要用于生成目标建议框的集合,通过定义不同尺寸的滑动窗,在原图上映射得到不同的候选区域,通过分类层输出候选区的得分来确定区域为目标还是背景,并对锚框(anchor)的位置和尺寸进行精调,最终获得目标建议框,如
由于在主干网络上得到了不同尺度的特征层,所以对不同层的特征图定义不同尺寸的锚框,锚框有3种不同的比例:1∶1、1∶2和2∶1。此外,如果最终的锚框互相重叠,则保留前景分数最高者,并通过非极大值抑制法过滤其余锚框。
图 2. RPN网络结构。(a)锚框尺度设置;(b)锚框比例设置
Fig. 2. RPN network structure. (a) Anchor frame scale setting; (b) anchor frame ratio setting
通过RPN网络可初步确定目标框的位置,但并不能判定物体的类别。为此,在通过RPN获得感兴趣区域(ROI)的基础上,利用分类器进一步判定ROI中的物体类别,并通过回归器进一步精调边框的位置和尺寸。除了对ROI内目标进行分类和边界框回归外,笔者将全卷积网络[26](FCN)用于颗粒二值化图像的预测上。FCN主要对ROI分类器的前景目标进行反卷积,使其恢复到原始尺寸,进而获取颗粒的二值化图像。将主干网络划分为多个具有不同分辨率的特征层,因此不同的ROI和特征层间存在一个对应关系:
式中:
3.4 Loss函数
总体的损失函数
其中
式中:
3.5 算法流程及参数优化
混合颗粒分类的算法流程如
4 实验及结果分析
为了探讨CNN混合颗粒分类法的效果,设计了相应的混合颗粒循环流动系统,并进行了实验研究。实验中采用的混合颗粒由球形颗粒、长条形颗粒和非规则颗粒组成,如
为对后续的分类结果进行定量分析,定义精确率(
式中:
图 4. 不同类型的颗粒。(a)球形颗粒;(b)长条形颗粒;(c)非规则颗粒
Fig. 4. Examples of different types of particles. (a) Spherical particles; (b) elongated particles; (c) irregular particles
4.1 实验装置
设计了如
4.2 数据集预处理
通过上述实验装置实时采集混合颗粒的图像,并根据模型参数测试需要,选择400张用于后续的训练与分析,其中训练集为300张图片,测试集为100张图片。在CNN方法中,需要获得颗粒的二值图像,并标注每张图片中的颗粒类别。而在SVM法中,要在二值图像的基础上提取颗粒特征,并标注颗粒类别。为此,对所有图片均作如
如
式中:
式中:
图 7. 不同方法处理后混合颗粒的图像。(a)混合颗粒;(b)维纳滤波;(c)二值化和孔洞填充;(d) watershed分割;(e)手动精分割
Fig. 7. Images of mixed particles processed by different methods. (a) Mixed particles; (b) Wiener filtering; (c) binarization and hole filling; (d) watershed segmentation; (e) manually fine segmentation
4.3 结果分析
根据训练集数据对模型进行训练,分析基于SVM法和CNN的混合颗粒分类方法,从颗粒分类准确度和颗粒特征分布两方面对结果进行评估。针对粘连颗粒,同时探究分水岭法和手动分割方法对SVM法分类的影响。对测试集进行分析得到如
图 8. 不同分类方法得到的颗粒计数结果
Fig. 8. Particle counting results obtained by different classification methods
除了混合颗粒的数目分布关系外,颗粒的粒径分布也是描述混合颗粒的重要参数。通常混合颗粒的总体粒径分布难以反映每种颗粒的特性,为此,在分类基础上同时探究每种颗粒的粒径分布,如
图 10. 不同分类方法得到的颗粒的当量直径累积分布
Fig. 10. Cumulative distributions of equivalent diameters of particles obtained by different classification methods
表 3. 不同分类方法得到的颗粒的测量尺寸
Table 3. Particle sizes measured by different classification methods
|
由上述的分析可以发现,除了CNN法,其他两种方法均存在较明显的粒径分析误差,同时也会影响颗粒的形状参数,如
图 11. 不同分类方法得到的长条形颗粒的长宽比累积分布
Fig. 11. Cumulative distributions of aspect ratios for elongated particles obtained by different classification methods
图 12. 不同分类方法得到的球形颗粒的长宽比累积分布
Fig. 12. Cumulative distributions of aspect ratios for spherical particles obtained by different classification methods
图 13. 不同分类方法得到的非规则颗粒的长宽比累积分布
Fig. 13. Cumulative distributions of aspect ratios for irregular particles obtained by different classification methods
综合上述分析可以发现,CNN法从颗粒分类的准确率、颗粒粒径分布和长宽比分布几个方面均表现出优于SVM_1法和SVM_2法的效果,其中SVM_2法仅仅因为粘连分割的问题,就出现了比SVM_1法更高的误检率,而实际中SVM法还会受到光照和噪声等因素的干扰,从而在连续分析中积累更多的误差。相比之下,CNN法对流动颗粒的分析上具有更多优势,其优异的特征表达能力比人工特征设计更加准确,并且受上述因素的干扰较小,可以同时兼顾颗粒的局部和全局特征。
5 结论
研究了图像法中混合颗粒的模式识别问题,在传统的基于人工特征设计的SVM法基础上,引入基于CNN法的混合颗粒分类方法,通过实验得到了球形、非规则和长条形混合颗粒的流动图像,建立了相应的训练数据集和测试数据集,同时从数目分布、分类准确率以及颗粒的粒径、长宽比等方面进行了对比分析。
首先建立了两类颗粒特征描述子,并利用无量纲的描述子作为SVM法的特征向量,同时根据粘连颗粒的分割方式建立了SVM_1法和SVM_2法,结果发现SVM_1法比SVM_2法获得了更好的分类结果,说明SVM法的准确率依赖于准确的特征提取,而在分析混合颗粒时会受到光照和噪声的干扰,分类误差甚至大于SVM_2法。混合颗粒的表征需要结合多方面特征,对于分类模型评估也不能根据单一特征的分布决定其好坏,综合颗粒数目分布、分类准确率、粒径分布和长宽比分布特征建立更加有效的分析模型,形成了相对全面的混合颗粒特征,避免了采用单一特征造成的偏差。此外,基于CNN法的混合颗粒分析模型的各个特征分析结果均优于SVM法,可更全面准确地分析混合颗粒;同时,CNN法无需进行人工特征设计,并有效克服了图像中粘连颗粒等的干扰,形成了相对准确的端对端混合颗粒分析系统。
[1] YuanW, Chin KS, HuaM, et al. Shape classification of wear particles by image boundary analysis using machine learning algorithms[J]. Mechanical Systems and SignalProcessing, 2016, 72/73: 346- 358.
[2] Peng YP, Wu TH, Cao GZ, et al. A hybrid search-tree discriminant technique for multivariate wear debris classification[J]. Wear, 2017, 392/393: 152- 158.
[7] Heisel S. Kova evi T, Briesen H, et al. Variable selection and training set design for particle classification using a linear and a non-linear classifier [J]. Chemical Engineering Science, 2017, 173: 131-144.
[11] Iacoviello F. Iacoviello D, di Cocco V, et al. Classification of ductile cast iron specimens based on image analysis and support vector machine[J]. Procedia Structural Integrity, 2017, 3: 283-290.
[18] Vogado L H S, Veras R M S, Araujo F H D, et al. . Leukemia diagnosis in blood slides using transfer learning in CNNs and SVM for classification[J]. Engineering Applications of Artificial Intelligence, 2018, 72: 415-422.
[19] Raitoharju J, Riabchenko E, Ahmad I, et al. Benchmark database for fine-grained image classification of benthic macroinvertebrates[J]. Image and Vision Computing, 2018, 78: 73-83.
[20] 冯小雨, 梅卫, 胡大帅. 基于改进Faster R-CNN的空中目标检测[J]. 光学学报, 2018, 38(6): 0615004.
[21] 杜剑, 胡炳樑, 张周锋. 基于卷积神经网络与显微高光谱的胃癌组织分类方法研究[J]. 光学学报, 2018, 38(6): 0617001.
[23] He KM, GkioxariG, DollárP, et al. Mask R-CNN[C]//2017 IEEE International Conference on Computer Vision (ICCV), October 22-29, 2017, Venice, Italy. New York: IEEE, 2017: 2980- 2988.
[24] He KM, Zhang XY, Ren SQ, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 27-30, 2016, Las Vegas, NV, USA. New York: IEEE, 2016: 770- 778.
[25] Lin TY, DollárP, GirshickR, et al. Feature pyramid networks for object detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), July 21-26, 2017, Honolulu, HI, USA. New York: IEEE, 2017: 936- 944
[27] Vala H J, Baxi A. A review on Otsu image segmentation algorithm[J]. International Journal of Advanced Research in Computer Engineering & Technology, 2013, 2(2): 387-389.
Article Outline
蔡杨, 苏明旭, 蔡小舒. 基于卷积神经网络的混合颗粒分类法研究[J]. 光学学报, 2019, 39(7): 0712002. Yang Cai, Mingxu Su, Xiaoshu Cai. Method for Mixed-Particle Classification Based on Convolutional Neural Network[J]. Acta Optica Sinica, 2019, 39(7): 0712002.