基于有效无标记样本选择的协同训练回归模型的半监督式LIBS定量分析方法
我们知道,激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)定量分析方法的准确性在很大程度上取决于可供用于训练的认证标准样品(certified standard sample)的数量。然而,在实际应用中,具有标记的已知浓度认证标准样品的数量是十分有限的,这是LIBS基于训练回归模型的定量分析方法目前面临的一大挑战。近日,由北京科技大学机械工程学院的阳建宏教授领衔的研究团队发布了他们关于激光诱导击穿光谱定量分析的新成果,该团队还包括了来自北京科技大学自然科学基础实验中心的成员。
该团队提出了一种新型的半监督式LIBS定量分析方法,这种方法基于协同训练回归模型(co-training regression),其核心在于选择有效的无标记样本。如果训练样本全部是已知浓度的有标记样本,那么就是传统的有监督式学习(semisupervised learning),而如果在训练样本中加入一些有效的无标记样本,那就形成了本研究所提出的所谓半监督式学习(semisupervised learning)。该方法的实施步骤是,首先选择有效的未标记样本,选择依据是采用欧几里得度量(Euclidean metric)的测试样本。然后用有标记样本分别对两个采用不同参数的最小二乘支持向量机回归模型进行训练,然后基于标记的置信区间估计,利用两个模型预测得到的有效未标记样本来扩大训练数据集。最后,通过对两个更新迭代后的回归模型给出的预测结果进行一定的加权组合,来计算得到对测试样品的最终预测值。
为了检验这种新方法的效果,研究人员对23个认证的高合金钢样品进行了铬的浓度分析实验,他们用5个有标记浓度的样品和11个无标记样品对半监督式回归模型进行了训练,而对其余的7个样品进行了铬浓度预测。实验结果显示,随着有效未标记样本数量的增加,这种方法的均方根误差由1.80%降至了0.84%,相对预测误差由9.15%降至了4.04%。
本文受译者委托,享有该文的专有出版权,其他出版单位或网站如需转载,请与本站联系,联系email:mail#opticsjournal.net (为防止垃圾邮件,请将#换为@)。否则,本站将保留进一步采取法律手段的权利。