作者单位
摘要
中国计量学院计量测试工程学院, 浙江 杭州 310018
将高斯过程算法引入化学计量学领域, 用于挖掘近红外光谱与被测物组分之间的复杂关系。 为增加模型的稳健性, 首先采用了蒙特卡罗交叉验证方法以去除异常样本, 而后多元散射校正、 平滑、 导数等方法被用于模型的预处理。 近红外光谱在经过无信息变量去除算法处理后, 在保留有用信息的基础上大大缩减了波长点数, 以这些特征波长点作为输入建立的分析模型更具有解释能力和稳健性。 为验证算法的有效性, 使用了一组公开的数据集, 它包含了80个玉米样品的近红外光谱以及油、 淀粉、 蛋白质的含量值。 GP回归算法被用于分析这三种组分的含量, 所得模型的评价指标分别采用校正、 校正集交叉验证均方根误差、 预测均方根误差以及各自的相关系数。 结果显示, 模型的校正相关系数r达到0.99以上, 预测时的相关系数r也在0.96以上, 验证了该算法的有效性。
高斯过程 近红外光谱 蒙特卡罗交叉验证 无信息变量去除 定量分析 Gaussian process Near-infrared spectroscopy Monte Carlo cross validation Uninformative variable elimination Quantitative analysis 
光谱学与光谱分析
2011, 31(6): 1514
作者单位
摘要
1 北京中医药大学中药学院, 北京 100102
2 首都师范大学化学系, 北京 100037
在近红外光谱PLS定量模型的建立过程中训练集样本的选取和潜变量数的确定是十分重要的。 因此, 该研究以橘叶中橙皮苷的含量检测为例, 分别比较了random sampling (RS), Kennard-Stone(KS), duplex, sample set partitioning based on joint x-y distance (SPXY) 四种训练集样本的选取方法对模型的影响, 以及留一交互验证法和蒙特卡罗法对潜变量数确定的影响。 结果表明, SPXY法选取的训练集建立的模型优于其他三种方法, 蒙特卡罗法能够较好地确定模型的潜变量数并有效地减少过拟合风险, 所建模型的交互验证均方根, 预测均方根及预测集相关系数分别为0.768 1, 0.736 9, 0.975 2。
近红外光谱法 训练集选择 潜变量数 蒙特卡罗法 NIR spectrometry Sample subset partitioning SPXY SPXY Number of latent variables Monte Carlo cross validation 
光谱学与光谱分析
2009, 29(4): 964

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!