作者单位
摘要
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
分析了校正集和验证集样品数随性质分布不均匀性对光谱多元分析校正的不良影响, 揭示了实际光谱多元校正中“均值化”现象, 即性质值小的样本预测值结果偏大, 性质值大的则偏小, 提出了一种优选样品新方法—Rank-KS。 其综合考虑光谱空间和性质空间对样本进行挑选, 将性质空间平均分为若干小区间, 在每个小区间内分别利用Kennard-Stone法和随机法进行校正集和验证集样本的挑选, 这样得到的校正集和验证集可明显改善样本数随性质分布的均匀性。 以红外光谱测定汽油中碳酸二甲酯(DMC)含量和近红外光谱测定二甲亚砜溶液二甲亚砜浓度为研究对象, 分别采用Rank-KS、 随机法、 Kennard-Stone、 浓度梯度法和SPXY等方法选择校正集和验证集样品, 使用多元线性回归和偏最小二乘法建立模型, 比较这些方法对光谱多元校正分析的影响, 结果表明Rank-KS方法可改善校正集和验证集样品数随性质分布的均匀性; 对于样本数分布中间局部样本多和两端局部少、 或者局部没有样本的样本集, 使用Rank-KS算法挑选校正集, 无论使用MLR还是PLS1建立多元分析模型, 均能明显改善其模型预测能力, 使得到的模型的预测均方根最小。
样本分集 PLS回归 Kennard-Stone理论 近红外光谱 红外光谱 Sample subset partitioning PLS regression Kennard-Stone algorithm NIR spectrometry IR spectrometry 
光谱学与光谱分析
2014, 34(4): 947
作者单位
摘要
1 北京中医药大学中药学院, 北京 100102
2 首都师范大学化学系, 北京 100037
在近红外光谱PLS定量模型的建立过程中训练集样本的选取和潜变量数的确定是十分重要的。 因此, 该研究以橘叶中橙皮苷的含量检测为例, 分别比较了random sampling (RS), Kennard-Stone(KS), duplex, sample set partitioning based on joint x-y distance (SPXY) 四种训练集样本的选取方法对模型的影响, 以及留一交互验证法和蒙特卡罗法对潜变量数确定的影响。 结果表明, SPXY法选取的训练集建立的模型优于其他三种方法, 蒙特卡罗法能够较好地确定模型的潜变量数并有效地减少过拟合风险, 所建模型的交互验证均方根, 预测均方根及预测集相关系数分别为0.768 1, 0.736 9, 0.975 2。
近红外光谱法 训练集选择 潜变量数 蒙特卡罗法 NIR spectrometry Sample subset partitioning SPXY SPXY Number of latent variables Monte Carlo cross validation 
光谱学与光谱分析
2009, 29(4): 964

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!