作者单位
摘要
1 甘肃中医药大学信息工程学院, 甘肃 兰州 730000
2 甘肃中医药大学药学院, 甘肃 兰州 730000
压缩感知(CS)是一种新兴的信号压缩和采样技术, 正交匹配追踪(OMP)是一种贪婪追踪算法, 广泛用于压缩感知领域中的稀疏信号重构。 针对近红外光谱信号高维小样本以及信号稀疏先验的特点, 为进一步提高小样本近红外光谱变量选择的灵活性和可靠性, 基于压缩感知理论, 提出了一种新颖的光谱变量选择方法正交匹配追踪变量选择(OMPBVS)。 OMPBVS算法通过对原始光谱信号的稀疏重构, 将绝大部分变量的回归系数压缩为0, 进而间接实现光谱变量选择。 具体过程为以光谱矩阵为传感矩阵, 预测变量为观测变量, 迭代地计算残差与原子的内积, 选择内积最大的原子, 在每一步迭代过程中将信号投影到由所有已经被选择原子张成的子空间上, 然后对所有被选择原子的系数进行更新, 使得产生的残差与已被选择的所有原子都正交, 其残差计算的实质是进行Gram-Schmidt正交化, 正交投影能够在保证信号重构精度的情况下减小迭代次数。 OMPBVS具有将光谱维度降低至样本大小规模的能力, 其变量选择能力与LASSO相当, 但与LASSO相比, 由于OMPBVS损失函数的优化方法是前向选择算法, 减少了迭代次数, 并且可以精确控制选择变量的数量。 分别在beer数据集和Wheat kernels数据集上进行变量选择实验, 比较PLS, MCUVE-PLS, CARS-PLS, WMSCVS, LASSOLarsCV和OMPBVS六种变量选择方法的性能。 其中beer数据集共60个样本, 采用Kennard Stone (KS)方法划分训练集样本36个, 测试集样本24个, 预测变量为Original extract concentration。 Wheat kernels数据集共523个样本, 训练集样本415个, 测试集样本108个, 预测值为蛋白质含量。 OMPBVS方法在beer数据集上选择变量个数、 RMSEC和RMSEP分别为2, 0.205 2和0.159 8, 在Wheat kernels数据集上选择变量个数、 RMSEC和RMSEP分别为9, 0.450 2和0.412 5, 其变量选择能力和模型性能均好于其他五种方法, 这说明OMPBVS是一种有效的近红外光谱变量选择和定量分析方法。 OMPBVS变量选择方法在小样本情况下具有良好的泛化能力, 能够减少选择变量的数量, 提高变量选择的稳健性。 此外, 基于SNV和MSC等光谱预处理方法, 能够在一定程度上减少选择变量的个数, 提高模型的可解释性。
近红外光谱 变量选择 压缩感知 偏最小二乘 正交匹配追踪 Near infrared spectroscopy Variable selection Compressed sensing Partial Least squares Orthogonal matching pursuit 
光谱学与光谱分析
2021, 41(4): 1097
作者单位
摘要
1 甘肃中医药大学信息工程学院, 甘肃 兰州 730000
2 甘肃省高校中(藏)药化学与质量研究省级重点实验室, 甘肃 兰州 730000
近红外光谱具有高维小样本的特点, 变量选择是提高定量分析模型稳健性和可解释性的一种有效方法。 确定独立筛选(SIS)是一种基于边际相关性的超高维数据变量选择方法, 广泛用于基因微阵列数据的变量选择。 SIS具有将数据维度降低至样本大小规模的能力, 其降维能力与LASSO相当, 在相当宽泛的近似条件下, 由于具有安全筛选性质, 所有重要变量被保留的概率趋于1。 基于确定独立筛选偏最小二乘(SIS-SPLS)的变量选择是一种迭代式的SIS变量选择方法, 首先利用SIS方法完成光谱重要变量的初选; 然后根据重要变量的边际相关性大小进行逐步前向选择: 建立偏最小二乘回归模型, 依据贝叶斯信息准则(BIC)确定最终的变量选择结果。 SIS-SPLS以逐步前向选择的方式实现对重要变量的增量式筛选, 随着潜变量个数的增加及因变量残差的逐步减小, SIS-SPLS方法选择的变量个数将趋于稳定。 然而仅以边际相关性对变量重要性进行评价, 当光谱变量个数远大于样本数时, 该方法也存在选择的变量过多、 变量选择结果不够稳健等问题。 为进一步提高小样本情况下变量选择的稳健性, 将集成学习引入SIS-SPLS方法之中, 提出了一种集成SIS-SPLS变量选择方法(Ensemble-SISPLS)。 该方法首先对校正集样本进行自助重采样, 对采样得到的每一个校正子集分别使用SIS-SPLS方法进行变量筛选, 通过投票机制并设置频次阈值对所有校正子集的变量选择结果进行集成, 选择出现频次大于给定阈值的变量并建立偏最小二乘回归模型, 计算5折交叉验证均方根误差。 对频次阈值和潜变量个数两个关键参数使用网格搜索法进行优选, 根据子模型的交叉验证均方根误差和变量个数对子模型性能进行综合评价, 以最优子模型包含的变量作为最终的变量选择结果。 分别在Corn数据集和当归数据集上进行变量选择实验, 比较Ensemble-SISPLS, SIS-SPLS和UVE-PLS三种变量选择方法的性能。 其中当归数据集共77个样本, 样本采自甘肃岷县和渭源县, 使用Nicolet-6700型近红外光谱仪扫描得到所有样本的近红外光谱并对当归中的阿魏酸含量进行预测。 Ensemble-SISPLS方法在Corn数据集上选择的变量个数、 RMSEP和决定系数分别为22, 0.000 8和0.999 8; SIS-SPLS方法在Corn数据集上选择的变量个数、 RMSEP和决定系数分别为97, 0.007 3和0.998 8。 Ensemble-SISPLS方法在当归数据集上选择的变量个数、 RMSEP和决定系数分别为24, 0.018 1和0.996 3; SIS-SPLS方法在当归数据集上选择的变量个数、 RMSEP和决定系数分别为38, 0.022 6和0.994 3。 结果表明, 该方法进一步提高了变量选择结果的稳健性和预测能力。 Ensemble-SISPLS变量选择方法有效结合了SIS-SPLS较强的变量选择能力和集成学习良好的泛化能力, 提高了变量选择的稳健性。 此外, 由于在子模型的预测能力和变量个数之间进行了折中, 一定程度上减少了选择变量的个数, 提高了模型的可解释性。
近红外光谱 变量选择 确定独立筛选 偏最小二乘 集成学习 Near infrared spectroscopy Variable selection Sure independence screening Partial least squares Ensemble learning 
光谱学与光谱分析
2019, 39(4): 1047
作者单位
摘要
1 甘肃中医药大学信息工程学院, 甘肃 兰州 730000
2 甘肃省高校中(藏)药化学与质量研究省级重点实验室, 甘肃 兰州 730000
傅里叶变换红外光谱通常包含有大量的波长变量点, 对其进行定性分析需要建立稳健的、 可解释性的分类模型。 稀疏线性判别分析(SLDA)是一种较为新颖和有效的机器学习算法, 常用于高维度、 小样本数据的变量筛选和判别分析, SLDA通过在线性判别分析中引入正则项, 使分类器训练过程和变量选择过程同时完成, 不同判别方向上载荷系数的稀疏性则增强了模型的可解释性。 采集甘肃不同产地的秦艽样本94个, 其中麻花秦艽(Gentiana straminea Maxim)30个, 黄管秦艽(Gentiana officinalis)28个, 大叶秦艽(Gentiana macrophylla Pall)36个, 利用傅里叶变换红外光谱法获得所有样本的光谱图。 取其中70个样本构成训练集, 剩余24个为测试集。 使用训练集建立SLDA模型, 对2个判别方向上不为0的载荷系数个数进行网格化寻优, 得到了最优的参数空间。 利用建立的SLDA模型对测试样本进行预测, 其分类准确率达到100%, 实现了对三种秦艽的快速、 准确鉴别。 实验结果表明, 与PLS-DA方法相比, SLDA模型在分类准确率、 稀疏性及可解释性方面均具有一定优势, 是一种新颖、 有效的光谱定性分析方法。
秦艽 傅里叶变换红外光谱 正则化 稀疏线性判别分析 变量选择 Gentiana macrophylla FTIR Regularization Sparse linear discriminant analysis Variable selection 
光谱学与光谱分析
2018, 38(8): 2390
作者单位
摘要
西北工业大学自动化学院, 陕西 西安 710129
针对棱镜式激光陀螺稳频精度较低的现象,系统地研究了棱镜式激光陀螺稳频控制系统特性。理论分析了光强调谐曲线及稳频执行机构的特征,建立了棱镜式激光陀螺稳频控制系统数学模型。进一步分析了系统稳态性能及动态性能,分析结果表明,系统在定温及慢变温作用下具有不同程度的稳态误差且调节时间过长,从而导致稳频精度下降。优化控制器参数使二阶系统具有最佳阻尼比及快速性,采用按温度补偿的前馈控制系统,实现了对温度所引起的稳频误差的全补偿,提高了系统的稳频精度。实验结果表明,优化后的稳频控制系统比原稳频控制系统的稳频精度提高一个数量级,陀螺精度提高30%以上。
激光光学 棱镜式激光陀螺 稳频精度 温度补偿 前馈 
中国激光
2018, 45(6): 0601003

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!