为了找出一种快速、简便、准确的方法来探究霉菌试验后**装备表面生长的霉菌种类,按照标准的试验方法进行了霉菌试验,利用傅里叶红外光谱仪对经过不同菌种腐蚀后的样本进行了测试,获取了光谱数据,并通过对数据进行初步的主成分分析确定了光谱数据的识别区域。采用最小距离匹配、光谱角匹配、光谱信息散度、光谱协方差、主成分分析、偏最小二乘判别分析(Partial Least Squares Discriminant Analysis,PLS-DA)、随机森林等分类算法建立了识别模型。研究结果表明,随机森林算法能够很好地识别霉菌种类,准确率预期在98%以上。基于合适的分类算法,傅里叶红外光谱(Fourier Transform Infrared, FTIR)技术能够实现对菌种的有效鉴别。
傅里叶红外光谱 偏最小二乘判别分析 光谱信息散度 随机森林 霉菌试验 菌种识别 FTIR PLS-DA spectral information divergence random forest mold test species identification
华东交通大学智能机电装备创新研究院, 江西 南昌 330013
我国高速铁路运行距离长, 服役环境多变, 对车轮钢的性能要求较高。 车轮钢的晶粒尺寸直接影响着车轮钢的力学性能, 且晶粒的特征和测量对材料科学有着重要的作用, 因此为了保证高速列车的安全运行, 对高铁车轮的晶粒度等级进行检测是十分必要的。 利用激光诱导击穿光谱(LIBS)实验平台对5个不同晶粒度等级的ER8高速列车车轮钢样品(经过不同热处理得到不同晶粒度等级)进行击穿获取光谱信息, 比较了基体元素Fe和合金元素(Cr, Mo, Co)的谱线强度与5个不同晶粒度等级的样品之间的相关性, 发现均与样品晶粒度等级存在不同程度的相关性。 利用此关系建立以谱线强度为变量的偏最小二乘判别分析(PLS-DA)模型, 在建立模型前分别采用标准正态变量变换(SNV)、 多元散射校正(MSC)和Savitzky-Golay卷积平滑方法进行预处理。 通过比较各种预处理方法, 得出采用SNV预处理后建立的模型效果最佳, 建模集误判个数为4个, 准确率为95.7%, 预测集误判个数为3个, 准确率为90%。 在SNV预处理方法的基础上, 分别选择竞争性自适应重加权算法(CARS)、 连续投影算法(SPA)和CARS-SPA三种波长筛选方法进行波长筛选, 比较基于不同特征波长筛选的模型效果, 结果表明, 使用CARS进行波段筛选后建立的模型效果最佳, 建模集误判个数为2个, 准确率为97.9%, 预测集的误判个数为1个, 准确率为96.7%, 模型的准确率均高于90%, 可以将不同晶粒度等级的样品进行分类。 综合分析以上判别分析模型结果, 发现结合SNV预处理和CARS波段筛选后的PLS-DA模型的准确率最高。 研究表明, 采用激光诱导击穿光谱技术结合偏最小二乘判别分析高铁车轮钢晶粒度等级具有一定可行性, 可将其用于评估车轮钢表面晶粒度等级, 同时也为LIBS技术应用于不同晶粒度等级的高铁车轮钢研究提供了一定的基础依据。
车轮钢晶粒度等级 谱线强度 LIBS Wheel steel grain size grade Spectral characteristics PLS-DA LIBS PLS-DA 光谱学与光谱分析
2022, 42(11): 3428
马铃薯黑心病是一种马铃薯主要内部缺陷, 严重损害薯条、 薯片、 全粉等加工制品的质量和产率。 目前对马铃薯的分级主要侧重于外部品质检测, 针对内部缺陷检测的研究很少。 旨在开发一种马铃薯黑心病的快速无损检测技术, 为此搭建了马铃薯可见近红外透射光谱分析平台, 分析健康与黑心病马铃薯的透射光谱特性并优化光谱判别模型参数。 基于现有马铃薯分级线和复享PG2000高速光谱仪, 采用左右透射方式(光源与光纤探头位于分级线果盘左右两侧), 采集470个马铃薯(其中健康薯234个、 黑心薯236个)的透射光谱图, 建立偏最小二乘判别模型(PLS-DA), 并利用主成分分析(PCA)与光谱形态特征相结合的方法选择特征波长, 优化模型。 分析发现, 健康薯与黑心薯的可见近红外透射光谱在吸光度值和光谱形态特征方面均存在明显区别。 黑心薯的平均光谱吸光度值高于健康薯(650~900 nm范围内), 但黑心薯的平均光谱曲线较为平缓, 无明显吸收峰, 而健康薯平均光谱曲线在665, 732和839 nm附近有明显吸收峰, 并且健康薯与黑心薯的平均光谱差值在705 nm处达到最大值。 基于PLS-DA法建立了马铃薯黑心病判别模型, 对黑心病的判别效果显著, 分类器特性曲线(ROC)下面积(AUC)值为0.994 2, 黑心薯识别总正确率能够达到97.16%, RMSECV和RMSEP分别为0.28和0.26。 此外, 成功利用PCA与光谱形态特征相结合的方法对模型进行简化, 最终得到由6个波长(658, 705, 716, 800, 816和839 nm)组成的特征波长组合, 简化后的模型总正确率能够达到96.73%, 接近全波段模型判别水平。 研究表明, 左右透射的方式能够准确识别黑心马铃薯, 实现对马铃薯内部缺陷的快速无损检测。 对我国马铃薯产业的发展起到一定的促进作用, 为马铃薯内部缺陷在线检测技术的提高提供了重要的理论基础和实践依据。
可见-近红外透射光谱 黑心病 马铃薯 主成分分析法 偏最小二乘判别法 Vis-NIR transmission spectrum Blackheart disease Potato PCA PLS-DA 光谱学与光谱分析
2021, 41(4): 1213
利用可见近红外(Vis-NIR)高光谱成像技术对完好和损伤等级灵武长枣进行快速识别检测。 采用定量损伤装置得到损伤Ⅰ, Ⅱ, Ⅲ, Ⅳ和Ⅴ级的灵武长枣, 借助高光谱成像系统采集完好长枣和损伤长枣样本高光谱图像。 提取感兴趣区域(region of interest, ROI)并计算样本平均光谱值。 利用光谱-理化值共生距离算法(SPXY)将420个长枣样本按3∶1的比例划分校正集315个和预测集105个。 灵武长枣原始光谱建立偏最小二乘判别分析(PLS-DA)分类模型, 得到校正集和预测集准确率分别为72.70%和86.67%; 灵武长枣原始光谱数据采用移动平均(MA)、 卷积平滑(SG)、 多元散射校正(MSC)、 正交信号修正(OSC)、 基线校准(baseline)和去趋势(de-trending)等方法进行光谱预处理并建立PLS-DA分类判别模型。 通过分析比较, 得到MSC-PLS-DA为最优分类判别模型, 校正集准确率为76.19%, 预测集准确率为86.67%, 其中校正集比原始光谱建模准确率提高了3.49%, 预测集准确率较原始光谱建模结果未提高; 为了提高建模效果, 对灵武长枣原始光谱和预处理后的光谱分别采用连续投影算法(SPA)、 无信息变量消除(UVE)、 竞争性自适应加权抽样(CARS)和区间变量迭代空间收缩法(iVISSA)等算法提取特征波长, 建立PLS-DA分类判别模型, 结果表明, MSC-CARS-PLS-DA为最优模型组合, 校正集准确率为77.14%, 预测集准确率为89.52%, 建模准确率较原始光谱建模准确率分别提高了4.44%和2.85%。 结果表明, Vis-NIR高光谱成像技术结合MSC-CARS-PLS-DA模型可实现灵武长枣损伤等级的快速识别。
灵武长枣 高光谱 定量损伤 等级判别 偏最小二乘判别分析(PLS-DA) Lingwu long jujube Hyperspectral Quantitative damage Level discriminant Partial least squares-discriminant analysis (PLS-D 光谱学与光谱分析
2021, 41(4): 1182
闽江学院材料工程系, 中国漆新型材料工程研究中心, 福建 福州 350108
芝麻油是日常生活中常用食用油之一, 掺假芝麻油会导致严重的健康问题。 研究芝麻油鉴定方法是非常重要的。 皂化植物油提取不皂化物是食用油鉴定的经济方法之一, 现有植物油皂化方法需要较长时间, 较高的温度, 且不皂化物提取过程非常繁琐。 采用超声技术替代常规回流加热法, 提高了皂化效率, 皂化时间缩短至10分钟, 在此基础上采用专用固相萃取(SPE)小柱快速分离不皂化物。 基于分离富集得到的植物油不皂化物红外光谱, 结合化学计量学方法进行芝麻油鉴定。 利用偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA)构建芝麻油鉴定模型。 分析结果表明: 所构建的芝麻油鉴定模型, OPLS-DA模型优于PLS-DA模型; OPLS-DA模型对芝麻油检验集样本预测准确率高。 基于植物油不皂化物红外光谱结合化学计量学方法可以准确鉴定芝麻油。
芝麻油 不皂化物 鉴定 Sesame oil Unsaponifiable Authentication FT-IR PLS-DA OPLS-DA FT-IR PLS-DA OPLS-DA
塑胶微粒原料已渗透到人类衣食住行的方方面面, 并广泛应用于能源、 工业、 农业、 交通乃至航空航天和海洋开发等各重要领域不可或缺的材料。 在利益的诱惑下, 废旧塑胶的走私现象屡禁不止。 我国作为塑胶原料进口大国, 现有检测方法耗时长, 难以实现现场检测, 因此, 开发一种用于现场的废旧塑胶微粒判别方法, 对快速通关和海关缉私有重要意义。 拉曼光谱技术具有快速、 无损、 样品用量小、 无需前处理且适应性强等优点, 已在现场快速鉴别领域得到广泛应用。 在研究塑胶废旧机理的基础上, 将拉曼光谱技术结合化学判别方法, 应用于废旧塑胶原料识别。 选取两类成分相似的实际通关塑胶原料样品, 包含标准品及废旧品各160份, 并对样品的拉曼光谱信息进行了采集。 对比分析了两种塑胶原料的原始拉曼光谱, 并对样品的拉曼光谱特征峰进行了归属分析。 选取1 603 cm-1作为归一化参照峰位, 进一步探究废旧塑胶的成分变化, 对比统计了废旧塑胶原料及标准塑胶原料的相对峰强变化, 结果表明废旧塑胶原料发生了化学老化。 基于主成分分析法(PCA)对原始拉曼光谱及预处理拉曼光谱进行降维处理, 结果表面预处理拉曼光谱的前2主成分空间分离度较好, 通过对原始拉曼光谱数据进行背景扣除及平滑预处理, 可减少荧光背景及噪声对鉴别的影响, 提高鉴别的准确度。 将样品一半划分为校正集用于模型建立, 另一半划分为预测集用于模型验证, 基于偏最小二乘判别分析(PLS-DA), 建废旧塑胶原料鉴别模型, 该模型对建模训练集鉴别正确率为100%, 模型验证集鉴别正确率为99.06%。 研究表明, 基于拉曼光谱技术, 结合测试数据预处理及偏最小二乘判别分析方法, 可以有效地实现塑胶原料的现场、 快速、 准确鉴别, 为开发现场检测装备及方法提供理论参考。
拉曼光谱 ABS塑胶 主成分分析 偏最小二乘判别法 Raman spectroscopy ABS plastic PCA PLS-DA
油类污染日渐频繁, 给人类健康及生态环境造成了严重的威胁。 因此, 研究有效的油类识别方法对保护生态环境具有重要意义。 三维荧光光谱技术是识别油类最有效的分析手段之一, 利用二阶校正方法对三维荧光光谱数据进行解析, 然后利用模式识别对二阶校正方法解析结果中的浓度得分矩阵进行分类, 可以实现对未知样本的定性识别。 然而, 此类方法在对未知样本进行分类识别的过程中, 只应用了浓度得分矩阵, 其本质上只是利用样本所含化学成分的相对含量差异对未知样本进行了分类。 并没有利用具有定性意义的载荷矩阵, 即没有从样本所含化学成分本身实现对样本的定性。 基于此, 将重构的三维荧光光谱和偏最小二乘判别分析(PLS-DA)相结合, 提出了一种针对油类样本的辨识方法。 首先, 利用四种油类(汽油、 柴油、 航空煤油和润滑油)在不同的背景环境下(纯净水、 自来水、 河水及海水配制的十二烷基硫酸钠溶剂)配制了80个油类样本; 然后, 利用FS920荧光光谱仪采集样本的三维荧光光谱数据, 并对该数据进行去散射及标准化预处理; 其次, 利用Leverage值识别并删除其中的异常光谱, 并利用平行因子分析算法(PARAFAC)对剩余的光谱进行重构; 最后, 通过PLS-DA建立重构三维荧光光谱的分类模型; 并将重构与未重构的三维荧光光谱分别建立的分类模型进行了对比。 分析结果表明, 三维荧光光谱经过重构后, 可以将四种油类的正确分类率分别从原来的100%, 50%, 60%和20%提高到100%, 100%, 100%和100%, 表明重构的三维荧光光谱具有更加明显的类内特征。 重构三维荧光光谱所建立的分类模型的灵敏度(SENS)、 特异性(SPEC)及F分数分别为100%, 100%和100%, 表明所建立的模型具有稳健及可靠的分析结果。 该研究中, 重构三维荧光光谱利用了PARAFAC解析结果中的浓度得分矩阵及载荷矩阵, 所建立的PLS-DA分类模型不仅从化学成分相对含量的差异而且从化学成分本身对样本进行了定性识别, 所得结果更加具有说服力。 该研究为油类识别提供了一种可靠的方法。
重构三维荧光光谱 油类识别 Reconstructed 3D fluorescence spectrum PARAFAC PLS-DA Oil identification PARAFAC PLS-DA 光谱学与光谱分析
2020, 40(12): 3789
中国医学科学院血液病医院(中国医学科学院血液学研究所), 实验血液学国家重点实验室, 国家血液系统疾病临床医学研究中心, 天津 300020
急性白血病的诊断基于一系列检测方法, 细胞遗传学和荧光原位杂交方法旨在鉴定涉及白血病发生过程的特定基因和染色体改变, 通过流式细胞术和分子生物学进行的免疫表型分析也是目前可用于明确诊断的检查手段。 这些检查的侵入性和时效性方面的不足促使人们寻找以拉曼光谱技术为代表的新的方法和技术, 以减少假设和诊断结论之间的时间间隔, 有利于患者获得更好的预后。 拉曼光谱技术可用来非标记识别血液中存在的血细胞和生化元素的光谱信息, 例如氨基酸、 蛋白质、 脂质、 核酸和类胡萝卜素, 并且该技术在使用细胞系、 血涂片和血清样本进行的不同类型血液学疾病的诊断中变得愈为重要, 具有广阔的应用前景。 实验研究了人急性T细胞白血病细胞系(Jurkat)、 人急性骨髓性白血病细胞系(KG-1α)、 人急性早幼粒细胞白血病细胞系(NB4)和人急性单核细胞白血病细胞系(THP-1)的拉曼光谱特征, 建立使用拉曼光谱非标记鉴别四种白血病细胞系的新方式, 为临床实验研究提供科学基础。 分别培养并收集四种急性白血病细胞系细胞, 使用Horiba Xplora拉曼光谱仪获取拉曼光谱, 每种细胞系捕获25~30个白血病细胞光谱。 联合运用主成分分析法、 偏最小二乘判别分析和聚类分析等光谱分析方法, 对四种细胞系细胞的光谱展开深入分析和建立鉴别模型, 联合两两组合分析, 对细胞光谱进行甄别。 四种细胞的拉曼光谱具有差异, 主要通过769, 826, 844, 957, 1 048, 1 141, 1 255, 1 313, 1 415, 1 539和1 575 cm-1等峰位进行区分, 反映了jurkat细胞活跃的增殖代谢, KG-1α细胞活跃的与核酸相关的能量代谢以及NB4细胞较强的细胞呼吸等生物学信息。 结果表明: 依据PLS-DA建立的拉曼光谱辨别模型能准确甄别四种急性白血病细胞, 模型具有良好的拟合稳定性、 预判能力和应用前景。
急性白血病细胞系 拉曼光谱 偏最小二乘判别分析 鉴别 Acute leukemia cell line Raman spectra PLS-DA Identification 光谱学与光谱分析
2020, 40(12): 3670
国家林业和草原局桉树研究开发中心, 广东 湛江 524022
研究桉树控制授粉后目标性状的基因作用方式是探索其基因重组规律的重要内容。 常规的数量统计分析精度往往不高, 而DNA分析的专业要求高, 且费时费力。 该研究利用近红外光谱(NIRs)研究不同基因型桉树杂交种、 亲本及杂交种与亲本间近红外光谱信息的关系, 探索NIRs用于桉树杂交种与其亲本判别的可行性和准确性。 以控制授粉的桉树亲本及其杂交F1代材料为对象, 每种基因型从各自田间试验分别选取10个单株, 采集树冠中上部新鲜健康叶片。 用手持式近红外仪Phazir Rx(1624)采集桉树杂交种与其亲本叶片的NIRs信息。 每单株选10片完全生理成熟的健康叶片, 避开叶脉扫描其正面光谱5次, 以50条NIRs信息的均值代表单个叶片的NIRs信息, 最终每个基因型获得10条NIRs信息。 对原始NIRs采用二阶多项式S.G一阶导数预处理。 预处理后的NIRs用于多元统计分析, 首先对桉树杂交亲本和子代样本进行主成分分析(PCA), 直观展示不同基因型的分类情况。 然后运用簇类独立软模式(SIMCA)和偏最小二乘判别分析(PLS-DA)两种有监督的判别模式验证NIRs用于桉树杂交种与其亲本树种的分类判别效果。 PCA结果显示, 不同的亲本间、 杂交种间及杂交种与亲本间样本的主因子得分可以清晰地将各基因型分开。 SIMCA模式判别分析中, 桉树杂交种样本到亲本PCA模型的样本距离显示, 待判别样本能够形成单独的聚类, 且能直观反映两者的遗传相似。 PLS-DA判别结果显示, 桉树杂交亲本的PLS模型能通过预测其杂交子代的响应变量将其与亲本准确分开。 结果表明, 桉树叶片的NIRs信息可以准确地反映桉树杂交子代遗传信息的传递规律, NIRs判别模型可以准确地将各种基因型予以区分。 因此, NIRs信息不仅可用于桉树杂交种和纯种的定性判别, 还可以分析桉树基因重组过程中加性遗传效应的大小, 从而为桉树遗传基础分析及其育种改良研究提供理论支撑。
有监督的模型 主成分分析(PCA) 簇类独立软模式(SIMCA) 偏最小二乘判别分析(PLS-DA) Supervised model Principal component analysis (PCA) Soft independent modeling of class analogy (SIMCA) Partial least squares-discriminant analysis (PLS-D
1 暨南大学光电工程系, 广东 广州 510632
2 广东省生物资源应用研究所, 广东 广州 510636
3 珠海大横琴科技发展有限公司, 广东 珠海 519000
目前我国蜂蜜市场掺假现象严重, 研究一种快速、 准确的方法用于市场流通领域掺假蜂蜜的鉴别具有重要的现实意义。 采用近红外光谱(NIR)结合化学计量学方法对常见的天然蜂蜜以及掺假(掺杂常见糖浆)蜂蜜进行建模识别, 并比较偏最小二乘-判别分析(PLS-DA)及支持向量机(SVM)对糖浆掺假蜂蜜鉴别模型的影响。 首先, 采集来自中国10个省份、 20种常见蜂蜜的112个天然纯蜂蜜样品, 以及6种常见糖浆样品按不同糖浆含量(10%, 20%, 30%, 40%, 50%, 60%)配制的112个掺假蜂蜜样品, 共计224个样品; 通过近红外光仪器扫描获得所有样品的近红外光谱数据(波长范围400~2 500 nm); 然后, 分别采用一阶导数(FD)、 二阶导数(SD)、 多元散射校正(MSC)、 标准正态变化(SNVT)四种方式对原始光谱进行预处理; 再结合PLS-DA和SVM建立天然蜂蜜和糖浆掺假蜂蜜的鉴别模型, 比较不同预处理方法对两种不同建模算法建立的蜂蜜掺假鉴别模型效果。 其中SVM算法的惩罚参数c和核函数参数g通过网格搜索法(GS)、 遗传算法(GA)、 粒子群算法(PSO)三种寻优算法进行优化。 分析结果表明: 光谱数据进行预处理后所建立的模型准确率均有明显提升, 而对于SVM模型, 惩罚参数c和核函数参数g对模型准确率的提升效果要比光谱预处理带来的提升效果更明显。 在PLS-DA算法中, 经FD光谱预处理后建立的模型效果最好, 最佳PLS-DA模型准确率为87.50%; 在SVM算法中, 经MSC预处理后, 再通过GS寻优, 获得惩罚参数c为3.0314, 核函数参数g为0.3298的条件下所建立的模型效果最好, 最佳SVM模型准确率为94.64%。 由此可见, 非线性的SVM算法结合NIR光谱数据所建立的天然蜂蜜与糖浆掺假蜂蜜鉴别模型要优于线性的PLS-DA模型, 同时表明NIR光谱结合化学计量学方法对常见糖浆掺杂的中国蜂蜜鉴别是可行的。
蜂蜜掺假 近红外光谱 糖浆 鉴别 Honey adulterated Near-infrared spectroscopy PLS-DA PLS-DA SVM SVM Syrups Determination 光谱学与光谱分析
2019, 39(11): 3560