1 湖北中医药大学药学院, 湖北 武汉 430065
2 湖北省中药保健食品工程技术研究中心, 湖北 武汉 430065
3 北京理工大学光电学院, 北京 100081
4 咸宁市中心医院、 湖北科技学院附属第一医院药学部, 湖北 咸宁 437100
5 华中科技大学武汉光电国家研究中心, 湖北 武汉 430074
6 华中科技大学光学与电子信息学院, 湖北 武汉 430074
7 武汉邮电科学研究院, 湖北 武汉 430074
山药为薯蓣科植物薯蓣的根茎, 其中的多糖、 多酚、 皂苷、 黏蛋白和维生素C等成分使山药具有抗肿瘤、 抗氧化、 抗炎症、 降血糖和降血脂等作用。 不同产地的山药由于生长条件存在差异, 致使药用成分含量显著不同, 结合独特的炮制工艺, 进而导致市场价格差别大, 所以山药饮片的产地识别至关重要。 为对山药饮片进行产地溯源, 本文基于激光诱导击穿光谱(LIBS)技术提出多元散射矫正-改进遗传算法-支持向量机(MSC-IGA-SVM)模型对山药产地进行精确识别。 使用八个不同产地的山药饮片进行LIBS实验, 八种产地的山药饮片磨粉过筛后制成粉末压片, 通过采集山药饮片的LIBS光谱, 分别使用单一分类器与使用光谱预处理、 特征提取及模式识别算法的模型对光谱的识别结果进行对比。 将光谱信号按2∶1的比例划分为训练集和测试集, 使用5次交叉验证K-邻近算法(KNN)模型的测试集准确率作为预处理参数优化的评价指标。 各类药材的平均光谱整体趋势一致, 所含谱峰基本相同, 但因产地不同导致峰值强度各不相同, 道地山药对一些金属元素(K, Na, Ca, Mg, Al)的富集能力大于非道地产区山药, 其中, K元素特征谱线(769.90 nm)的峰值最高, 即山药饮片中K元素含量最多, 相关研究表明山药根茎对K元素的富集能力最强。 选取35条关键谱线进行分析, 在识别种类多、 识别难度大的情况下, 改进遗传算法(IGA)比主成分分析(PCA)更能清楚辨别光谱中的非线性关系, 同时受噪声的影响更小。 MSC-IGA-SVM模型的产地溯源效果最好。 MSC-IGA-SVM模型的交叉验证集准确率为96.9%, 测试集的准确率为97.32%, 与直接使用原信号建立的最好模型支持向量机(SVM)(96.43%)相比, 测试集准确率提高了0.87%。 同时, MSC-IGA-SVM模型将输入变量的维度减少了99.93%。 结果表明, LIBS技术结合MSC-IGA-SVM模型能够快速、 准确对山药饮片进行产地溯源。
激光诱导击穿光谱 光谱预处理 特征提取 模式识别 山药 Laser-induced breakdown spectroscopy Spectral preprocessing Feature extraction Pattern recognition Rhizoma Dioscoreae
东北大学秦皇岛分校控制工程学院, 河北 秦皇岛 066000
采用衰减全反射傅里叶变换红外光谱法(ATR-FTIR), 结合多元校正模型对γ-聚谷氨酸(γ-PGA)发酵过程中两种主要底物葡萄糖和谷氨酸钠的浓度进行间接测量, 为优化发酵系统控制提供重要的反馈信息。 光谱测量中经常出现的基线漂移会严重影响后续多元校正模型的性能, 需要采用基线校正算法对光谱进行预处理。 现有流行的基线校正算法多数是基于Whittaker Smoother(WS)平滑算法, 这些算法均采用整数阶微分对拟合基线进行约束, 表达能力有限。 针对现有基线校正算法中的整数阶微分自适应性差的问题, 利用更加灵活的分数阶微分对基线进行约束, 提出了一种基于分数阶的基线校正算法, 实现对整数阶基线校正的扩展。 总共进行了5个批次的γ-PGA发酵实验, 并对不同批次和全部批次的ATR-FTIR光谱数据分别进行了分数阶基线校正, 模型的预测精度均得到不同程度的提升。 实验结果表明, 只有在批次2时, 基于整数阶的基线校正效果最好; 其他批次的基线校正效果最好时的阶次均为分数阶。 这也表明了分数阶微分(包含整数阶微分)对基线的约束更加合理。 同时发现全部批次的整体基线校正效果远远差于单一批次的效果, 原因可能是各批次发酵光谱的基线是不同的, 对不同的批次需要选用不同的阶次以获得最佳的基线校正。 此外, γ-PGA发酵样品的ATR-FTIR光谱测量是以蒸馏水为背景, 会在3 100~3 600 cm-1波数范围内出现负水峰, 形成有害的干扰信号; 分数阶基线校正后的光谱表明, 分数阶基线校正算法将负的水峰当作基线, 在一定程度上进行了消除。 综上分析, 分数阶基线校正算法不仅扩展了传统整数阶基线校正算法的应用范围, 也为消除ATR光谱中负的水峰提供了新的解决思路。
分数阶微分 光谱预处理 基线校正 Fractional differentiation Spectral preprocessing Baseline correction 光谱学与光谱分析
2022, 42(6): 1848
1 东北石油大学 电子科学学院, 黑龙江 大庆 163318
2 东北石油大学 土木建筑工程学院, 黑龙江 大庆 163318
为减小调制噪声背景的干扰, 提出了直接吸收光谱激光检测气体浓度反演的三级卷积降噪信号处理方法.以谱线6 612.939 cm-1附近氨气分子吸收为例, 分析了该降噪方法对氨气浓度反演的有效性.实验结果表明, 经三级卷积降噪后的氨气原始吸收谱线信号整体均方根误差由初始8.53降至1.01, 基线扣除归一化得到的氨气光谱吸收率谱线信噪比提高3.3倍; 连续5次测量浓度5%标准氨气, 反演浓度值平均偏差为0.0743%, 相对标准偏差为1.4%, 优于原始吸收谱线信号的小波降噪和不降噪处理反演值.采用三级卷积降噪方法预处理原始吸收谱线信号, 提高了气体浓度反演精度, 可为工业过程高浓度气体激光在线检测提供参考.
激光检测 吸收光谱 调制噪声 降噪 光谱预处理 Laser detection Absorption spectroscopy Modulation noise Denoising Spectral preprocessing
1 华东交通大学机电与车辆工程学院, 江西 南昌 330013
2 赣州出入境检验检疫局, 江西 赣州 341001
木材的种类识别是木材加工和贸易的一个重要环节, 传统的木材种类识别方法主要有显微检测法和木材纹理识别法, 其操作繁琐, 耗时长, 成本高, 不能满足当前需求。 本研究利用木材的近红外光谱(NIRS)结合模式识别方法, 以期实现木材种类的快速准确识别。 采用近红外光谱结合主成分分析法(PCA)、 偏最小二乘判别分析法(PLSDA)和簇类独立软模式法(SIMCA)三种模式识别对58种木材进行种类鉴别研究; 5点平滑、 标准正态变量变换(SNV)、 多元散射校正(MSC)、 Savitzky-Golay一阶导数(SG 1st-Der)和小波导数(WD)五种光谱预处理方法用于木材光谱的预处理; 校正集和测试集样品的正确识别率(CRR)用于模型的评价。 采用PCA方法, 通过样品的前三个主成分空间分布图分辨木材种类的聚类情况。 在建立PLSDA模型, 原始光谱的正确识别率最高, 分别为88.2%和88.2%; 5点平滑处理的光谱校正集和测试集的CRR分别为88.1%和88.2%; SNV处理的光谱校正集和测试集的CRR分别为84.4%和84.5%; MSC处理的光谱校正集和测试集的CRR分别为83.1%和84.2%; SG 1st-Der处理的光谱校正集和测试集的CRR分别为81.8%和82.7%; WD(小波基为“Haar”, 分解尺度为80)处理的光谱校正集和测试集的CRR分别为87.3%和87.2%。 可知, 在PLSDA模型中, 木材光谱未经预处理种类识别效果最后好。 在建立SIMCA模型过程中, 原始光谱的校正集和测试集的CRR分别为99.7%和99.4%; 5点平滑处理的光谱校正集和测试集的CRR分别为100%和100%; SNV处理的光谱校正集和测试集的CRR分别为99.5%和99.1%; MSC处理的光谱校正集和测试集的CRR分别为99.0%和98.4%; SG 1st-Der的光谱校正集和测试集的CRR分别为81.8%和82.7%; WD处理的光谱校正集和测试集的CRR分别为100%和100%。 可知, 在SIMCA模型中, 木材光谱经平滑和小波导数处理后的识别效果最好, 且光谱的校正集和测试集CRR都为100%。 采用三种模式结合五种不同的预处理方法对木材近红外光谱进行定性建模识别时, 由于木材样本属性复杂, 主成分分布图相互交织, PCA无法识别出58种木材; 原始光谱的PLSDA模型可以得到较好的判别模型, 但校正集和测试集的CRR只有88.2%和88.2%; 木材光谱经过5点平滑或WD预处理后的SIMCA模型可达到最好的识别效果, 校正集和测试集的CRR均为100%, 且WD-SIMCA模型因子数比5点平滑SIMCA模型小, 模型更为简化, 故WD-SIMCA为58种木材种类识别的最优模型。 研究表明光谱预处理方法可以有效的提高木材种类识别精度, 有监督模式识别方法SIMCA可以用来建立有效的木材识别模型, 近红外光谱结合模式识别可以为木材种类的识别提供一种快速简便的分析方法。
近红外光谱 木材种类识别 光谱预处理 偏最小二乘判别分析法 簇类独立软模式法 Near infrared spectroscopy (NIRS) Identification of wood species Spectral preprocessing Partial least squares discriminate analysis (PLSDA Soft independent modeling of class analogy (SIMCA)
1 中国科学院合肥物质科学研究院离子束生物工程学重点实验室
2 中国科学院合肥物质科学研究院技术生物与农业工程研究所,合肥 230031
对单粒种子样品成分进行快速无损检测,对于作物遗传育种研究有着重要意义。本文采用近红外光谱技术(NIR)和偏最小二乘回归法(PLSR),研究了水稻种子的近红外光谱特性及其与直链淀粉、蛋白质含量的关系,建立了基于NIR的水稻种子成分快速检测模型。通过比较几种不同的光谱预处理方法对于单粒和群体样品模型的效果,对模型进行了优化。结果显示,多元散射校正(MSC)对单粒样品模型的优化作用显著,而一阶导数对单粒和群体样品模型改善都有明显的效果。模型评价参数显示,预测效果良好,为基于NIR的水稻单粒种子成分分析提供技术支撑。
近红外光谱 成分预测 偏最小二乘回归 光谱预处理 单粒种子 NIR spectroscopy component prediction PLSR spectral preprocessing single grain
1 中国矿业大学信息与电气工程学院, 江苏 徐州221008
2 河北出入境检验检疫局京唐港办事处, 河北 唐山063611
3 唐山学院环境与化学工程系, 河北 唐山063000
为了减少因煤样粒度而产生的光谱采集误差, 研究0.2, 1, 3和13 mm粒度等级下的煤质近红外分析模型。 采用PCA方法提取特征信息, 建立基于GA-BP和GA-Elman神经网络算法的定量分析模型。 实验结果表明, 经数据归一化与多元散射校正预处理后, 0.2 mm粒度等级的光谱与煤炭标准之间的相关性最强, 模型的学习精度最高; 经平滑处理后1 mm粒度等级的分析结果最佳。 平滑法对特征谱峰不明显的光谱的预处理效果较差, 多元散射校正方法的适用性最强。 在0.2 mm粒度等级下原光谱的信息准确度最高, 1和3 mm其次, 13 mm最差。 煤样粒度越大, 光谱的不稳定因素越多, 从而导致分析模型的负面影响增加。
近红外光谱分析技术 煤粒度 光谱预处理 定量分析模型 NIRS Coal particle size Spectral preprocessing Quantitative analytical model