作者单位
摘要
新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054新疆维吾尔自治区重点实验室“新疆干旱区湖泊环境与资源实验室”, 新疆 乌鲁木齐 830054
高光谱数据中存在的大量冗余信息对高光谱估测精度产生较大影响。 旨在寻求特征波段筛选的最佳算法, 以实现土壤重金属铅含量的准确监测, 为土壤污染防治提供参考。 以新疆渭干河-库车河三角洲绿洲土壤重金属铅含量与光谱数据为数据源, 利用蒙特卡洛交叉验证(MCCV)算法确定92个有效土壤样品, 通过相关分析选取倒数对数一阶微分变换处理的光谱数据, 采用随机蛙跳(RF)算法, 并结合竞争性自适应重加权(CARS)算法、 迭代保留有效信息变量(IRIV)算法及连续投影算法(SPA), 构建RF-CARS、 RF-IRIV及RF-SPA三种算法对波段进行筛选。 以倒数对数一阶微分变换处理下的特征波段反射率为自变量, 土壤重金属铅含量为因变量, 采用极端梯度提升(XGBoost)和地理加权回归(GWR)方法构建土壤重金属铅含量估测模型。 结果表明: (1)光谱变换处理可有效增强光谱与土壤铅含量的敏感性, 其中倒数对数一阶微分变换后的土壤光谱特征更为明显, 相关系数可达到0.620(p<0.001)。 (2)RF-CARS、 RF-IRIV及RF-SPA算法分别从高光谱数据中筛选出6、 9和7个特征波段, 全部位于近红外光谱区域, 3种算法具有较强的特征提取能力, 极大减少光谱数据中的冗余信息。 (3)基于RF-IRIV算法构建的土壤铅含量估测模型的精度和稳定性高于RF-CARS和RF-SPA算法构建的模型, 说明RF-IRIV算法能更为准确的保留与土壤铅含量相关的波段。 此外, GWR模型的性能优于XGBoost模型, 构建的RF-IRIV-GWR模型具有较好的预测能力, 可作为研究区土壤铅含量的最优估测模型, 其验证集的决定系数(R2)为0.892, 均方根误差(RMSE)为0.825 mg·kg-1, 相对分析误差(RPD)为3.09。 基于随机蛙跳(RF)与迭代保留有效信息变量(IRIV)算法, 结合地理加权回归(GWR)建模方法在快速准确估测土壤铅含量方面具有一定优势, 可进行土壤重金属污染的动态监测。
特征波段 随机蛙跳算法 竞争性自适应重加权算法 迭代保留有效信息变量算法 连续投影算法 极端梯度提升 地理加权回归 土壤铅 Feature band Random frog algorithm Competitive adaptive reweighted sampling algorithm Iteratively retaining informative variables algori Successive projections algorithm Extreme gradient boosting Geographically weighted regression Soil lead 
光谱学与光谱分析
2023, 43(10): 3302
作者单位
摘要
1 华东交通大学电气与自动化工程学院, 江西 南昌 330013
2 华东交通大学土木建筑学院, 江西 南昌 330013
土壤养分直接关系到作物产量与品质状况, 然而传统化学方法检测存在化学试剂消耗大、 耗时费力等问题, 不能满足精细农业的需求。 快速获取土壤养分信息是发展精细农业、 绿色农业的关键, 想要了解土壤肥力状况, 必须先了解有机质和总氮的含量状况。 许多研究表明, 长波近红外光谱被广泛应用于土壤检测领域, 然而短波可见/近红外光谱在土壤有机质和总氮的研究上却非常罕见。 以江西省吉安市安福县和南昌市新建区的四个村庄作为研究区, 根据2×2网格法采集了深度为10~30 cm的棕壤、 红壤和水稻土三种最为典型的土壤样品共180份。 经过研磨、 风干等处理后用四分法均匀划分为两份, 用于测定样品光谱信息和理化信息。 将土壤样品按照2∶1(120∶60)划分为建模集和预测集。 考虑到首尾端波段噪声较大, 故去除325~349和1 051~1 075 nm波段, 将350~1 050 nm波段用于光谱分析。 通过连续投影算法(SPA)筛选出有机质12个特征波长点, 总氮11个特征波长点, 考虑到土壤光谱信息与土壤理化性质之间可能存在非线性联系, 建立全波段与特征波长的线性偏最小二乘回归(PLSR)模型和非线性最小二乘支持向量机(LS-SVM)模型对土壤有机质和总氮进行研究, LS-SVM模型采用两步网格搜索法优化了两个超参数γ和σ2。 研究结果表明: (1)土壤的光谱反射率随波长增加反射率升高, 反射率曲线中460、 550、 580、 740和900 nm处有较为明显的吸收特征。 (2)从PLSR模型和LS-SVM模型结果分析可知, 非线性模型LS-SVM具有更好的预测精度, 分析认为土壤光谱信息与土壤理化性质之间存在一些非线性关系。 (3)通过连续投影算法筛选的特征波长提高了模型精度, 优化了模型运行效率。 SPA-LS-SVM模型是所有模型中最优的预测模型, 其中有机质模型的R2pre为0.884 7, RMSEp为0.104 8, RPD为2.945 0, 总氮模型的R2pre为0.901 8, RMSEp为0.010 4, RPD为3.191 1。 (4)本研究说明可见/近红外光谱能够用于测量不同类型的土壤有机质和总氮含量, 并且达到较好的预测效果。 可见/近红外光谱在土壤检测领域具有巨大潜力。
土壤有机质 总氮 连续投影算法 偏最小二乘回归 最小二乘支持向量 Soil organic matter Total nitrogen Successive projections algorithm Partial least squares regression Least-squares support vector machine 
光谱学与光谱分析
2023, 43(7): 2226
作者单位
摘要
华侨大学机电及自动化学院,福建 厦门 361021
为了提高可见-近红外(Vis-NIR)光谱法检测水质pH值的精度和稳定性,基于连续投影算法(SPA)和粒子群优化-最小二乘支持向量机(PSO-LSSVM)建立了多元校正模型。采集60个不同pH值水溶液样品的Vis-NIR光谱数据,运用Savitzky-Golay卷积平滑和标准正态变量变换对原始光谱数据进行预处理。基于SPA筛选的特征波长和PSO算法自动优化LSSVM的建模参数,建立多元非线性校正模型。结果表明,相比于其他对比模型,SPA-PSO-LSSVM模型具有更高的精度与更优的稳定性,验证集的均误差方根为0.67、决定系数为0.91,剩余预测偏差为3.10。
光谱学 可见-近红外光谱 连续投影算法 粒子群优化 最小二乘支持向量机 
激光与光电子学进展
2023, 60(1): 0130002
作者单位
摘要
1 江西生物科技职业学院, 江西 南昌 330013
2 华东交通大学电气与自动化工程学院, 江西 南昌 330013
鱼类产品的新鲜程度研究一直是重要的课题, 其中挥发性盐基总氮(TVB-N)是一项重要指标, 该指标已列入我国食品卫生标准, 一般在低温条件下, 鱼类挥发性盐基氮的量达到30 mg/100 g时, 即认为是肉质变质的标志。 传统的物理检测方法不能够实现定量检测, 化学检测法则耗时长, 且需要专业人员进行破坏式检测。 为了克服传统光谱检测技术无法检测分析外部空间属性的缺点, 该实验采用波长范围在900~1 700 nm高光谱成像结合化学计量法实现了三文鱼的TVB-N含量检测。 首先对从市场买的新鲜三文鱼按照背面和反面(腹部)进行分割处理, 背面和反面(腹部)再10等分, 每条三文鱼制作成20个样本, 一共100个样本, 其中75个样本用于校正集, 25个样本用于预测集。 然后用高光谱成像系统采集三文鱼鱼样本的光谱数据, 再通过蒸馏法测定三文鱼TVB-N的含量, 并建立其理化值样本, 然后分别采用最小二乘支持向量机(LS-SVM)和偏最小二乘(PLS)模型对100个样本光谱全波长数据进行三文鱼TVB-N建模分析。 LS-SVM模型和PLS模型预测决定系数(R2)分别为0.918和0.907, 预测均方根误差(RMSEP)分别为2.312%和2.751%。 为了进一步提高运算效率和优化模型, 对全谱数据利用连续投影算法(SPA)提取到8个特征波长(956, 1 013, 1 152, 1 210, 1 286, 1 301, 1 397和1 464 nm), 基于8个特征波长分别建立SPA-LS-SVM和SPA-PLS模型, 模型预测决定系数(R2)分别为0.903和0.901, RMSEP分别为2.761%和2.801%, SPA-LS-SVM模型的结果优于SPA-PLS。 最后SPA-LS-SVM模型因其可靠性和有效性而被选择为最适合TVB-N预测模型, 基于图像处理编程技术将高光谱图像中的每个像素转换成相应的TVB-N值并以不同颜色表示, 实现了三文鱼肉TVB-N含量的可视化, 可以很形象的表达三文鱼的TVB-N的含量分布情况。 实验说明, 可利用高光谱成像技术预测三文鱼的TVB-N含量预测, 这为水产品的自动加工和分类奠定了基础, 渔业可以从高光谱技术中获益。
三文鱼 TVB-N含量 最小二乘支持向量机(LS-SVM) 偏最小二乘(PLS) 可视化 连续投影算法(SPA) Hyperspectral imaging Salmon fish TVB-N Partial least square (PLS) Least square support vector machine (LS-SVM) Visualizing Successive projections algorithm (SPA) 
光谱学与光谱分析
2021, 41(8): 2586
作者单位
摘要
1 南京理工大学 能源与动力工程学院,江苏 南京 210094
2 北京航空航天大学 仪器科学与光电工程学院,北京 100191
空中目标在相对稳定的状态下具有确定的光谱辐射特性,因而可以利用光谱达到识别其型号的目的。首先,通过建立空中目标光谱辐射特性计算模型,获得了其归一化光谱辐射亮度数据。然后,利用连续投影算法对光谱进行特征波长提取,在保留一定精度的同时有效减少了所需数据量。最后,使用区分能力更强的混合光谱相似性测度SID (TAN)匹配光谱,研究在3~5 μm波段和8~14 μm波段两个大气窗口内,光谱辐射特性在不同飞行高度和飞行时间下的变化规律。结果表明:飞行高度对光谱辐射特性的影响大于飞行时间;3~5 μm波段的变化较8~14 μm波段明显。因此在建立光谱数据库时,为了提高识别的准确率,相对于8~14 μm波段,3~5 μm波段更需要考虑不同因素对光谱辐射特性的影响;相对于飞行时间,应尽可能多地选取不同飞行高度下的光谱作为参考光谱。
参考光谱 特征波长 连续投影算法 混合光谱相似性测度 光谱辐射特性 reference spectrum characteristic wavelengths successive projections algorithm hybrid spectral similarity measure spectral radiation characteristics 
红外与激光工程
2021, 50(4): 20200250
作者单位
摘要
1 华中农业大学工学院, 湖北 武汉 430070
2 农业部长江中下游农业装备重点实验室, 湖北 武汉 430070
为了研究贮藏期与淡水鱼鱼肉质构品质的相关关系,以武昌鱼为研究对象,建立了近红外光谱淡水鱼鱼肉质构品质的快速无损检测模型。利用AntarisⅡ傅里叶变换近红外光谱仪采集武昌鱼鱼肉样本的光谱数据,并使用TMS-PRO型质构仪测量样本的硬度值、弹性值和咀嚼性值;采用S-G平滑法对原始光谱进行预处理,结合竞争性自适应重加权(CARS)算法、稳定性竞争自适应重加权采样(SCARS)算法和连续投影(SPA)算法进行一次特征波长的提取。基于上述3项质构指标建立的最小偏二乘回归(PLSR)模型,在一次特征波长提取的基础上再结合SPA算法进行二次特征波长的提取,根据二次特征提取的最优波长建立淡水鱼鱼肉硬度、弹性和咀嚼性的最优模型,该模型校正集的相关系数Rc分别为0.968、0.947、0.927,预测集的相关系数Rp分别为0.964、0.939、0.926,校正集的均方根误差RMSEC分别为0.753、0.827、0.986,预测集的均方根误差RMSEP分别为0.846、0.897、0.964。研究结果表明,该方法适用于淡水鱼鱼肉贮藏期质构品质的快速无损检测,具有较高的准确度,可为后续淡水鱼鱼肉品质的在线检测提供帮助。
光谱学 近红外光谱 无损检测 淡水鱼 质构品质 连续投影算法 偏最小二乘回归 
激光与光电子学进展
2021, 58(12): 1230001
作者单位
摘要
华东交通大学光机电技术及应用研究所, 江西 南昌 330013
茶叶叶片叶绿素含量的准确监测对茶树的营养状况和生长态势具有重要意义,为此基于叶绿素荧光光谱技术提出一种快速无损检测叶片叶绿素含量的方法。利用叶绿素荧光采集装置对茶叶叶片进行光谱采集,并测量叶绿素相对含量。采用S-G(Savitzky-Golay)平滑法对光谱进行预处理,可以消除大量的噪声信号;对所提方法与传统方法进行比较。实验结果表明,采用所提方法能够有效消除无关变量,对模型的优化可以得到较好的效果;简化变量后所建立的偏最小二乘模型在预测集上的相关系数为0.96,方均根误差为0.87,在建模集上的相关系数为0.96,方均根误差为0.95;荧光光谱结合化学计量学方法可以为茶叶叶片叶绿素含量的定量分析提供一种快速简便的分析方法。
光谱学 荧光光谱 连续投影算法 后向区间偏最小二乘法 叶绿素 
激光与光电子学进展
2021, 58(8): 0830001
作者单位
摘要
浙江大学控制科学与工程学院, 工业控制技术国家重点实验室, 浙江 杭州 310027
快速、 有效地识别饮用水中污染物类别对于降低突发饮用水污染事件影响十分重要。 目前基于紫外-可见光光谱法的饮用水污染物判别模型大多使用主成分分析(PCA)进行特征提取, 然而, 对于光谱相似度较高的有机污染物, 仅从数据驱动的角度提取其方差最大的方向作为特征进行识别效果往往不佳。 针对有机污染物光谱数据多重共线性以及谱峰重叠干扰的问题, 开展了基于连续投影算法(SPA)和多分类支持向量机(M-SVM)的紫外-可见光光谱饮用水有机污染物判别方法研究。 首先, 使用紫外光谱仪测量苯酚、 对苯二酚、 间苯二酚和间苯二胺的原始光谱数据并进行预处理, 在对四种污染物进行了波长与浓度的相关关系对比分析后, 发现苯酚和间苯二酚、 对苯二酚和间苯二胺的谱峰重叠较为严重; 特征提取时, 引入SPA筛选有机污染物紫外-可见光光谱数据的特征波长组合, 并对不同波长个数时的光谱吸光度进行多元线性回归分析, 选取对应最小预测标准偏差的参数及波段组合作为最优参数组合; 基于最优特征波长组合, 构建基于多分类SVM的饮用水有机污染物分类识别模型; 最后, 对比分析了全光谱、 PCA及SPA特征提取后的光谱数据在不同分类方法及不同污染物浓度下的分类效果, 进一步说明了SPA的适用性和稳定性。 实验结果表明, SPA作为一种提取光谱数据原始特征波段的方法, 可以有效的对有机污染物的紫外-可见光光谱进行特征提取, 提升不同物质之间的差异, 在一定程度上消除多重共线性和谱峰重叠干扰, 从而提高分类模型的准确率。 该方法对于解决饮用水中谱峰重叠的污染物类型判别问题具有参考价值。
紫外-可见光光谱 有机污染物判别 连续投影算法 多分类支持向量机 UV-Vis spectroscopy Identification of organic contaminants Successive projections algorithm Multi-classification support vector machine 
光谱学与光谱分析
2020, 40(7): 2267
孟诗语 1,*黄英来 1赵鹏 1李超 1[ ... ]徐艳 3
作者单位
摘要
1 东北林业大学信息与计算机工程学院, 黑龙江 哈尔滨 150040
2 东北林业大学材料科学与工程学院, 黑龙江 哈尔滨 150040
3 良匠古筝制作研究院有限公司, 江苏 扬州 225001
目前, 我国乐器制作行业在古筝面板用木材等级的筛选上主要依赖于技师主观评判, 但此法缺少科学理论的依据, 效率低, 客观性及出材率的提高等方面受到限制, 无法满足乐器市场的大量需求。 实现古筝面板用木材快速、 智能化的分级工作是一个急需解决的课题。 近红外光谱非常适用于测量含氢的有机物质。 古筝面板木材主要化学成分的化学键均由含氢基团组成, 不同等级板材的化学成分存在差异, 这些差异反映在近红外光谱中, 为判断木材等级提供了可能。 同时卷积神经网络对非线性数据具有较强的特征提取能力, 所以提出一种应用卷积神经网络模型对光谱数据进行分析的方法, 进而判别木材的等级。 应用了Savitzky Golay一阶、 二阶微分两种预处理方法和核主成分分析、 连续投影算法两种数据压缩方法, 通过所设计的卷积神经网络模型以样本识别准确率和模型构建过程中的损失值作为判定指标选出最佳预处理和数据压缩方法。 为了提高模型提取分析光谱数据的能力和避免过拟合现象, 应用了多通道卷积核、 批量归一化和early stopping策略, 将通过两层卷积层提取的特征信息送入全连接层, 从而充分提取剩余信息, 通过Softmax函数获得板材的最终预测等级, 从而确定了最终模型。 最终Savitzky Golay一阶微分和核主成分分析为最佳数据处理方法, 同时得出用于区分不同等级的古筝面板用木材的主要关键谱带, 分别为1 163~1 243, 1 346~1 375和1 525~1 584 nm。 将该模型应用于测试集样本, 古筝面板用木材的等级识别准确率为95.5%。 实验结果表明所提出的方法可以高效地处理光谱数据, 有效识别区分不同等级的古筝面板用木材的关键特征, 从而为广阔的乐器市场提供一定的技术支持。
卷积神经网络 核主成分分析 连续投影算法 古筝面板 Convolutional neural network Kernel principal component analysis Successive projections algorithm Chinese zither panels 
光谱学与光谱分析
2020, 40(1): 284
作者单位
摘要
1 中国农业大学信息与电气工程学院食品质量与安全北京实验室, 北京 100083
2 中国农业大学烟台研究院, 山东 烟台 264000
3 苏州大学基础医学与生物科学学院, 江苏 苏州 215200
4 中国农业大学工学院, 北京 100083
应用紫外(Ultraviolet, UV)光谱技术对水产养殖水质总氮含量进行快速检测。 为了消除各种系统误差与偶然误差对模型预测性能造成的影响, 将88个水样的总氮浓度实测值数据和光谱吸光度数据作为原始数据, 将模型建立分为样本集划分、 数据预处理、 特征波段提取、 模型选择与LV数量选择5个阶段, 以求达到最优预测效果, 其中前4个阶段分别使用多种方法进行比较。 结果证明每个阶段都是必不可少的, 只有通过对比其优劣才能找到最适合总氮含量测定的建模过程及方法。 首先用浓度梯度(CG)法对原始数据进行相同的样本集划分处理, 然后在此基础上分别建立主成分回归(PCR)、 逐步回归(SR)和偏最小二乘回归(PLSR)三种模型, 选择预测效果最好的PLSR作为本文的预测模型。 PLSR的建模效果会在很大程度上受到潜在变量(LVs)数量的影响, 通常选取模型预测均方根误差RMSEP值最小时所对应的LV个数为最优LV个数。 其次, 选用CG法、 随机抽样(RS)法、 Kennard Stone(KS)法和SPXY法4种样本集划分算法对样本进行处理, 并对所建立的PLSR模型预测效果进行比较, 最终选择SPXY算法作为最优样本划分算法。 然后在对样本集进行SPXY法划分的基础上, 运用多种预处理算法对光谱吸光度数据进行预处理, 包括小波变换(WT)、 一阶导数法(Der1st)与二阶导数法(Der2nd)三种单一算法和小波变换与两种导数法的组合预处理算法WT-Der1st和WT-Der2nd。 然后在预处理的基础上分别使用连续投影变换(SPA)和逐步回归(SR)两种特征波段提取方法, 对比可知, SPA特征提取方法比SR的提取效率高且建模效果好。 SPA算法既可以大大地简化模型, 又可以在一定程度上提升模型的预测精度。 基于WT-Der1st-SPA提取的特征波段为218 nm, 与总氮特征波段区间相一致, 由此说明该方法比较科学。 综合上述建立的10个PLSR模型, 考虑到预测精度与模型复杂度2个因素, 最终选择基于WT-Der1st-SPA建立的PLSR模型作为最优模型, 该模型预测决定系数r2为0.996, 预测均方根误差RMSEP为0.042 mg·L-1。 由此可见, 所建立的模型预测效果非常好, 可以快速准确地测定水体的总氮含量, 为实现光谱技术在水产养殖其他水质监测指标的在线检测以及快速测定提供了经验。
紫外光谱 总氮 小波变换 连续投影变换 潜在变量 偏最小二乘回归 Ultraviolet spectroscopy Total nitrogen Wavelet transform Successive projections algorithm Latent values (LVs) Partial least squares regression (PLSR) 
光谱学与光谱分析
2020, 40(1): 195

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!