作者单位
摘要
新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054新疆维吾尔自治区重点实验室“新疆干旱区湖泊环境与资源实验室”, 新疆 乌鲁木齐 830054
高光谱数据中存在的大量冗余信息对高光谱估测精度产生较大影响。 旨在寻求特征波段筛选的最佳算法, 以实现土壤重金属铅含量的准确监测, 为土壤污染防治提供参考。 以新疆渭干河-库车河三角洲绿洲土壤重金属铅含量与光谱数据为数据源, 利用蒙特卡洛交叉验证(MCCV)算法确定92个有效土壤样品, 通过相关分析选取倒数对数一阶微分变换处理的光谱数据, 采用随机蛙跳(RF)算法, 并结合竞争性自适应重加权(CARS)算法、 迭代保留有效信息变量(IRIV)算法及连续投影算法(SPA), 构建RF-CARS、 RF-IRIV及RF-SPA三种算法对波段进行筛选。 以倒数对数一阶微分变换处理下的特征波段反射率为自变量, 土壤重金属铅含量为因变量, 采用极端梯度提升(XGBoost)和地理加权回归(GWR)方法构建土壤重金属铅含量估测模型。 结果表明: (1)光谱变换处理可有效增强光谱与土壤铅含量的敏感性, 其中倒数对数一阶微分变换后的土壤光谱特征更为明显, 相关系数可达到0.620(p<0.001)。 (2)RF-CARS、 RF-IRIV及RF-SPA算法分别从高光谱数据中筛选出6、 9和7个特征波段, 全部位于近红外光谱区域, 3种算法具有较强的特征提取能力, 极大减少光谱数据中的冗余信息。 (3)基于RF-IRIV算法构建的土壤铅含量估测模型的精度和稳定性高于RF-CARS和RF-SPA算法构建的模型, 说明RF-IRIV算法能更为准确的保留与土壤铅含量相关的波段。 此外, GWR模型的性能优于XGBoost模型, 构建的RF-IRIV-GWR模型具有较好的预测能力, 可作为研究区土壤铅含量的最优估测模型, 其验证集的决定系数(R2)为0.892, 均方根误差(RMSE)为0.825 mg·kg-1, 相对分析误差(RPD)为3.09。 基于随机蛙跳(RF)与迭代保留有效信息变量(IRIV)算法, 结合地理加权回归(GWR)建模方法在快速准确估测土壤铅含量方面具有一定优势, 可进行土壤重金属污染的动态监测。
特征波段 随机蛙跳算法 竞争性自适应重加权算法 迭代保留有效信息变量算法 连续投影算法 极端梯度提升 地理加权回归 土壤铅 Feature band Random frog algorithm Competitive adaptive reweighted sampling algorithm Iteratively retaining informative variables algori Successive projections algorithm Extreme gradient boosting Geographically weighted regression Soil lead 
光谱学与光谱分析
2023, 43(10): 3302
作者单位
摘要
1 齐鲁工业大学(山东省科学院), 山东省科学院海洋仪器仪表研究所, 山东 青岛 266061
2 齐鲁工业大学(山东省科学院), 山东省科学院海洋仪器仪表研究所, 山东 青岛 266061中国石油大学(华东)计算机科学与技术学院, 山东 青岛 266590
海洋沉积物的粒度研究有助于了解人类活动对自然环境的影响。 将主成分分析(PCA)和连续投影算法(SPA)融合能够综合利用两种光谱特征提取方法的优势, 获得比单一特征提取方法更丰富的特征波长, 实现无关特征和干扰信息的剔除, 最大限度减少特征信息的丢失, 有利于沉积物粒度的分析。 以青岛市东大洋村潮间带表层32份沉积物为例, 将海洋沉积物划分为0.3~0.2、 0.2~0.1、 0.1~0.075和<0.075 mm四个不同粒径的沉积物样品, 分别测定不同粒径的32份沉积物的可见-近红外反射光谱, 共计128条光谱。 将128条光谱数据分别以2∶1, 1∶1和1∶2的比例划分建模集和检验集进行分析; 采用主成分分析和连续投影融合算法(FOPAS )提取不同粒径沉积物的特征光谱, 利用支持向量机算法建立粒径分类模型。 结果显示, 对2∶1、 1∶1、 1∶2比例的数据集, 融合算法检验集正确率分别为83.33%、 82.81%、 75.29%, 仅在2∶1比例下正确率低于连续投影算法检验集的正确率90.47%, 其余正确率相对于单一特征提取算法均有显著的提高, 表明使用融合算法提取特征光谱建立的分类模型在训练集样本量少, 粒径清晰的条件下, 其分类模型相较于单独使用两个特征提取算法的模型更具有优势。 采用基于主成分分析和连续投影融合算法的海洋沉积物粒度分类模型, 能够提高海洋沉积物粒度分类结果的正确率, 建立正确率更高的粒度分类模型, 对快速粒度分类提供了解决方法。
海洋沉积物 粒度分类 主成分分析 连续投影算法 融合算法 Marine sediments Particle size classification Principal component analysis Successive projection algorithm Fusion algorithm 
光谱学与光谱分析
2023, 43(10): 3075
作者单位
摘要
1 华东交通大学电气与自动化工程学院, 江西 南昌 330013
2 华东交通大学土木建筑学院, 江西 南昌 330013
土壤养分直接关系到作物产量与品质状况, 然而传统化学方法检测存在化学试剂消耗大、 耗时费力等问题, 不能满足精细农业的需求。 快速获取土壤养分信息是发展精细农业、 绿色农业的关键, 想要了解土壤肥力状况, 必须先了解有机质和总氮的含量状况。 许多研究表明, 长波近红外光谱被广泛应用于土壤检测领域, 然而短波可见/近红外光谱在土壤有机质和总氮的研究上却非常罕见。 以江西省吉安市安福县和南昌市新建区的四个村庄作为研究区, 根据2×2网格法采集了深度为10~30 cm的棕壤、 红壤和水稻土三种最为典型的土壤样品共180份。 经过研磨、 风干等处理后用四分法均匀划分为两份, 用于测定样品光谱信息和理化信息。 将土壤样品按照2∶1(120∶60)划分为建模集和预测集。 考虑到首尾端波段噪声较大, 故去除325~349和1 051~1 075 nm波段, 将350~1 050 nm波段用于光谱分析。 通过连续投影算法(SPA)筛选出有机质12个特征波长点, 总氮11个特征波长点, 考虑到土壤光谱信息与土壤理化性质之间可能存在非线性联系, 建立全波段与特征波长的线性偏最小二乘回归(PLSR)模型和非线性最小二乘支持向量机(LS-SVM)模型对土壤有机质和总氮进行研究, LS-SVM模型采用两步网格搜索法优化了两个超参数γ和σ2。 研究结果表明: (1)土壤的光谱反射率随波长增加反射率升高, 反射率曲线中460、 550、 580、 740和900 nm处有较为明显的吸收特征。 (2)从PLSR模型和LS-SVM模型结果分析可知, 非线性模型LS-SVM具有更好的预测精度, 分析认为土壤光谱信息与土壤理化性质之间存在一些非线性关系。 (3)通过连续投影算法筛选的特征波长提高了模型精度, 优化了模型运行效率。 SPA-LS-SVM模型是所有模型中最优的预测模型, 其中有机质模型的R2pre为0.884 7, RMSEp为0.104 8, RPD为2.945 0, 总氮模型的R2pre为0.901 8, RMSEp为0.010 4, RPD为3.191 1。 (4)本研究说明可见/近红外光谱能够用于测量不同类型的土壤有机质和总氮含量, 并且达到较好的预测效果。 可见/近红外光谱在土壤检测领域具有巨大潜力。
土壤有机质 总氮 连续投影算法 偏最小二乘回归 最小二乘支持向量 Soil organic matter Total nitrogen Successive projections algorithm Partial least squares regression Least-squares support vector machine 
光谱学与光谱分析
2023, 43(7): 2226
作者单位
摘要
1 云南师范大学 物理与电子信息学院,云南 昆明 650000
2 云南省博物馆,云南 昆明 650000
茶染作为植物染色的一大门类,同时具有良好的环保性能和深厚的文化底蕴。为了能够准确描述茶叶染色的光谱变化,本文研究茶染后宣纸的光谱反射率与茶叶浓度的关系。首先采用分光光度计测量400~700 nm波段被茶叶染色后宣纸的光谱反射率,分别基于偏最小二乘回归模型、BP神经网络和连续投影算法(SPA)选择特征波段建立光谱信息与茶叶浓度之间关系的预测模型。然后以光谱反射率作为输入变量,对茶叶浓度进行预测。结果表明:基于偏最小二乘法、BP神经网络和连续投影算法 选择特征波段建立模型,通过茶染宣纸的光谱反射率来预测茶叶浓度具有较高的稳健性和可信度,其中SPA-BP神经网络模型的效果最优,平均预测正确率为98.40%,决定系数为0.9910,均方根误差为0.8433。这说明通过茶染宣纸的光谱数据来预测茶叶浓度具有可行性。
光谱反射率 茶染 偏最小二乘法 BP神经网络 连续投影算法 spectral reflectivity tea dyeing partial least squares BP neural networks continuous projection algorithm 
光学仪器
2023, 45(4): 71
作者单位
摘要
华侨大学机电及自动化学院,福建 厦门 361021
为了提高可见-近红外(Vis-NIR)光谱法检测水质pH值的精度和稳定性,基于连续投影算法(SPA)和粒子群优化-最小二乘支持向量机(PSO-LSSVM)建立了多元校正模型。采集60个不同pH值水溶液样品的Vis-NIR光谱数据,运用Savitzky-Golay卷积平滑和标准正态变量变换对原始光谱数据进行预处理。基于SPA筛选的特征波长和PSO算法自动优化LSSVM的建模参数,建立多元非线性校正模型。结果表明,相比于其他对比模型,SPA-PSO-LSSVM模型具有更高的精度与更优的稳定性,验证集的均误差方根为0.67、决定系数为0.91,剩余预测偏差为3.10。
光谱学 可见-近红外光谱 连续投影算法 粒子群优化 最小二乘支持向量机 
激光与光电子学进展
2023, 60(1): 0130002
作者单位
摘要
1 黑龙江八一农垦大学信息与电气工程学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学工程学院, 黑龙江 大庆 163319
目前, 近红外光谱(NIRS)可以实现种子活力的快速、 无损检测, 但区分的活力等级一般少于3级且精度不高。 建立种子活力多等级、 高精度的NIRS检测模型, 解决活力等级增加与预测模型精度之间的矛盾是现阶段近红外种子活力检测的主要任务。 以玉米种子为研究对象, 采用人工老化的方法获得5种活力等级的种子样本并采集对应的光谱数据建立反向神经网络(BP)预测模型。 为了提高模型的精度和稳健性, 提出一种耦合平均影响值-连续投影特征波长提取算法(MIVopt-SPAsa)。 该算法针对连续投影算法(SPA)耗时过长的问题, 采用平均影响值算法(MIV)对其预降维。 MIV方法实现了对波长影响值的排序, 但缺乏选取波长影响阈值的指标, 因此引入相对距离比对MIV算法进行优化(MIVopt), 实现特征波长范围的有效分割。 针对SPA提取特征变量数目确定的问题, 设定了特征波长数目范围并在此范围内优中选优, 实现了自适应的SPA(SPAsa)特征提取。 使用耦合MIVopt-SPAsa算法对具有1 845个波长的玉米种子近红外全谱数据进行特征提取, 提取出特征波长37个, 主要分布在玉米种子近红外光谱的7个主要吸收峰附近, 表明该算法可以有效提取出与玉米种子生化物质近红外吸收特性一致的特征波长。 为了测试该算法对模型性能的影响, 建立了全谱BP模型、 MIV-BP模型、 SPAsa-BP模型、 MIVopt-SPAsa-BP模型和竞争自适应重加权CARS-BP模型对5个等级的玉米种子活力进行分级, MIVopt-SPAsa-BP模型的预测平均准确率可达99.1%, 预测精度高于其他模型; 其计算平均时间为14.382 s, 低于MIV-BP模型的计算时间(24.523 s)、 CARS-BP模型的计算时间(97.226 s)和SPAsa-BP模型的计算时间(101.224 s), 但高于全谱模型的平均计算时间(0.253 1 s); 其最佳表现交叉熵为0.007 892, 远远低于另外4个模型。 实验结果表明: MIVopt-SPAsa算法可以有效地提高玉米种子活力近红外检测模型的精度, 实现种子活力多等级、 精确、 无损检测, 为种子活力检测模型的优化提供参考。
近红外光谱 种子活力 玉米 平均影响值算法 连续投影算法 Near infrared spectroscopy Seed vigor Maize Mean impact value Successive projection algorithm 
光谱学与光谱分析
2022, 42(10): 3135
作者单位
摘要
中国农业大学工学院, 北京 100083
土壤有机质(SOM)是影响播量的土壤关键参数, 根据SOM信息对播量进行实时调控, 投入最优化的种子量, 充分利用地力资源挖掘产量潜力, 节约良种, 实现种植收益最大化, 是目前播种领域最前沿的研究方向。 以玉米主产区之一的华北平原为研究区域, 对该区域砂壤潮土进行了可见-近红外(300~2 500 nm)光谱采集。 采用蒙特卡罗交叉验证剔除了异常样本, 结合Savitzky-Golay卷积平滑法对光谱数据进行平滑去噪处理。 分别通过竞争性自适应重加权算法(CARS)、 连续投影算法(SPA)、 竞争性自适应重加权-连续投影(CARS-SPA)、 无信息变量消除(UVE)及变量组合集群分析法(VCPA)等波长筛选方法提取有效变量, 并结合偏最小二乘回归(PLSR)分别建立了全波长和特征波长的SOM含量预测模型。 结果表明, 不同方法筛选的波长数目及波长位置存在显著差异, CARS和SPA算法选择的光谱特征在整个光谱范围都有分布, UVE和VCPA筛选的波段较为集中, 且基于CARS-SPA方法可以进一步优选特征变量, 其特征波长仅为全波长数量的15%。 通过对比不同模型的建模及预测效果, 除UVE和VCPA算法外, 其余算法构建的模型均能实现SOM含量的有效预测, 其RPD值均大于2.0。 基于CARS-SPA构建的PLSR模型效果最好, 其RP2和RPD分别0.901和3.188, 均高于其他方法, 不仅降低了无效信息对预测效果的干扰, 且模型的运算效率得到了明显的提高, 可以很好地实现该地区SOM含量的可靠预测。 该研究可以为SOM含量快速预测及仪器设计提供方法参考。
土壤有机质 播种 可见-近红外 砂壤潮土 竞争性自适应重加权-连续投影算法 Soil organic matter Seeding Visible-near infrared Sandy fluvo-aquic soil CARS-SPA 
光谱学与光谱分析
2022, 42(9): 2924
作者单位
摘要
1 江西生物科技职业学院, 江西 南昌 330013
2 华东交通大学电气与自动化工程学院, 江西 南昌 330013
鱼类产品的新鲜程度研究一直是重要的课题, 其中挥发性盐基总氮(TVB-N)是一项重要指标, 该指标已列入我国食品卫生标准, 一般在低温条件下, 鱼类挥发性盐基氮的量达到30 mg/100 g时, 即认为是肉质变质的标志。 传统的物理检测方法不能够实现定量检测, 化学检测法则耗时长, 且需要专业人员进行破坏式检测。 为了克服传统光谱检测技术无法检测分析外部空间属性的缺点, 该实验采用波长范围在900~1 700 nm高光谱成像结合化学计量法实现了三文鱼的TVB-N含量检测。 首先对从市场买的新鲜三文鱼按照背面和反面(腹部)进行分割处理, 背面和反面(腹部)再10等分, 每条三文鱼制作成20个样本, 一共100个样本, 其中75个样本用于校正集, 25个样本用于预测集。 然后用高光谱成像系统采集三文鱼鱼样本的光谱数据, 再通过蒸馏法测定三文鱼TVB-N的含量, 并建立其理化值样本, 然后分别采用最小二乘支持向量机(LS-SVM)和偏最小二乘(PLS)模型对100个样本光谱全波长数据进行三文鱼TVB-N建模分析。 LS-SVM模型和PLS模型预测决定系数(R2)分别为0.918和0.907, 预测均方根误差(RMSEP)分别为2.312%和2.751%。 为了进一步提高运算效率和优化模型, 对全谱数据利用连续投影算法(SPA)提取到8个特征波长(956, 1 013, 1 152, 1 210, 1 286, 1 301, 1 397和1 464 nm), 基于8个特征波长分别建立SPA-LS-SVM和SPA-PLS模型, 模型预测决定系数(R2)分别为0.903和0.901, RMSEP分别为2.761%和2.801%, SPA-LS-SVM模型的结果优于SPA-PLS。 最后SPA-LS-SVM模型因其可靠性和有效性而被选择为最适合TVB-N预测模型, 基于图像处理编程技术将高光谱图像中的每个像素转换成相应的TVB-N值并以不同颜色表示, 实现了三文鱼肉TVB-N含量的可视化, 可以很形象的表达三文鱼的TVB-N的含量分布情况。 实验说明, 可利用高光谱成像技术预测三文鱼的TVB-N含量预测, 这为水产品的自动加工和分类奠定了基础, 渔业可以从高光谱技术中获益。
三文鱼 TVB-N含量 最小二乘支持向量机(LS-SVM) 偏最小二乘(PLS) 可视化 连续投影算法(SPA) Hyperspectral imaging Salmon fish TVB-N Partial least square (PLS) Least square support vector machine (LS-SVM) Visualizing Successive projections algorithm (SPA) 
光谱学与光谱分析
2021, 41(8): 2586
作者单位
摘要
南京理工大学电子工程与光电技术学院, 江苏 南京 210094
对转炉炼钢终点的实时精准控制能够有效提高钢铁产出的质量, 炉口火焰光谱在炼钢不同时期的变化明显, 对其进行分析处理并与机器学习方法相结合可有效用于炼钢终点的实时控制。 针对炉口火焰光谱数据量大、 现有方法对光谱特征提取在可信度和实时性上不足的缺陷, 提出一种基于窗口竞争性自适应重加权采样(WCARS)结合迭代式连续投影算法(ISPA)的光谱特征波长选择方法, 该方法在有效解决模型过拟合问题的同时, 能够降低高维数据计算的复杂度。 将火焰光谱数据沿波长方向进行窗口划分后, 使用CARS进行计算选出特征窗口波段, 再将迭代式选择与传统连续投影算法相结合, 通过重复迭代精选出特征波长, 在此基础上使用支持向量机回归(SVR)建立炼钢终点碳含量预测模型。 实验采集363组炼钢后期的炉口火焰光谱数据作为样本, 并对其进行Savitzky-Golay平滑预处理。 使用WCARS-ISPA算法从全光谱数据中选出10个特征波长作为SVR模型的输入, 碳含量为模型输出, Kennard-stone算法对训练集和测试集进行划分, 选择碳含量的平均预测误差、 预测误差在±2%以内的命中率以及运行30次的平均时间作为模型评价指标。 实验结果显示, 模型的平均碳含量预测误差为1.413 2%, 命中率高达90.63%, 运行时间为0.019 679 s。 与使用全光谱和WCARS-ISPA, CARS-SPA, WCARS和SPA四种不同特征选择方法选出的特征波长建模得到的结果进行对比, 基于WCARS-ISPA方法选出的特征波长建立的终点碳含量预测模型误差最小、 命中率最高。 提出一种新的炉口火焰光谱特征波长提取方法, 使用窗口竞争性自适应重加权采样结合迭代式连续投影算法选取特征波长, 并在此基础上建立转炉炼钢终点碳含量预测模型, 实验结果表明, 该方法能够有效提取火焰光谱特征, 所建模型能够对转炉炼钢终点进行准确预测, 满足工业生产的实时控制要求, 为实际生产提供可靠帮助。
转炉炼钢 火焰光谱 窗口竞争性自适应重加权采样 迭代式连续投影算法 终点预测 BOF steelmaking Flame spectra Window competitive adaptive reweighted sampling Iterative successive projection algorithm End-point prediction 
光谱学与光谱分析
2021, 41(8): 2332
作者单位
摘要
1 南京理工大学 能源与动力工程学院,江苏 南京 210094
2 北京航空航天大学 仪器科学与光电工程学院,北京 100191
空中目标在相对稳定的状态下具有确定的光谱辐射特性,因而可以利用光谱达到识别其型号的目的。首先,通过建立空中目标光谱辐射特性计算模型,获得了其归一化光谱辐射亮度数据。然后,利用连续投影算法对光谱进行特征波长提取,在保留一定精度的同时有效减少了所需数据量。最后,使用区分能力更强的混合光谱相似性测度SID (TAN)匹配光谱,研究在3~5 μm波段和8~14 μm波段两个大气窗口内,光谱辐射特性在不同飞行高度和飞行时间下的变化规律。结果表明:飞行高度对光谱辐射特性的影响大于飞行时间;3~5 μm波段的变化较8~14 μm波段明显。因此在建立光谱数据库时,为了提高识别的准确率,相对于8~14 μm波段,3~5 μm波段更需要考虑不同因素对光谱辐射特性的影响;相对于飞行时间,应尽可能多地选取不同飞行高度下的光谱作为参考光谱。
参考光谱 特征波长 连续投影算法 混合光谱相似性测度 光谱辐射特性 reference spectrum characteristic wavelengths successive projections algorithm hybrid spectral similarity measure spectral radiation characteristics 
红外与激光工程
2021, 50(4): 20200250

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!