作者单位
摘要
新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054新疆维吾尔自治区重点实验室“新疆干旱区湖泊环境与资源实验室”, 新疆 乌鲁木齐 830054
高光谱数据中存在的大量冗余信息对高光谱估测精度产生较大影响。 旨在寻求特征波段筛选的最佳算法, 以实现土壤重金属铅含量的准确监测, 为土壤污染防治提供参考。 以新疆渭干河-库车河三角洲绿洲土壤重金属铅含量与光谱数据为数据源, 利用蒙特卡洛交叉验证(MCCV)算法确定92个有效土壤样品, 通过相关分析选取倒数对数一阶微分变换处理的光谱数据, 采用随机蛙跳(RF)算法, 并结合竞争性自适应重加权(CARS)算法、 迭代保留有效信息变量(IRIV)算法及连续投影算法(SPA), 构建RF-CARS、 RF-IRIV及RF-SPA三种算法对波段进行筛选。 以倒数对数一阶微分变换处理下的特征波段反射率为自变量, 土壤重金属铅含量为因变量, 采用极端梯度提升(XGBoost)和地理加权回归(GWR)方法构建土壤重金属铅含量估测模型。 结果表明: (1)光谱变换处理可有效增强光谱与土壤铅含量的敏感性, 其中倒数对数一阶微分变换后的土壤光谱特征更为明显, 相关系数可达到0.620(p<0.001)。 (2)RF-CARS、 RF-IRIV及RF-SPA算法分别从高光谱数据中筛选出6、 9和7个特征波段, 全部位于近红外光谱区域, 3种算法具有较强的特征提取能力, 极大减少光谱数据中的冗余信息。 (3)基于RF-IRIV算法构建的土壤铅含量估测模型的精度和稳定性高于RF-CARS和RF-SPA算法构建的模型, 说明RF-IRIV算法能更为准确的保留与土壤铅含量相关的波段。 此外, GWR模型的性能优于XGBoost模型, 构建的RF-IRIV-GWR模型具有较好的预测能力, 可作为研究区土壤铅含量的最优估测模型, 其验证集的决定系数(R2)为0.892, 均方根误差(RMSE)为0.825 mg·kg-1, 相对分析误差(RPD)为3.09。 基于随机蛙跳(RF)与迭代保留有效信息变量(IRIV)算法, 结合地理加权回归(GWR)建模方法在快速准确估测土壤铅含量方面具有一定优势, 可进行土壤重金属污染的动态监测。
特征波段 随机蛙跳算法 竞争性自适应重加权算法 迭代保留有效信息变量算法 连续投影算法 极端梯度提升 地理加权回归 土壤铅 Feature band Random frog algorithm Competitive adaptive reweighted sampling algorithm Iteratively retaining informative variables algori Successive projections algorithm Extreme gradient boosting Geographically weighted regression Soil lead 
光谱学与光谱分析
2023, 43(10): 3302
作者单位
摘要
1 齐鲁工业大学(山东省科学院), 山东省科学院海洋仪器仪表研究所, 山东 青岛 266061
2 齐鲁工业大学(山东省科学院), 山东省科学院海洋仪器仪表研究所, 山东 青岛 266061中国石油大学(华东)计算机科学与技术学院, 山东 青岛 266590
海洋沉积物的粒度研究有助于了解人类活动对自然环境的影响。 将主成分分析(PCA)和连续投影算法(SPA)融合能够综合利用两种光谱特征提取方法的优势, 获得比单一特征提取方法更丰富的特征波长, 实现无关特征和干扰信息的剔除, 最大限度减少特征信息的丢失, 有利于沉积物粒度的分析。 以青岛市东大洋村潮间带表层32份沉积物为例, 将海洋沉积物划分为0.3~0.2、 0.2~0.1、 0.1~0.075和<0.075 mm四个不同粒径的沉积物样品, 分别测定不同粒径的32份沉积物的可见-近红外反射光谱, 共计128条光谱。 将128条光谱数据分别以2∶1, 1∶1和1∶2的比例划分建模集和检验集进行分析; 采用主成分分析和连续投影融合算法(FOPAS )提取不同粒径沉积物的特征光谱, 利用支持向量机算法建立粒径分类模型。 结果显示, 对2∶1、 1∶1、 1∶2比例的数据集, 融合算法检验集正确率分别为83.33%、 82.81%、 75.29%, 仅在2∶1比例下正确率低于连续投影算法检验集的正确率90.47%, 其余正确率相对于单一特征提取算法均有显著的提高, 表明使用融合算法提取特征光谱建立的分类模型在训练集样本量少, 粒径清晰的条件下, 其分类模型相较于单独使用两个特征提取算法的模型更具有优势。 采用基于主成分分析和连续投影融合算法的海洋沉积物粒度分类模型, 能够提高海洋沉积物粒度分类结果的正确率, 建立正确率更高的粒度分类模型, 对快速粒度分类提供了解决方法。
海洋沉积物 粒度分类 主成分分析 连续投影算法 融合算法 Marine sediments Particle size classification Principal component analysis Successive projection algorithm Fusion algorithm 
光谱学与光谱分析
2023, 43(10): 3075
作者单位
摘要
1 新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054新疆干旱区湖泊环境与资源实验室, 新疆 乌鲁木齐 830054
2 新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054
3 新疆干旱区湖泊环境与资源实验室, 新疆 乌鲁木齐 830054
4 新疆财经大学统计与数据科学学院, 新疆 乌鲁木齐 830012
土壤有机碳含量是土壤肥力与土壤质量的主要决定因素, 与土壤生产力密切相关。 采用高光谱模型估算土壤有机碳含量成为了解土壤肥力的重要方法。 利用高光谱分析技术结合机器算法实现快速、 高精度的估算土壤有机碳含量, 对土壤肥力的可持续利用至关重要。 根据实测的土壤有机碳含量及其高光谱反射率数据, 运用Savitzky Golay方法对光谱波段进行平滑去噪, 采用连续投影算法(SPA)、 遗传算法(GA)对原始光谱及其5种不同数学变换光谱分别进行特征波段的筛选, 并基于随机森林(RF)方法构建土壤有机碳含量的高光谱估算模型。 为进一步降低模型的复杂度, 将SPA算法与GA算法相结合, 寻找最佳特征参数, 以提升土壤有机碳含量特征波段的识别率和可信度。 结果表明: (1)在原始光谱中, 基于GA算法筛选SOC含量的高光谱响应波段主要集中在350~410、 827~928、 997~1 064、 1 201~1 234、 1 541~1 574、 1 667~1 710、 2 153~2 186和2 357~2 707 nm; 当RMSE为6.09时, SPA算法筛选了11个特征变量。 (2)基于GA算法筛选特征波段时, 原始光谱R、 标准正态变量(SNV)、 多元散射校正(MSC)、 一阶微分(FD)、 对数的倒数(RL)与连续统去除(CR)的维数分别降低到407、 697、 668、 667、 493、 784维, 占全光谱波段的18.93%~36.47%; 基于GA-SPA算法筛选后, 6种光谱变量的维度介于8~17维, RMSE介于4.53~6.30。 (3)在一阶微分光谱形式下, 基于GA-SPA算法挑选的12个特征变量所构建的RF模型预测效果最好, 模型的建模集R2c为0.78, RMSEc为5.48, 验证集R2p为0.82, RMSEp为4.50, RPD为2.18。 研究表明, 光谱一阶微分可以增强土壤的光谱信息, GA算法结合SPA算法寻找光谱特征变量, 既简化了估算模型的复杂度, 又提高了估算模型的精度, 基于遗传算法—连续投影算法的高光谱模型具有较高的估算能力。
土壤有机碳含量 连续投影 遗传算法 高光谱估算模型 湖滨绿洲 Soil organic carbon content Successive projection algorithm Genetic algorithm Hyperspectral estimation model Lakeside oasis 
光谱学与光谱分析
2023, 43(7): 2232
作者单位
摘要
1 华东交通大学电气与自动化工程学院, 江西 南昌 330013
2 华东交通大学土木建筑学院, 江西 南昌 330013
土壤养分直接关系到作物产量与品质状况, 然而传统化学方法检测存在化学试剂消耗大、 耗时费力等问题, 不能满足精细农业的需求。 快速获取土壤养分信息是发展精细农业、 绿色农业的关键, 想要了解土壤肥力状况, 必须先了解有机质和总氮的含量状况。 许多研究表明, 长波近红外光谱被广泛应用于土壤检测领域, 然而短波可见/近红外光谱在土壤有机质和总氮的研究上却非常罕见。 以江西省吉安市安福县和南昌市新建区的四个村庄作为研究区, 根据2×2网格法采集了深度为10~30 cm的棕壤、 红壤和水稻土三种最为典型的土壤样品共180份。 经过研磨、 风干等处理后用四分法均匀划分为两份, 用于测定样品光谱信息和理化信息。 将土壤样品按照2∶1(120∶60)划分为建模集和预测集。 考虑到首尾端波段噪声较大, 故去除325~349和1 051~1 075 nm波段, 将350~1 050 nm波段用于光谱分析。 通过连续投影算法(SPA)筛选出有机质12个特征波长点, 总氮11个特征波长点, 考虑到土壤光谱信息与土壤理化性质之间可能存在非线性联系, 建立全波段与特征波长的线性偏最小二乘回归(PLSR)模型和非线性最小二乘支持向量机(LS-SVM)模型对土壤有机质和总氮进行研究, LS-SVM模型采用两步网格搜索法优化了两个超参数γ和σ2。 研究结果表明: (1)土壤的光谱反射率随波长增加反射率升高, 反射率曲线中460、 550、 580、 740和900 nm处有较为明显的吸收特征。 (2)从PLSR模型和LS-SVM模型结果分析可知, 非线性模型LS-SVM具有更好的预测精度, 分析认为土壤光谱信息与土壤理化性质之间存在一些非线性关系。 (3)通过连续投影算法筛选的特征波长提高了模型精度, 优化了模型运行效率。 SPA-LS-SVM模型是所有模型中最优的预测模型, 其中有机质模型的R2pre为0.884 7, RMSEp为0.104 8, RPD为2.945 0, 总氮模型的R2pre为0.901 8, RMSEp为0.010 4, RPD为3.191 1。 (4)本研究说明可见/近红外光谱能够用于测量不同类型的土壤有机质和总氮含量, 并且达到较好的预测效果。 可见/近红外光谱在土壤检测领域具有巨大潜力。
土壤有机质 总氮 连续投影算法 偏最小二乘回归 最小二乘支持向量 Soil organic matter Total nitrogen Successive projections algorithm Partial least squares regression Least-squares support vector machine 
光谱学与光谱分析
2023, 43(7): 2226
作者单位
摘要
1 云南师范大学 物理与电子信息学院,云南 昆明 650000
2 云南省博物馆,云南 昆明 650000
茶染作为植物染色的一大门类,同时具有良好的环保性能和深厚的文化底蕴。为了能够准确描述茶叶染色的光谱变化,本文研究茶染后宣纸的光谱反射率与茶叶浓度的关系。首先采用分光光度计测量400~700 nm波段被茶叶染色后宣纸的光谱反射率,分别基于偏最小二乘回归模型、BP神经网络和连续投影算法(SPA)选择特征波段建立光谱信息与茶叶浓度之间关系的预测模型。然后以光谱反射率作为输入变量,对茶叶浓度进行预测。结果表明:基于偏最小二乘法、BP神经网络和连续投影算法 选择特征波段建立模型,通过茶染宣纸的光谱反射率来预测茶叶浓度具有较高的稳健性和可信度,其中SPA-BP神经网络模型的效果最优,平均预测正确率为98.40%,决定系数为0.9910,均方根误差为0.8433。这说明通过茶染宣纸的光谱数据来预测茶叶浓度具有可行性。
光谱反射率 茶染 偏最小二乘法 BP神经网络 连续投影算法 spectral reflectivity tea dyeing partial least squares BP neural networks continuous projection algorithm 
光学仪器
2023, 45(4): 71
作者单位
摘要
华侨大学机电及自动化学院,福建 厦门 361021
为了提高可见-近红外(Vis-NIR)光谱法检测水质pH值的精度和稳定性,基于连续投影算法(SPA)和粒子群优化-最小二乘支持向量机(PSO-LSSVM)建立了多元校正模型。采集60个不同pH值水溶液样品的Vis-NIR光谱数据,运用Savitzky-Golay卷积平滑和标准正态变量变换对原始光谱数据进行预处理。基于SPA筛选的特征波长和PSO算法自动优化LSSVM的建模参数,建立多元非线性校正模型。结果表明,相比于其他对比模型,SPA-PSO-LSSVM模型具有更高的精度与更优的稳定性,验证集的均误差方根为0.67、决定系数为0.91,剩余预测偏差为3.10。
光谱学 可见-近红外光谱 连续投影算法 粒子群优化 最小二乘支持向量机 
激光与光电子学进展
2023, 60(1): 0130002
作者单位
摘要
中国农业大学工学院, 农业部土壤-机器-植物系统技术重点实验室, 北京 100083
针对传统玉米品种抗倒性鉴别方法费时费力、 时效滞后的问题, 采用高光谱成像数据结合机器学习方法对9叶期的玉米品种抗倒性进行鉴别, 并给出适于进行玉米品种抗倒性鉴别的种植密度和建模方法。 试验设置了5 000, 7 000和9 000株·亩-13个种植密度和6个典型的抗倒/不抗倒玉米品种, 采集9叶期玉米顶叶的高光谱图像, 使用目标区域分割的方式自动进行光谱图像反射率校正和目标光谱曲线提取。 对采集的样本数据使用Kennard Stone算法划分样本训练集和测试集, 用主成分分析法(PCA)和连续投影算法(SPA)提取光谱特征, 建立了基于高斯核函数的支持向量机(SVM)模型并进行参数训练和优化。 通过对不同种植密度下各特征提取方法的效果和各模型训练效果及其预测结果的对比, 找到进行玉米抗倒性鉴别的最佳种植密度和建模方法。 试验结果表明: 在各种植密度下PCA方法对光谱特征的降维效果最为显著, 而SPA算法选择的特征波长分布比较均匀、 抗倒性分类特征比较明显; 种植密度的增加对于玉米品种抗倒性的鉴别是有益的, 在种植密度为7 000株·亩-1时, 使用SPA-SVM方法建立的模型训练效果和预测结果最佳, 此时模型对训练集数据的10折交叉验证正确率为97.40%, 对测试集数据的预测正确率为98.33%。
玉米抗倒 高光谱成像 主成分分析 连续投影 支持向量机 Maize lodging resistance Hyperspectral imaging PCA SPA SVM 
光谱学与光谱分析
2022, 42(4): 1229
作者单位
摘要
1 黑龙江八一农垦大学信息与电气工程学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学工程学院, 黑龙江 大庆 163319
目前, 近红外光谱(NIRS)可以实现种子活力的快速、 无损检测, 但区分的活力等级一般少于3级且精度不高。 建立种子活力多等级、 高精度的NIRS检测模型, 解决活力等级增加与预测模型精度之间的矛盾是现阶段近红外种子活力检测的主要任务。 以玉米种子为研究对象, 采用人工老化的方法获得5种活力等级的种子样本并采集对应的光谱数据建立反向神经网络(BP)预测模型。 为了提高模型的精度和稳健性, 提出一种耦合平均影响值-连续投影特征波长提取算法(MIVopt-SPAsa)。 该算法针对连续投影算法(SPA)耗时过长的问题, 采用平均影响值算法(MIV)对其预降维。 MIV方法实现了对波长影响值的排序, 但缺乏选取波长影响阈值的指标, 因此引入相对距离比对MIV算法进行优化(MIVopt), 实现特征波长范围的有效分割。 针对SPA提取特征变量数目确定的问题, 设定了特征波长数目范围并在此范围内优中选优, 实现了自适应的SPA(SPAsa)特征提取。 使用耦合MIVopt-SPAsa算法对具有1 845个波长的玉米种子近红外全谱数据进行特征提取, 提取出特征波长37个, 主要分布在玉米种子近红外光谱的7个主要吸收峰附近, 表明该算法可以有效提取出与玉米种子生化物质近红外吸收特性一致的特征波长。 为了测试该算法对模型性能的影响, 建立了全谱BP模型、 MIV-BP模型、 SPAsa-BP模型、 MIVopt-SPAsa-BP模型和竞争自适应重加权CARS-BP模型对5个等级的玉米种子活力进行分级, MIVopt-SPAsa-BP模型的预测平均准确率可达99.1%, 预测精度高于其他模型; 其计算平均时间为14.382 s, 低于MIV-BP模型的计算时间(24.523 s)、 CARS-BP模型的计算时间(97.226 s)和SPAsa-BP模型的计算时间(101.224 s), 但高于全谱模型的平均计算时间(0.253 1 s); 其最佳表现交叉熵为0.007 892, 远远低于另外4个模型。 实验结果表明: MIVopt-SPAsa算法可以有效地提高玉米种子活力近红外检测模型的精度, 实现种子活力多等级、 精确、 无损检测, 为种子活力检测模型的优化提供参考。
近红外光谱 种子活力 玉米 平均影响值算法 连续投影算法 Near infrared spectroscopy Seed vigor Maize Mean impact value Successive projection algorithm 
光谱学与光谱分析
2022, 42(10): 3135
作者单位
摘要
中国农业大学工学院, 北京 100083
土壤有机质(SOM)是影响播量的土壤关键参数, 根据SOM信息对播量进行实时调控, 投入最优化的种子量, 充分利用地力资源挖掘产量潜力, 节约良种, 实现种植收益最大化, 是目前播种领域最前沿的研究方向。 以玉米主产区之一的华北平原为研究区域, 对该区域砂壤潮土进行了可见-近红外(300~2 500 nm)光谱采集。 采用蒙特卡罗交叉验证剔除了异常样本, 结合Savitzky-Golay卷积平滑法对光谱数据进行平滑去噪处理。 分别通过竞争性自适应重加权算法(CARS)、 连续投影算法(SPA)、 竞争性自适应重加权-连续投影(CARS-SPA)、 无信息变量消除(UVE)及变量组合集群分析法(VCPA)等波长筛选方法提取有效变量, 并结合偏最小二乘回归(PLSR)分别建立了全波长和特征波长的SOM含量预测模型。 结果表明, 不同方法筛选的波长数目及波长位置存在显著差异, CARS和SPA算法选择的光谱特征在整个光谱范围都有分布, UVE和VCPA筛选的波段较为集中, 且基于CARS-SPA方法可以进一步优选特征变量, 其特征波长仅为全波长数量的15%。 通过对比不同模型的建模及预测效果, 除UVE和VCPA算法外, 其余算法构建的模型均能实现SOM含量的有效预测, 其RPD值均大于2.0。 基于CARS-SPA构建的PLSR模型效果最好, 其RP2和RPD分别0.901和3.188, 均高于其他方法, 不仅降低了无效信息对预测效果的干扰, 且模型的运算效率得到了明显的提高, 可以很好地实现该地区SOM含量的可靠预测。 该研究可以为SOM含量快速预测及仪器设计提供方法参考。
土壤有机质 播种 可见-近红外 砂壤潮土 竞争性自适应重加权-连续投影算法 Soil organic matter Seeding Visible-near infrared Sandy fluvo-aquic soil CARS-SPA 
光谱学与光谱分析
2022, 42(9): 2924
作者单位
摘要
1 江西生物科技职业学院, 江西 南昌 330013
2 华东交通大学电气与自动化工程学院, 江西 南昌 330013
鱼类产品的新鲜程度研究一直是重要的课题, 其中挥发性盐基总氮(TVB-N)是一项重要指标, 该指标已列入我国食品卫生标准, 一般在低温条件下, 鱼类挥发性盐基氮的量达到30 mg/100 g时, 即认为是肉质变质的标志。 传统的物理检测方法不能够实现定量检测, 化学检测法则耗时长, 且需要专业人员进行破坏式检测。 为了克服传统光谱检测技术无法检测分析外部空间属性的缺点, 该实验采用波长范围在900~1 700 nm高光谱成像结合化学计量法实现了三文鱼的TVB-N含量检测。 首先对从市场买的新鲜三文鱼按照背面和反面(腹部)进行分割处理, 背面和反面(腹部)再10等分, 每条三文鱼制作成20个样本, 一共100个样本, 其中75个样本用于校正集, 25个样本用于预测集。 然后用高光谱成像系统采集三文鱼鱼样本的光谱数据, 再通过蒸馏法测定三文鱼TVB-N的含量, 并建立其理化值样本, 然后分别采用最小二乘支持向量机(LS-SVM)和偏最小二乘(PLS)模型对100个样本光谱全波长数据进行三文鱼TVB-N建模分析。 LS-SVM模型和PLS模型预测决定系数(R2)分别为0.918和0.907, 预测均方根误差(RMSEP)分别为2.312%和2.751%。 为了进一步提高运算效率和优化模型, 对全谱数据利用连续投影算法(SPA)提取到8个特征波长(956, 1 013, 1 152, 1 210, 1 286, 1 301, 1 397和1 464 nm), 基于8个特征波长分别建立SPA-LS-SVM和SPA-PLS模型, 模型预测决定系数(R2)分别为0.903和0.901, RMSEP分别为2.761%和2.801%, SPA-LS-SVM模型的结果优于SPA-PLS。 最后SPA-LS-SVM模型因其可靠性和有效性而被选择为最适合TVB-N预测模型, 基于图像处理编程技术将高光谱图像中的每个像素转换成相应的TVB-N值并以不同颜色表示, 实现了三文鱼肉TVB-N含量的可视化, 可以很形象的表达三文鱼的TVB-N的含量分布情况。 实验说明, 可利用高光谱成像技术预测三文鱼的TVB-N含量预测, 这为水产品的自动加工和分类奠定了基础, 渔业可以从高光谱技术中获益。
三文鱼 TVB-N含量 最小二乘支持向量机(LS-SVM) 偏最小二乘(PLS) 可视化 连续投影算法(SPA) Hyperspectral imaging Salmon fish TVB-N Partial least square (PLS) Least square support vector machine (LS-SVM) Visualizing Successive projections algorithm (SPA) 
光谱学与光谱分析
2021, 41(8): 2586

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!