作者单位
摘要
1 华中师范大学 地理过程分析与模拟湖北省重点实验室,湖北 武汉 430079
2 浙江大学 杭州国际科创中心,浙江 杭州 311200
3 浙江大学 农业遥感与信息技术应用研究所,浙江 杭州 310058
4 农业农村部光谱检测重点实验室,浙江 杭州 310058
土壤中红外(MIR)光谱能快速、无污染、低成本地估算土壤有机碳等理化属性。随着各种尺度土壤光谱库的建立,使用其进行快速土壤分析引起广泛关注,但光谱库的通用模型在局部尺度上的预测效果不理想。开发“局部化”光谱建模方法是提高土壤光谱库性能的有效途径。本文提出了一种新的方法,通过光谱相似度计算和建模子集构建,旨在从库中快速建立最优局部建模集以提高预测精度。比较了欧氏、马氏、余弦三种距离算法衡量待测样本与库样本之间的相似度并生成距离矩阵;使用连续统去除法从距离矩阵中提取库容曲线中的特征点。利用偏最小二乘回归建立土壤MIR光谱与有机碳含量间的定量关系。结果表明,三种距离算法结合连续统去除得到的第一特征点均可得到较佳的预测精度。马氏距离不仅模型精度最高(R2 = 0.764,RMSE = 1.021%)而且用到的库样本数最少(14%库容)。本方法可改善MIR光谱分析的成本效率并能提高局部尺度的预测能力。
土壤碳 相似度 距离矩阵 连续统去除 偏最小二乘回归 soil carbon similarity distance matrix continuum-removal PLSR 
红外与毫米波学报
2023, 42(6): 815
作者单位
摘要
中国科学院合肥物质科学研究院, 安徽光学精密机械研究所, 光子器件与材料安徽省重点实验室, 安徽 合肥 230031
锂元素具有优良的物理和化学性能, 因而在**、 电池、 特种合金、 受控热核反应等领域具有重要作用。 现有的锂矿石分析主要是基于酸分解的原子吸收光谱、 电感耦合等离子体质谱或原子发射光谱等离线方法。 激光诱导击穿光谱(LIBS)是一种无需样品制备、 适用于低原子序数元素(包括锂)的原子发射光谱方法。 采用LIBS技术, 实验采集了11种锂矿石成分分析标准物质的等离子体发射光谱, 分别在610.35和670.78 nm附近观测到了Li的特征峰, 但由于谱线的重叠, 无法应用单变量线性回归进行建模。 在全谱积分强度标准化基础上, 分别使用偏最小二乘回归(PLSR)和基于主成份分析的支持向量回归(PCA+SVR)对锂矿石标准物质中的锂含量进行建模。 校准模型的相关参数通过留一组交叉验证均方根误差(RMSECV)来确定。 结果表明, 相较于PCA+SVR校准模型, PLSR的决定系数(R2)更大, 校准均方根误差(RMSEC)更小, 但预测均方根误差(RMSEP)远大于RMSEC, 存在过拟合现象。 另一方面, PCA+SVR计算得到的RMSEP和平均相对误差(MRE)相对于PLSR更小, 因此认为PCA+SVR模型拥有更好适应度。 从而证明, LIBS技术可以实现锂矿石中Li含量的分析, 有望应用于位于传送带上锂矿石的原位在线定量分析。
锂矿石 LIBS Lithium ore PLSR PCA SVR LIBS PLSR PCA SVR 
光谱学与光谱分析
2022, 42(11): 3489
作者单位
摘要
吉林农业大学信息技术学院, 吉林 长春 130118
针对玉米生产中叶片氮素快速、 无损检测的实际需求, 使用叶级高光谱数据(400~2 500 nm), 依据等效水厚度梯度划分叶片样本, 建立了梯度连续的叶片氮素反演模型, 初步探索了含水量因素对叶片反射率特性及反演模型精度的影响。 首先获取叶级高光谱数据, 再根据等效水厚度数值大小对样本进行排序及滑动划分, 建立了子集集合。 父集除原光谱数据之外还采用了三大类: (1)基线矫正类、 (2)散射校正类和(3)平滑处理类光谱变换方法, 而子集未使用任何光谱变换方法。 建立全波段的PLSR反演模型, 对比模型精度, 初步定量评价了等效水厚度因素对建模精度的影响。 研究结果表明: (1)四组数据中有三组父集反演精度低于最优子集的反演精度, 另外一组持平(2018大田低氮: (父)RCV2=0.48<(子)RCV2=0.57, (父)RPDCV=1.38<(子)RPDCV=1.52; 2018大田高氮: (父)RCV2=0.48<(子)RCV2=0.7, (父)RPDCV=1.39<(子)RPDCV=1.8; 2019大田高氮: (父)RCV2=0.59<(子)RCV2=0.68, (父)RPDCV=1.57<(子)RPDCV=1.77); (2)四组数据的最优子集反演精度都达到甚至超过了定性模型水平, 而父集只有两组; (3)制作反演数据集时在样本筛选问题上需要考虑等效水厚度因素, 以避免过于宽泛的样本选择而导致整体反演精度的损失。 综上, 等效水厚度因素对玉米叶片氮素建模精度存在显著影响, 不可忽视。 在考虑该因素后, 使用叶级高光谱数据对玉米叶片氮素进行快速无损检测的技术方法会更加可信、 可行。
叶片氮浓度 等效水厚度 高光谱 光谱变换技术 数据集滑动划分 Foliar nitrogen concentration Equivalent water thickness Hyperspectral Spectral transformation techniques PLSR Sliding datasets partition PLSR 
光谱学与光谱分析
2022, 42(9): 2913
作者单位
摘要
1 华中师范大学地理过程分析与模拟湖北省重点实验室, 湖北 武汉 430079
2 浙江大学杭州国际科创中心, 浙江 杭州 311200
3 中国科学院、 水利部成都山地灾害与环境研究所山地表生过程与生态调控重点实验室, 四川 成都 610041
掌握土壤在空间和时间上的表征至关重要。 土壤可见-近红外(Vis-NIR)光谱可以估算土壤有机碳(SOC)等属性, 与传统的实验室理化分析相比, 光谱技术能有效实现土壤信息的快速获取。 土壤光谱库为建立经验模型提供了大量具有丰富变异性和多样性的样本作数据基础。 但受限于库中土壤样本的异质性和模型的适应性, 通常区域或局部尺度模型的稳健性欠佳。 已有的研究主要通过目标样本部分入库的方式改善库的性能, 但影响了光谱技术的低成本优势。 该研究在不入库的前提下基于土壤光谱的相异度, 探究经典距离算法结合土壤光谱库构建局部预测模型的可行性, 并比较分析局部模型样本容量对预测精度的响应。 基于全球土壤光谱库(GSSL)的677个土柱, 从每个国家随机取十分之一的土柱(97个)组成局部目标测试集(Test), 其余580个作土壤光谱库(SSL)。 分别采用欧氏距离(ED)、 马氏距离(MD)、 和光谱角(SAM)来分别度量Test与SSL间的光谱相异度并生成距离矩阵。 按距离矩阵的前0.04%, 0.05%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 1%和5%从SSL中提取与Test最相似的光谱样本构建共计9个容量的局部建模集(Local), 使用偏最小二乘回归(PLSR)建立Vis-NIR和SOC含量的预测模型并通过Test验证模型精度, 通过光谱的主成分空间考察并解释各种距离算法下Local的“容量-精度”变化。 结果表明, 在待测样本不入库的情况下, 三种距离算法构建的Local模型相较于全局模型的预测精度均有一定提升, 但三者的“容量-精度”的拐点存在显著差异。 SAM兼顾了光谱的波形和幅度因此较MD、 ED更具优势; 其前0.2%比例的Local不仅预测精度最优, 且用于建模所需的样本容量最少。 因此认为, SAM法更适用于从土壤光谱库中构建局部模型, 距离矩阵的前0.2%可作为局部模型的容量参考。
光谱库 相异度 距离矩阵 容量 偏最小二乘 Spectral library Dissimilarity Distance matrix Sample size PLSR 
光谱学与光谱分析
2022, 42(5): 1614
作者单位
摘要
中国农业大学现代精细农业系统集成研究教育部重点实验室, 北京 100083
叶绿素是作物生长诊断的重要参数, 对其进行高效检测是农田精细化管理的基础。 PROSPECT模型是作物光谱学检测研究的重要工具, 可为建立高精度叶绿素诊断模型提供数据集基础。 为了建立具有普适性的田间玉米作物叶绿素含量检测模型, 使用PROSPECT模型输入叶片结构参数和生化参数模拟叶片400~2 500 nm波段反射率曲线10 650条。 在其他参数设置保持不变的情况下, 分析光谱反射率曲线对叶绿素含量参数的敏感性, 结果显示叶绿素含量仅在400~780 nm区间对光谱反射率曲线产生影响。 讨论了3种叶绿素检测特征波长筛选策略, 分别为: 根据敏感性分析结果, 选出548~610和694~706 nm区域共计76个波长, 记为SEN-BAND; 基于反向区间偏最小二乘法(Bi-PLS)筛选5个区间共计91个波长, 记为BP-BAND; 基于连续投影算法(SPA), 在叶绿素影响区域400~780 nm筛选10个特征波长, 记为SPA-BAND。 进而使用2019年、 2020年两年期田间实测玉米叶片光谱反射率曲线和叶绿素含量数据, 分别应用上述3种方法选取的特征波长构建玉米叶片叶绿素含量检测模型。 结果显示, 使用SPA-BAND特征波长构建的模型, 在两年期数据中均得到最佳结果。 2019年数据模型建模集决定系数(Rc2)为0.815 6, 建模集均方根误差RMSEC为2.908 6, 验证集决定系数(Rv2)为0.799 5, 验证集均方根误差RMSEV为2.997 7。 2020年数据模型建模集决定系数(Rc2)为0.949 2, 建模集均方根误差RMSEC为0.976 8, 验证集决定系数(Rv2)为0.910 2, 验证集均方根误差RMSEV为1.562 9。 表明, 基于PROSPECT模型筛选叶绿素含量特征波长建立的叶绿素诊断模型具有普适性。
PROSPECT模型 叶绿素 波长筛选 PROSPECT model Chlorophyll Wavelength selection SPA Bi-PLS PLSR SPA Bi-PLS PLSR 
光谱学与光谱分析
2022, 42(5): 1514
作者单位
摘要
中国计量大学生命科学学院, 浙江 杭州 310018
花色素苷是一种天然的水溶性黄酮类色素, 具有多种药用价值, 广泛存在于桑椹中, 成为评价桑椹产品品质的重要指标。 传统检测方法费时费力, 因此实现花色素苷含量的快速检测对于桑椹产品的开发利用至关重要。 该研究以桑椹中的花色素苷为研究对象, 探索花色素苷与拉曼光谱特性之间的关系及拉曼光谱技术对其定量检测的可行性。 对桑椹及3种花色素苷标准品的拉曼光谱进行了分析, 其中可将545, 634和737 cm-1处的峰位作为桑椹中花色素苷的拉曼特征峰, 以此判断桑椹中是否含有花色素苷, 并根据其峰值的高低来定性判断花色素苷含量多少。 运用多元散射校正(MSC)、 基线校正(airPLS)、 归一化(Normalized)三种方法及其组合方法进行光谱数据预处理, 并结合PLSR筛选最佳预处理方式。 比较发现最佳预处理为airPLS+MSC+Normalized, 其PLSR模型效果较好, 建模集决定系数为0.97, RMSEc为2.74, 预测集决定系数为0.82, RMSEp为13.69。 基于airPLS+MSC+Normalized预处理后的光谱, 采用竞争性自适应重加权算法(CARS)对光谱进行特征波长筛选, 将筛选出的波长变量作为输入变量分别建立了PLSR模型和SVR模型, 研究两种模型的预测效果。 结果表明经过CARS处理的两种模型均能对花色素苷的含量进行准确预测, 其中经过CARS变量筛选建立的SVR模型效果最好, 建模集决定系数为0.98, RMSEc为1.92, 预测集决定系数为0.94, RMSEp为4.70, 预测精度较高。 因此拉曼光谱技术可以实现对桑椹中花色素苷含量的快速、 准确预测。
拉曼光谱 花色素苷 桑椹 特征提取 Raman spectroscopy Anthocyanin Mulberry Feature extraction Partial least squares regression Support Vector Regression PLSR SVR 
光谱学与光谱分析
2021, 41(12): 3771
作者单位
摘要
1 塔里木大学植物科学学院, 新疆 阿拉尔 843300
2 中国农业大学土地资源管理学院, 北京 100083
3 浙江大学环境与资源学院, 浙江 杭州 310058
土壤有机质是土壤肥力的物质基础, 其含量的高低是评价土壤肥力的重要标志。 土壤有机质组分根据其溶解性可分为胡敏素(HM)、 胡敏酸(HA)、 富里酸(FA), 不同组分的肥力特性差异显著, 因此, 土壤有机质组分数据可更加全面、 客观的反映土壤肥力状况。 传统土壤土壤有机质及组分的测定工序繁杂, 效率低下且时效性差, 大量研究表明高光谱技术能有效提高土壤属性的检测效率并降低测试成本, 但关于可见光-近红外、 中红外光谱检测土壤有机质组分的报道鲜见。 为了探索中红外光谱及可见光-近红外-中红外组合光谱对土壤有机质组分检测的可行性, 并对比有机质单一光谱模型与有机质不同组分的组合光谱模型的预测精度, 以南疆地区农田土壤为例, 在阿克苏及和田地区共采集93个土样, 进行有机质、 胡敏素、 胡敏酸、 富里酸含量及光谱数据的测定。 其次, 利用可见-近红外(VNIR)、 中红外(MIR)及其组合光谱(VNIR-MIR)三种光谱数据集, 采用偏最小二乘(PLSR)、 支持向量机(SVM)、 随机森林(RF)三种建模方式对土壤有机质、 胡敏素、 胡敏酸、 富里酸含量进行组合模型分析预测。 结果表明: (1)土壤有机质及各组分均与光谱反射率有较好的相关性, 土壤有机质及组分在MIR谱段的特征波段数量明显多于VNIR谱段。 (2)有机质最优预测模型的模式为VNIR-MIR-RF, 该模型的决定系数R2为0.90; 胡敏素与胡敏酸最优预测模型的模式均为VNIR-RF模型, R2均为0.92; 富里酸最优预测模型的模式为MIR-RF模型, R2为0.94。 (3) 基于胡敏素、 胡敏酸和富里酸的有机质组合光谱模型的预测精度明显高于有机质单一光谱模型, 两种模型的R2分别为0.93和0.90。 实现了土壤有机质组分的高效快速反演, 且基于有机质组分的组合模型提高了土壤有机质预测精度, 为南疆地区大尺度土壤肥力的鉴定与精准施肥提供重要的参考价值。
土壤有机质组分 光谱反射率 偏最小二乘 支持向量机 随机森林 反演模型 Soil organic matter Spectral reflectance Partial least squares regression (PLSR) Support vector machine regression (SVM) Random forest regression (RF) Inversion model 
光谱学与光谱分析
2021, 41(10): 3069
作者单位
摘要
1 中国农业大学信息与电气工程学院食品质量与安全北京实验室, 北京 100083
2 中国农业大学工学院, 北京 100083
3 中国农业大学动物科学技术学院动物营养国家重点实验室, 北京 100083
随着居民生活水平的提高和对健康饮食结构的重视, 羊肉作为一种高蛋白且低脂肪和胆固醇的畜肉, 需求量逐年上涨。 根据国家统计局统计, 2012年—2019年我国畜肉产业中羊肉产量占比从6.27%上升到9.02%。 研究提出了一种基于二次迭代Monte Carlo(MC)算法剔除异常样本的羊肉硬度定量检测PLSR模型。 采用GaiaSorter高光谱分选仪的Image-λ-V10E-H相机采集羊肉样品400~950 nm的高光谱数据, Image-λ-N17E相机采集羊肉样品900~1 650 nm的高光谱数据。 首先, 对比分析了S-G平滑、 二阶求导、 多元散射校正(MSC)、 标准正态变换(SNV)等光谱预处理方法在消除噪声影响, 提高光谱分别率等方面的能力, 选取最佳光谱预处理方法。 然后, 在第一次MC抽样中, 计算所有样本预测误差均值和标准差的平均值, 以该平均值的2.5~3倍作为可疑样本阈值, 3倍作为异常样本阈值; 剔除异常样本, 保留并标注可疑样本, 进行第二次MC抽样, 以样本预测误差均值和标准差的3倍值为阈值进行异常样本二次剔除; 对第一次MC抽样中标注可疑样本进行二次检测。 最后, 对比分析了基于全波长建立的偏最小二乘回归(PLSR)模型和基于回归系数法(RC)提取的特征波长建立的PLSR模型。 研究结果表明, 所提出的二次迭MC算法可以准确判别可疑样本是否为异常样本, 有效优化样本集, 为建模提供良好的数据基础。 以MSC作为光谱预处理算法基于400~950和900~1 650 nm两段高光谱数据建立PLSR模型的RP2分别为0.947 2和0.978 3, RMSEP分别为47.789 9和30.590 1 g, 优于其他三种光谱预处理算法。 另外, 基于900~1 650 nm建立的PLSR模型明显优于基于400~950 nm波长样本集建立的模型。 通过RC算法选取出羊肉硬度在400~950和900~1 650 nm波长范围的特征波长分别为14个(410, 438, 450, 464, 539, 558, 612, 684, 701, 734, 778, 866, 884和935 nm)和10个(915, 949, 1 085, 1 156, 1 206, 1 262, 1 318, 1 384, 1 542和1 580 nm)。 其中, 基于900~1 650 nm波长建立的PLSR模型的RP2为0.985 0, RMSEP为24.397 0 g, 为羊肉硬度预测的最佳模型。 结果表明, 所提出的融合二次迭代MC算法的PLSR模型可以有效预测羊肉冷藏过程中硬度特性变化趋势, 为羊肉品质无损检测相关研究提供参考。
可见-近红外光谱 二次迭代Monte Carlo 偏最小二乘回归模型 羊肉硬度 Visible-near infrared spectroscopy Twice iterative Monte Carlo PLSR Mutton hardness 
光谱学与光谱分析
2021, 41(7): 2057
作者单位
摘要
1 中国农业科学院农产品加工研究所, 农业部农产品加工综合性重点实验室, 北京 100193
2 金胜粮油集团有限公司, 山东 莒南 276600
3 北京农学院, 北京 102206
花生球蛋白、 伴花生球蛋白及亚基含量显著影响蛋白质的凝胶性和溶解性等功能特性, 进而影响其在肉制品、 植物蛋白饮料中的应用效果。 目前常采用提取蛋白质后再用电泳及光密度法测定球蛋白、 伴球蛋白及亚基含量的方法, 操作步骤繁琐, 样品损失量大。 为此收集了178个花生品种, 分别提取蛋白, 采用电泳法测定球蛋白、 伴球蛋白、 23.5和37.5 kDa亚基含量并获得大量数据的基础上, 利用近红外光谱技术进行整粒花生样品的光谱扫描, 将其与传统方法测定的化学值进行拟合, 采用偏最小二乘回归(PLSR)化学计量法构建数学模型。 通过比较单一和复合光谱预处理方式, 对比模型相关系数和误差评估预测模型性能。 确定球蛋白模型最佳预处理方法为2nd-der with Detrend, 校正集相关系数为0.92, 标准差为1.41; 伴球蛋白模型最佳预处理方法为Detrend with 1st-der, 校正集相关系数为0.85, 标准差为1.46; 23.5 kDa亚基含量模型最佳预处理方法为Normalization with 2nd-der, 校正集相关系数为0.91, 标准差为0.53; 37.5 kDa模型最佳预处理方法为Detrend with Baseline, 校正集相关系数为0.91, 标准差为0.89。 外部验证结果表明, 球蛋白预测均方根误差(square errors of prediction, SEP)为1.25, 伴球蛋白SEP为0.73, 23.5 kDa模型SEP为0.47, 37.5 kDa模型SEP为0.75。 本研究基于近红外光谱技术实现了对整粒花生进行球蛋白、 伴球蛋白、 23.5 kDa和37.5 kDa亚基含量的同步、 快速和无损检测, 为育种专家加工专用品种选育和蛋白加工企业原料选用提供了根据。
近红外光谱分析 花生球蛋白 伴花生球蛋白 亚基含量(23.5和37.5 kDa) 偏最小二乘法(PLSR) Near infrared spectral analysis Arachin Conarachin Subunit content (23.5 kDa and 37.5 kDa) Partial least squares regression (PLSR) 
光谱学与光谱分析
2021, 41(3): 912
作者单位
摘要
高光谱成像技术可以无损检测植物不同尺度的理化信息, 现有研究往往以分析高光谱图像的平均光谱为主, 忽略了其空间维度的信息。 以模式植物拟南芥为研究对象, 探究高光谱成像不同扫描速度引起的图像空间分辨率差异对植物冠层含水率测量的影响, 为高光谱成像在线快速检测植物冠层含水率提供优化方案。 首先利用室内在线高光谱成像系统分别在20, 30和40 mm·s-1三种扫描速度下采集了拟南芥冠层高光谱图像, 并提取拟南芥冠层平均反射光谱。 其次, 利用偏最小二乘算法(PLSR)建立了拟南芥冠层含水率与平均反射光谱的定量分析模型, 通过决定系数(R2)、 均方根误差(RMSE)、 相对分析误差(RPD)对模型进行评估。 比较基于原始光谱与多元散射校正算法(MSC)、 Savitsky-Golay平滑算法等预处理光谱建立的PLSR模型, 选取最佳光谱预处理方法用于后续的数据处理。 最后, 利用连续投影算法(SPA)分析比较基于最优特征波长与全波长的模型预测准确度, 探明高光谱图像扫描速度对拟南芥冠层含水率预测的影响规律。 研究结果表明, 当扫描速度从20 mm·s-1提升到30 mm·s-1时, 基于MSC预处理的全波段PLSR模型预测拟南芥冠层含水率决定系数降低0.88%, 小于1%; 当扫描速度从20 mm·s-1提升到40 mm·s-1时, 拟南芥冠层含水率决定系数降低2.3%。 说明在适当提高扫描速度的同时, 能够保证植物冠层的高含水率预测准确度。 改变高光谱扫描速度可以更有效地利用高光谱图像空间维度有效信息, 扫描速度适当增大后, 高光谱图像的空间维度信息改变, 提高实际生产应用环节的图像采集效率, 减少数据处理时间。
拟南芥 冠层含水率 近红外高光谱 扫描速度 Arabidopsis thaliana Canopy moisture content Near-infrared hyperspectral imaging Scanning speed SPA PLSR SPA PLSR 
光谱学与光谱分析
2020, 40(11): 3508

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!