1 东北林业大学工程技术学院, 黑龙江 哈尔滨 150040
2 上海宇航系统工程研究所, 上海 201100
光谱分析在木材种类识别领域具有一定的潜力, 而其中的中红外光谱也广泛应用于定性及定量分析。 该研究中红外光谱法识别木材种类的报道中, 基于深度卷积神经网络可以在参数较少的条件下获得较高的识别率。 提出了一种聚类分析(CA)、 对称点阵图像分析(SDP)与深度学习(DenseNet)相融合的算法, 利用DenseNet的优势提高中红外光谱法识别木材的准确率。 首先, 采集了愈疮木、 巴里黄檀、 刺猬紫檀、 大果紫檀、 螺穗木5种木材样本的250组中红外光谱数据, 应用欧式距离进行了异常值剔除, 剩余240组作为待分析数据并对其进行分类的可行性分析。 对光谱数据进行SDP转化分析, 确定SDP转化的最优参数; 之后, 运用CA筛选原始光谱数据的特征, 根据CA不同阙值确定了三组维数的特征并进行讨论, 通过对比三组特征数据经过SDP转化后图像间的类内相似性和类间差异性, 初步确定了最优维数特征; 再将初步确定的最优维数特征数据输入到SDP-DenseNet模型中, 获得模型识别的准确率; 最后通过对比分析验证了模型的有效性, 一方面将原始数据及其余两组对照维数的特征数据分别输入到SDP-DenseNet模型中, 对比识别的准确率; 另一方面以最优维数特征数据输入到随机森林中进行识别, 对比传统机器识别与SDP-DenseNet算法识别的准确率。 结果表明: 经CA特征筛选的SDP-DenseNet模型普遍高于原始数据直接输入到SDP-DenseNet模型的准确率, CA特征筛选最优维数为255维, 其测试集最高识别率达到了88.67%, 而对照组107维为77.78%, 322维为68.89%, 原始数据的SDP-DenseNet模型识别率仅为57.78%; 经CA特征筛选的最优维数数据对应的随机森林模型识别率较低, 仅为66.67%。 因此, 提出的CA-SDP-DenseNet模型能有效提高中红外光谱法识别木材种类的精度。
中红外光谱 木材种类识别 聚类分析 对称点阵图像分析 深度学习 Mid-infrared spectroscopy Identification of wood species Cluster analysis Symmetrical lattice image analysis Deep learning
1 华东交通大学机电与车辆工程学院, 江西 南昌 330013
2 赣州出入境检验检疫局, 江西 赣州 341001
木材的种类识别是木材加工和贸易的一个重要环节, 传统的木材种类识别方法主要有显微检测法和木材纹理识别法, 其操作繁琐, 耗时长, 成本高, 不能满足当前需求。 本研究利用木材的近红外光谱(NIRS)结合模式识别方法, 以期实现木材种类的快速准确识别。 采用近红外光谱结合主成分分析法(PCA)、 偏最小二乘判别分析法(PLSDA)和簇类独立软模式法(SIMCA)三种模式识别对58种木材进行种类鉴别研究; 5点平滑、 标准正态变量变换(SNV)、 多元散射校正(MSC)、 Savitzky-Golay一阶导数(SG 1st-Der)和小波导数(WD)五种光谱预处理方法用于木材光谱的预处理; 校正集和测试集样品的正确识别率(CRR)用于模型的评价。 采用PCA方法, 通过样品的前三个主成分空间分布图分辨木材种类的聚类情况。 在建立PLSDA模型, 原始光谱的正确识别率最高, 分别为88.2%和88.2%; 5点平滑处理的光谱校正集和测试集的CRR分别为88.1%和88.2%; SNV处理的光谱校正集和测试集的CRR分别为84.4%和84.5%; MSC处理的光谱校正集和测试集的CRR分别为83.1%和84.2%; SG 1st-Der处理的光谱校正集和测试集的CRR分别为81.8%和82.7%; WD(小波基为“Haar”, 分解尺度为80)处理的光谱校正集和测试集的CRR分别为87.3%和87.2%。 可知, 在PLSDA模型中, 木材光谱未经预处理种类识别效果最后好。 在建立SIMCA模型过程中, 原始光谱的校正集和测试集的CRR分别为99.7%和99.4%; 5点平滑处理的光谱校正集和测试集的CRR分别为100%和100%; SNV处理的光谱校正集和测试集的CRR分别为99.5%和99.1%; MSC处理的光谱校正集和测试集的CRR分别为99.0%和98.4%; SG 1st-Der的光谱校正集和测试集的CRR分别为81.8%和82.7%; WD处理的光谱校正集和测试集的CRR分别为100%和100%。 可知, 在SIMCA模型中, 木材光谱经平滑和小波导数处理后的识别效果最好, 且光谱的校正集和测试集CRR都为100%。 采用三种模式结合五种不同的预处理方法对木材近红外光谱进行定性建模识别时, 由于木材样本属性复杂, 主成分分布图相互交织, PCA无法识别出58种木材; 原始光谱的PLSDA模型可以得到较好的判别模型, 但校正集和测试集的CRR只有88.2%和88.2%; 木材光谱经过5点平滑或WD预处理后的SIMCA模型可达到最好的识别效果, 校正集和测试集的CRR均为100%, 且WD-SIMCA模型因子数比5点平滑SIMCA模型小, 模型更为简化, 故WD-SIMCA为58种木材种类识别的最优模型。 研究表明光谱预处理方法可以有效的提高木材种类识别精度, 有监督模式识别方法SIMCA可以用来建立有效的木材识别模型, 近红外光谱结合模式识别可以为木材种类的识别提供一种快速简便的分析方法。
近红外光谱 木材种类识别 光谱预处理 偏最小二乘判别分析法 簇类独立软模式法 Near infrared spectroscopy (NIRS) Identification of wood species Spectral preprocessing Partial least squares discriminate analysis (PLSDA Soft independent modeling of class analogy (SIMCA)