1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
食用油是日常生活中的必需品。 市场上食用油在成分、营养价值及价格上有很大的不同。 为避免欺诈行为, 亟需建立一套有效的市场销售的食用油品质分类方法。 常规的食用油检测方法速度慢而且需要复杂的实验室预处理过程。 分子光谱从分子水平上反映了物质的组成与结构信息, 分子光谱分析速度快而且是无损监测, 因此分子光谱分析结合化学计量学的方法正成为食用油分类方法的趋势。 SIMCA(Soft Independent Modeling of Class Analogy)是应用广泛的分子光谱分析方法, 然而在SIMCA中使用欧氏距离于对基于PCA和F检验提取的特征进行分类, 难以区分不规则的特征空间。 由于食用油样本分子光谱差别细微, 通常难以用SIMCA方法进行分类。 SVDD(Support Vector Domain Description)算法是一类基于支持域的非线性单类分类方法, SVDD利用求解凸二次规划得出一个尽可能包含所有目标样本的最小超球体进行分类。 本文提出了一种基于SIMCA-SVDD方法的分子光谱分析方法并用于食用油的快速分类。 为鉴别不同种类的食用油, 在ATR-FTIR光谱仪上扫描四种食用油的红外光谱。 应用SIMCA方法提取分类特T2和Q, 由于提取的特征T2和Q分布的不规则性, 不同于SIMCA中的欧氏距离, 本文采用SVDD用于对提取的不规则特征进行分类。 由于SVDD能通过映射函数将分类特征映射到高维空间, 因此可以通过求解凸二次规划来训练最优的分类超球面对分类特征进行分类。 采用本文所提的SIMCA-SVDD方法及传统的SIMCA方法, 对同样的样本进行了对比实验。 对比实验证实了本文所提的SIMCA-SVDD方法具有比传统的SIMCA方法更好的分类结果, 所提的方法为实现基于分子光谱进行食用油快速分类提供了一条新的途径。
食用油 分子光谱 欧氏距离 Edible oil Molecular spectrum SIMCA SIMCA Euclidean distance SVDD SVDD 光谱学与光谱分析
2020, 40(8): 2651
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与技术学院, 北京 100029
纯棉与丝光棉制品是日常生活中常用的两种纤维制品, 但是由于二者在物理结构和化学结构上非常相似, 以至于使用一些简单的方法难以准确识别一部分纯棉与丝光棉制品。 提出一种使用水含量作为扰动的二维相关光谱结合机器学习方法来对二者进行鉴别的新方法。 共使用从专业机构获得的200个标准样本来设计实验对新方法进行验证, 其中包括100个纯棉样本与100个丝光棉样本。 对每一个样本, 使用水含量作为扰动, 分4次改变样本水含量并采集该水含量下样本的一维光谱, 其中4次的水含量分别为20.20%, 14.52%, 7.77%与0%。 根据四条不同的一维构造每一个样本的动态光谱, 再通过二维相关算法来计算其同步二维相关光谱, 从该同步二维相关光谱中使用移动窗口技术提取三组不同的分类特征, 每组特征分别对应一个设计好的支持向量机(SVM)分类器。 之后本文提出一种基于信息熵的多分类器融合方法, 根据权值不同, 将三个分类器融合为一个具有更优效果的强分类器。 为了验证方法的准确性与有效性, 设计了严谨的实验对方法进行验证。 实验首先按照传统的从一维光谱中提取特征的方法对纯棉与丝光棉样本进行鉴别, 使用两种样本各50个来进行分类模型建立, 剩余的进行模型验证, 分类效果最高只有76%。 但是基于从二维相关光谱中提取的三组特征设计的三个支持向量机(SVM)分类器的准确率分别可以达到88%, 90%, 88%, 最后根据提出的基于信息熵的多分类器信息融合方法将三个分类器进行融合同一可以得到92%的分类准确率, 比三个基础分类器准确率都有提升。 与从一维光谱中提取特征并设计分类器进行分别鉴别相比, 从二维相关光谱中提取特征设计多个分类器并使用基于信息熵的多分类器信息融合方法进行分类鉴别具有更高的分类准确率。 二维相关光谱将光谱信息扩展到更高的维度, 将一维光谱中隐藏的折叠峰进行展开, 因此具有更高的分类准确率。 提出的方法是一种快速准确鉴别纯棉与丝光棉制品的新方法。
二维相关光谱 纯棉与丝光棉 支持向量机 信息熵 信息融合 Two-dimension correlation spectroscopy Cotton and mercerized cotton Support vector machine Information entropy Information fusion 光谱学与光谱分析
2019, 39(5): 1653
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与技术学院, 北京 100029
分子光谱分析技术结合化学计量学已成为一种非常活跃的食用油鉴别方法。 然而, 当不同类型的样本之间的光谱差异极其微小时, 利用传统的分类技术也很难将其分开。 为了完成相似品种食用油的快速识别和分类, 收集了包括芝麻油、 玉米油、 油菜籽油、 调和油、 葵花油、 花生油、 橄榄油七种食用油的衰减全反射红外光谱, 在此基础上, 采用图像识别的方法对七种食用油进行快速分类。 在所提出的图像识别方法中, 首先, 将通过多元散射校正预处理后的红外光谱吸光度矩阵进行自相关运算, 利用等高线原理根据吸光度强度值的不同生成光谱图像, 以扩大的光谱差异并提高光谱可视化。 然后, 根据图像膨胀的原理找到光谱图像的局部特征点, 将其作为图像特征。 最后, 使用BP神经网络对特征点进行训练和分类预测。 为了对比所提出的方法, PCA-BP和KL-BP的方法被用于与图像识别的方法进行比较, 实验结果表明, 图像识别方法的正确识别率为94.4%, 高于PCA-BP的66.7%和KL-BP的83.3%。 所提方法为实现食用油的快速识别和检测提供了一条新的有效途径。
食用油 分子光谱 光谱可视化 特征提取 图像识别 Edible oil Molecular spectrum Spectral visualization Feature extraction Image recognition
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
无论是近红外还是红外光谱, 多元校正模型的传递问题都尚未解决。 为了实现模型和光谱的传递, 提出了一种改进的PDS算法——SA-PDS算法, 论方法通过PDS算法进行模型传递, 使用光谱间的夹角大小作为判定准则来选择传递参数, 使得模型传递过程不受到样品性质参考值的影响, 也不再依赖于模型, 并且可以双向传递。 该方法分别通过在近红外数据和中红外数据中应用来证明模型传递的可行性, 实验收集烟叶样本测得其近红外光谱, 沥青样本测得其中红外光谱, 将烟叶总糖会计师和沥青蜡含量作为模型预测对象。 使用光谱夹角作为PDS参数选择标准与使用预测标准偏差作为判定准则相比, 实验表明: 对于近红外光谱的从机向主机的传递, 其验证集预测精密度RMSEP从5.257 4降低至1.337 1, 优于RMSEP(1.350 3)方法, 预测偏差也同样被改善。 对于中红外光谱从机向主机的传递, 新方法验证集预测精密度RMSEP从0.525 1降低至0.186 9, 优于RMSEP(0.219)方法。 主机向从机的传递也取得了满意的传递结果。
近红外光谱 中红外光谱 光谱传递 分段直接校正法 光谱夹角 NIR spectroscopy MIR spectroscopy Spectra transfer Piecewise direct standardization Spectral angle
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
3 碳纤维及功能高分子教育部重点实验室, 北京 100029
4 北京市毛麻丝织品质量监督检验站, 北京 100085
5 内蒙古自治区纤维检验局, 内蒙古 呼和浩特 010000
SIMCA采用PCA模型参数和F检验构造计算T2i/T2ucl和Si/Q统计量作为样本分类的新属性, 并计算待测样本到各类主成分空间的欧式距离作为判别类别的依据, 是一种最常用和优秀的光谱分类方法。 但是, 在Q对T2作图平面上, 以欧式距离确定的样本分布范围是一个圆, 多数情况下并不一定能符合实际样本分布规律。 本文在分析了SIMCA理论缺陷的基础上, 提出了一种新方法, 即用马氏距离代替欧氏距离作为判别依据来判断样本的类别。 并设计了采用红外光谱判别组分比例很接近的掺假食用油样本的实验, 以及用近红外光谱判别相近皮毛样本的实验。 用调和比5%~8%的食用油红外光谱PCA模型, 分别以马氏距离和欧式距离计算出其样本的分布范围, 结果表明马氏距离的分类与识别能力更强。 新方法和SIMCA对动物皮毛样本的正确识别率分别为87.5%和75%, 对比例相近的食用油调和油的正确识别率分别为65%和55%。 结果表明新方法对化学组成差异微小的样品分类精度明显优于SIMCA。
SIMCA方法 马氏距离 欧氏距离 光谱分析 SIMCA method Mahalanobis distance Euclidean distance Spectral analysis 光谱学与光谱分析
2017, 37(8): 2493
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
针对不同型号的近红外光谱仪器(主机: SupNIR-2700, 从机: Nicolet Antaris Ⅱ)间的模型传递和同一仪器(Nicolet Antaris Ⅱ)不同分辨率的光谱间的模型传递进行研究, 提出了一种改进的PDS算法-SP-SG1st-PDS算法, 该方法结合三次样条插值、 Savitaky-Golay一阶求导和PDS算法。 思路是通过三次样条插值拟在不破坏原始光谱固有的信息的前提下实现了主光谱与从光谱之间的匹配, 然后对光谱进行S-G一阶求导去除光谱的基线漂移, 再通过PDS算法进行模型传递, 有效消除主、 从光谱之间的差异, 提高多元校正模型的预测精度。 该方法用于醋酸乙烯酯在乙烯-乙酸乙烯酯共聚物中含量的研究, 并且与小波去噪方法和S-G平滑方法作比较。 实验表明: 对于不同型号的仪器间的模型传递, 新方法采用S-G一阶求导较其他方法有明显的优势, 其验证集预测精密度RMSEP从20.595 0降低至0.374 8, 明显优于S-G平滑(0.522 1)和小波去噪(0.516 7)方法, 预测偏差也同样地被改善。 对于同一仪器不同分辨率的光谱之间的模型传递, 在模型传递前后其模型预测精密度RMSEP从0.272 2减少至0.255 3。 通过提出的SP-SG1st-PDS算法, 模型传递能应用于不同类型仪器之间, 也能用于相同仪器不同分辨率的光谱之间, 并且取得了满意的传递结果。
近红外光谱 模型传递 分段直接标准化 Savitaky-Golay一阶求导 三次样条插值 NIR spectroscopy Calibration model transfer Piece-wise direct standardization Savitaky-Golay smoothing with first order derivati Cubic spline interpolation 光谱学与光谱分析
2017, 37(5): 1587
北京化工大学信息科学与技术学院, 北京 100029
提出了一种在小样本条件下建立光谱定量分析的新方法-Bootstrap-SVM模型。 以道路沥青为研究对象, 共收集29个来自6个不同单位的沥青样本, 利用所提方法建立了沥青针入度定量分析模型。 Bootstrap-SVM由Bootstrap重抽样、 噪声注入及SVM三个步骤组成。 为了对比所提方法的优势, 对比了目前常用的PLS模型以及SVM模型。 研究结果表明Bootstrap-SVM, PLS, SVM预测均方根误差分别为0.773 5, 2.889, 1.784 4, 所提方法预测精度最好, 为小样本条件下光谱定量分析提供了一种新的有效方法。
小样本 支持向量机 Spectrum quantitative analysis Bootstrap Small sample set Bootstrap Support vector machines Partial least squares 光谱学与光谱分析
2016, 36(5): 1571
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
3 中国计量科学研究院, 北京 100029
提出了一种衰减全反射红外光谱法快速分类和识别多种食用油的方法——KL-BP模型.此模型利用KL算法对原始光谱数据分类特征进行提取并对原始数据降维,降维后的数据作为神经网络的输入建立分析模型.实验共收集了九种食用油包括芝麻油、玉米油、油菜籽油、调和油、葵花油、花生油、橄榄油、大豆油、茶籽油,共84个样品,并测定了其衰减全反射红外光谱.为了对比所提方法性能,分别建立PCA直接分类、KL直接分类、PLS-DA、PCA-BP和KL-BP模型的分类结果进行对比.研究结果表明,对所研究的9种食用油,PCA直接分类、KL直接分类、PLS-DA、PCA-BP和KL-BP方法的识别率分别为59.1%,68.2%,77.3%,77.3%和90.9%.在数据降维中,KL算法通过分别提取使类间距离和类内距离比值最大方向的特征向量提取和包含在类内离散度矩阵中的分类信息,能够比PCA方法提取了更多的分类信息;引入BP神经网络能有效地提高分类能力和分类准确率;KL-BP综合了KL对分类信息提取优势以及BP神经网络自学习、自适应、非线性的优点,在分类和识别成分相近的9种食用油中表现出了最优秀的能力.
食用油 红外光谱 主元分析法 KL变换 BP神经网络 Edible oil PCA KL conversion BP neural network 光谱学与光谱分析
2015, 35(7): 1879
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
分析了校正集和验证集样品数随性质分布不均匀性对光谱多元分析校正的不良影响, 揭示了实际光谱多元校正中“均值化”现象, 即性质值小的样本预测值结果偏大, 性质值大的则偏小, 提出了一种优选样品新方法—Rank-KS。 其综合考虑光谱空间和性质空间对样本进行挑选, 将性质空间平均分为若干小区间, 在每个小区间内分别利用Kennard-Stone法和随机法进行校正集和验证集样本的挑选, 这样得到的校正集和验证集可明显改善样本数随性质分布的均匀性。 以红外光谱测定汽油中碳酸二甲酯(DMC)含量和近红外光谱测定二甲亚砜溶液二甲亚砜浓度为研究对象, 分别采用Rank-KS、 随机法、 Kennard-Stone、 浓度梯度法和SPXY等方法选择校正集和验证集样品, 使用多元线性回归和偏最小二乘法建立模型, 比较这些方法对光谱多元校正分析的影响, 结果表明Rank-KS方法可改善校正集和验证集样品数随性质分布的均匀性; 对于样本数分布中间局部样本多和两端局部少、 或者局部没有样本的样本集, 使用Rank-KS算法挑选校正集, 无论使用MLR还是PLS1建立多元分析模型, 均能明显改善其模型预测能力, 使得到的模型的预测均方根最小。
样本分集 PLS回归 Kennard-Stone理论 近红外光谱 红外光谱 Sample subset partitioning PLS regression Kennard-Stone algorithm NIR spectrometry IR spectrometry