1 上海烟草集团有限责任公司技术中心, 上海 200082
2 上海真谱信息科技有限公司, 上海 200444
3 同济大学环境科学与工程学院, 上海 200092
分别基于近红外和电子鼻融合数据、 近红外数据以及电子鼻数据建立判别烟叶清香型、 中间香型和浓香型三种香型风格的定性判别模型, 结果表明虽然三种模型的建模准确率差异不大, 都超过了89.00%, 但基于融合数据建立的模型对中间香型和浓香型的预报准确率分别为82.67%和80.00%, 比仅仅利用近红外数据建立模型的72.41%和73.33, 也比仅仅基于电子鼻数据建立模型的68.97%和53.33%都有明显的提高。 融合后预报准确率提高的可能原因是: 电子鼻风味分析仪对于影响中间香型和浓香型的烟叶致香成分感应更加灵敏, 捕获的信息也更多, 这些新的信息可以作为NIR数据信息的有利补充, 可用于建立烟叶香型分类判别准确率更高的模型。 同时本研究还基于相同的融合数据, 对比不同数据挖掘算法建模和预报结果差异性。 实验结果表明: 人工神经网络的建模结果高于支持向量机建模, 人工神经网络模型的预报结果准确率只有65.00%, 远低于支持向量机模型的预报结果的83.75%。 这也验证了支持向量机算法可以在建模过程中减少过拟合。 该研究可以为快速鉴别烟叶香型风格提供支撑, 而且随着研究的深入可以争取为烟草系统的专业评吸人员提供辅助的鉴别方法。英文标题>Discriminating Flavor Styles via Data Fusion of NIR and EN
近红外 电子鼻 香型风格 数据融合 NIR EN Fragrance style Data fusion
烤烟香型的判别一直是烟草行业的关注焦点。 利用中红外和近红外光谱对189份不同香型的烟叶进行分析。 分别从中红外谱图数据中提取21个特征波数处以及近红外谱图数据中13个特征波数处的吸光值作为影响因素。 通过主成分分析方法分别对选取的中红外、 近红外数据进行烟叶清香型、 中间香型和浓香型三种香型风格的定性分析。 结果表明基于中红外和近红外数据PCA投影图中三种香型混淆严重, 区分界面不清晰。 随后, 将中红外、 近红外数据进行融合, 将提取的34个特征波数处的吸光值同时代入主成分分析, 得到基于中红外和近红外融合数据的PCA投影图。 该投影图可以将不同香型的烟叶明显地区分出来。 随后利用后退法和遗传算法对中红外和近红外融合后的34个吸光度值进行变量选择, 后退法选择出了24个变量, 遗传算法选择出了19个变量。 对比34, 24和19个变量的烟叶三种香型风格的主成分投影图, 遗传算法虽然选择了比较少的变量, 但其仍然可以将烟叶进行准确的分类。 利用遗传算法对中红外和近红外融合后数据进行变量选择, 剔除对烟叶香型分类影响小的因素。 最后, 利用支持向量机建立烟叶清香型、 中间香型和浓香型分类判别模型。 该模型的建模结果准确率为92.72%, 其中清香型、 中间香型和浓香型的准确率分别为93.75%, 92.11%和91.84%。 内部交叉验证留一法结果准确率为88.74%, 其中清香型、 中间香型和浓香型的准确率分别为90.63%, 86.84%和87.76%。 对未知样本预报结果的准确率为86.84%, 其中清香型、 中间香型和浓香型的准确率分别为88.24%, 85.71%和85.71%。 无论是建模结果、 留一法结果和预报结果其准确率都大于85%。 研究结果表明中红外和近红外数据融合可以提供更多的特征信息, 利用这些信息可以建立烟叶香型风格的分类判别模型, 为烟叶香型风格快速鉴别提供帮助。
中红外光谱 近红外光谱 烤烟 数据融合 Middle infrared spectrum Near infrared spectrum Tobacco flavor Data fusion
1 上海烟草集团有限责任公司技术中心, 上海 200082
2 华东理工大学化学与分子工程学院, 上海功能性材料化学重点实验室, 上海 200237
色素是烟草中的重要组成成分, 烟草的外观质量和内在品质都与色素相关。 色素主要分为绿色素、 黄色素和黑色素。 在生长期, 烟草中的绿色素主要是叶绿素, 成熟期的烟草中黄色素则主要为叶黄素和胡萝卜素, 黑色素则存在于成熟的烟叶中, 或在调制和发酵的过程中产生。 色素的检测对于烟草原料评价和成品质量都非常重要。 鉴于烟草色素基于液相色谱的传统检测方法耗时较长、 样品制备过程复杂, 以及拉曼光谱操作简单、 测定时间短、 能提供有关分子官能团信息的特点, 开发了一种应用拉曼光谱同时定量检测烟草中叶黄素和β-胡萝卜素的快检方法。 烟草样品的有机溶剂提取物, 密封在透明玻璃瓶中, 将激光聚焦于瓶内溶液样品直接测定拉曼光谱。 研究发现, 不同于常见的514和785 nm激发波长, 在短波455 nm激光作用下, 可获得更理想的拉曼信号, 光谱强度较高, 荧光干扰较低。 对色素萃取溶剂、 焦平面与光学平台间的距离等实验条件进行了优化。 考虑到不同检测日期仪器操作条件的变化可对拉曼光谱产生影响, 以溶剂峰为内标峰, 对光谱进行归一化处理, 以校正因测定条件不稳定而引起的物理干扰。 为了解决荧光干扰, 以及色素分子之间的拉曼光谱干扰问题, 采用偏最小二乘法(PLS)建立光谱分析的多元校正模型。 建模中对波长区域以及光谱预处理方法进行了优化。 研究结果表明, 光谱归一化处理显著降低了因物理因素产生的光谱干扰, 光谱求导运算对建模影响不大, 而波长选择能明显改善模型的预测能力。 利用798.2~1 752.8 cm-1波段建立叶黄素的PLS定量模型时, 预测效果最佳, 预测集的均方根误差(RMSEP)为6.68 μg·g-1; 对于β-胡萝卜素, 798.2~1 752.8 cm-1组合2 254.2~2 784.5 cm-1用来建模时得到的RMSEP最小, 为2.56 μg·g-1。 该方法操作简便、 耗时少、 结果准确可靠, 为烟草样本中色素的定量分析提供了一种切实有效的新途径。
拉曼光谱 烟草 色素 偏最小二乘法 Raman spectroscopy Tobacco Pigments PLS 光谱学与光谱分析
2019, 39(11): 3519