基于拉曼光谱的混合物组分识别方法 下载: 1846次
1 引言
混合物中的成分识别在食品安全检测[1]、水质鉴定[2]、安检、反恐、缉毒[3]等众多领域应用广泛,识别的方法也多种多样。传统的识别方法有质谱色谱联用法[4]、生物免疫法、固相萃取法[5]、化学实验室法等,它们分别存在着检测对象单一、重复率低、操作复杂和实验条件要求严格等问题。近年来,拉曼光谱因其快速、无损且重复性高等优点,被应用到许多场合。现有的利用拉曼光谱实现混合物成分检测的方法有峰对比法[6-7]、子空间重叠法[8]、最小二乘支持向量机[9]等,但都存在着一些不足。
峰对比法是通过比较混合物拉曼光谱与标准库中物质的拉曼光谱的波峰或波谷位置,并结合有关化学键或功能团的拉曼光谱特征,实现物质识别。峰对比法在一些特定场合能有效识别混合物中的成分,但大部分情况下混合物的拉曼光谱谱峰众多,会出现重叠和覆盖的现象。同时由于检测环境复杂、仪器精度较低,拉曼谱峰可能会有偏移,并且峰对比法依赖于人眼的判定,较为费时费力,这些都在一定程度上造成了峰对比法的局限性。
子空间重叠法将待定性混合物光谱信息视为向量,通过计算混合物光谱与标准库光谱的子空间夹角,并根据其变化,排列筛选出混合物的组分。该方法要求待识别混合物中的所有组分应包含在已知的标准数据库中,当混合物中的待识别成分不在已知数据库中时,算法将无法给出识别结果。
使用基于多重迭代优化的最小二乘支持向量机模型对混合物的拉曼光谱进行识别,可以得到混合物的组分信息。该方法在训练模型时需要大量的训练样本,这会影响识别方法的实用性和快速性。
在已有研究工作的基础上,本文提出一种拉曼光谱结合化学计量学的新方法来实现混合物中的成分识别。该方法首先对混合物的拉曼光谱进行预处理,然后拟合得到谱峰的特征参数向量,最后将混合物光谱特征参数向量与标准数据库中样本的特征参数向量进行相关性分析,能快速、无损地识别混合物中的成分。
2 混合物成分识别算法
所提出的基于拉曼光谱的混合物组分识别算法的整体流程图如
Step1:受混合物本身特性、仪器精度和测量方法等因素影响,所测得的混合物光谱中有较强的荧光背景和噪声,进行背景校正[10-11]和去噪[12-13]等预处理操作是进行后期工作的前提。利用样条插值法对连续背景进行校正[14];对校正后的拉曼光谱采用“sym8”小波进行降噪,小波分解层数为5层,使用启发式软阈值选择策略;最后对降噪后的拉曼信号进行归一化操作,以便于后续的数据处理。
Step2:谱峰辨识。
在整个光谱区间里,利用相邻点极大极小值法获得光谱区间内的所有极大值点(
利用斜率比较法判断待识别谱峰(
Step3:进行单峰拟合和重叠峰分解操作。理论上,拉曼光谱的谱峰是洛伦兹线型[15],但由于混合物特性、仪器精度、测量方法等影响,实际得到的拉曼光谱的谱峰是Voigt线型,可表示为
式中:
拉曼光谱中不可避免会有谱线重叠的现象。谱线之间的重叠会影响每个谱峰特征参数的提取[16-17],这些重叠谱峰可以看作是Vogit峰的线性叠加,即
式中:重叠谱峰的序号
通过Vogit函数拟合,可得到每个谱峰的拉曼位移、强度和半峰全宽及高斯-洛伦兹系数。利用每个谱峰的拉曼位移、强度和半峰全宽组成待识别谱峰(
Step4:利用所得到的混合物特征参数向量组,与标准数据库中各物质的特征参数向量组进行相似度分析,实现混合物成分的检测。
标准谱库中各物质和待识别混合物的谱峰个数不同,导致构建的混合物谱峰特征向量个数与标准谱库中各物质特征向量个数不同,难以直接进行相似度分析。因此有必要对混合物的特征进行筛选匹配,以构建具有相同特征维数的特征向量。考虑到拉曼谱峰漂移现象,利用标准库中物质特征峰的拉曼位移这一特征,在一定的阈值范围内从混合物的特征峰里寻找峰位相近的特征峰[18],以构建最终的识别特征向量。具体方法如下。
设待识别的混合物特征向量为
此时,待识别混合物和标准库中给定物质的相关系数可表示为
式中:符号T表示转置运算。相关系数表示混合物中存在标准谱库中给定物质的可能性,其在区间[0,1)内取值。设置一个合适的阈值来分割所得到的相关系数,即可判断混合物中是否存在该特定纯净物,本文设置的阈值为0.8,遍历标准库从而实现混合物成分的识别。
3 光谱采集设备及数据介绍
利用18种纯净物构建标准数据库:丙酮(acetone)、环己烷(cyclohexane)、乙醇(ethanol)、磷酸(phosphoric acid)、甲基苯丙胺盐酸盐(methamphetamine hydrochloride)、氧-6单乙酰吗啡盐酸盐(oxy-6 monoacetylmorphine hydrochloride)、赤磷(red phosphorus)、海洛因盐酸盐(heroin hydrochloride)、氮芥气(nitrogen mustard)、二苯羟乙酸(diphenyl glycolic acid)、芥子气(mustard gas)、酒石酸(tartaric acid)、硫酸(sulfuric acid)、沙林(sarin)、碳酸钙(calcium carbonate)、硝酸(nitric acid)、乙腈(acetonitrile)、尿素(urea)。在这些纯净物中,丙酮极易溶于水和乙醇、乙醚等有机溶剂,合成的溴代苯丙酮可作为毒品的原料;环己烷易燃,且溶于丙酮,常被添加于丙酮中。准确识别这些有毒有害物质对维护公共安全有着重要作用。将丙酮、环己烷、乙醇三种物质混合,共得到6种混合物,混合物中纯净物按等比例混合,以验证本文方法的识别性能。利用北京卓立汉光仪器有限公司生产的便携式拉曼光谱仪(Finder Edge)采集这24种物质的拉曼光谱(18种纯净物,6种混合物),光谱仪激光波长785 nm,光谱范围为150~2700 cm-1,功率为0~350 mW,分辨率为8~10 cm-1。
图 3. 6种纯净物和混合物拉曼光谱图。(a)纯净物;(b)混合物
Fig. 3. Raman spectra of six kinds of pure substances and mixtures. (a) Pure substance; (b) mixture
4 实验过程及结果
经过预处理操作后,识别单峰和重叠峰,并对单峰进行拟合,对重叠峰进行分解。拟合、分解的效果如
图 4. 实验过程图。(a)原始光谱图和连续背景;(b)预处理后光谱图
Fig. 4. Experimental process. (a) Original spectrum and continuous background; (b) pretreated spectrum
图 5. 谱峰拟合及分解图。(a)单峰的拟合图;(b)重叠峰的分解图
Fig. 5. Peak fitting and decomposition plots. (a) Single peak fitting plot; (b) overlapping peak decomposition plot
分解完重叠峰后,得到重叠峰的特征参数,加上单峰里的特征参数,按特征参数里的拉曼位移值由小到大的顺序,将特征参数向量组进行排序,构成混合物溶液拉曼光谱的特征参数向量。将混合物特征参数向量与标准库中纯净物的特征参数向量作相关性分析,根据相关系数的大小来识别混合物中的成分。
如
图 6. 混合溶液与3种纯净物的光谱图。(a)丙酮;(b)环己烷;(3)乙醇
Fig. 6. Spectrogram of mixed solution and three kinds of pure substances. (a) Acetone; (b) cyclohexane; (c) ethanol
在
表 1. 6种混合物的识别结果
Table 1. Identification results of six kinds of mixtures
|
5 结论
提出了一种基于拉曼光谱的混合物组分识别方法,该方法对混合物拉曼光谱进行荧光背景校正和信号降噪等预处理操作;利用斜率判断法对拉曼光谱的谱峰进行重叠峰判断;并基于Voigt函数对原始谱峰进行拟合重构,构建了标准库中的物质和待识别混合物的特征向量;利用标准库中物质的谱峰位置信息对混合物特征向量进行了特征参数匹配筛选;最终获得了混合物和标准库中物质的相关系数。实验研究结果表明,本文方法能够充分利用多谱峰特征信息,克服不同物质混合带来的谱峰重叠干扰,实现混合物中组分的有效识别。需要说明的是,如果两个谱峰因极度重叠而呈现单峰形态,本文的重叠峰分解法将会失去作用,从而导致识别准确率降低。如何提高重叠峰识别的准确度是下一步需要解决的问题。
[1] 雷星, 刘晔, 黄竹林, 等. 高灵敏度锥形光纤SERS探针及其在农残检测中的应用[J]. 光学学报, 2015, 35(8): 0806001.
[2] 王娟, 张飞, 王小平, 等. 平行因子法结合自组织映射神经网络的三维荧光特征及其与水质的关系[J]. 光学学报, 2017, 37(7): 0730003.
[3] 和挺, 沈京玲. 太赫兹光谱技术在毒品检测中的应用研究[J]. 光谱学与光谱分析, 2013, 33(9): 2348-2353.
[4] 刘彬, 刘云虎. 食品塑料包装中18种多环芳烃的气相色谱-质谱联用检测方法研究[J]. 食品科技, 2018, 43(6): 317-321.
[5] 吴丽洒, 赵明月, 葛畅, 等. 固相萃取-GC/MS法同时测定卷烟主流烟气中的16种多环芳烃[J]. 烟草科技, 2018, 51(4): 46-52.
[6] 李开开, 苗翠英, 王登魁. 利用拉曼光谱对毒品的检验及基于R软件的数据分析[J]. 光散射学报, 2018, 30(2): 156-162.
[7] 马靖. 激光拉曼光谱技术对氯代有机混合物的快速检测研究[J]. 光谱学与光谱分析, 2014, 34(7): 1865-1868.
[8] 黄培贤, 姚志湘, 粟晖, 等. 基于子空间重合判断的混合醇组分光谱识别方法[J]. 分析测试学报, 2013, 32(3): 281-286.
[9] 章颖强, 董伟, 张冰, 等. 基于拉曼光谱和最小二乘支持向量机的橄榄油掺伪检测方法研究[J]. 光谱学与光谱分析, 2012, 32(6): 1554-1558.
[10] 杨桂燕, 李路, 陈和, 等. 基于广义Whittaker平滑器的拉曼光谱基线校正方法[J]. 中国激光, 2015, 42(9): 0915003.
[12] 范贤光, 王秀芬, 王昕, 等. 基于特征提取的低信噪比拉曼光谱去噪方法研究[J]. 光谱学与光谱分析, 2016, 36(12): 4082-4087.
[13] 王晓彬, 吴瑞梅, 刘木华, 等. 多菌灵农药激光拉曼光谱的小波去噪方法研究[J]. 食品工业科技, 2014, 35(5): 277-280.
[15] 檀兵, 黄敏, 朱启兵, 等. 激光诱导击穿光谱谱峰元素自动识别方法研究[J]. 中国激光, 2018, 45(8): 0811002.
[16] 李宝强, 李翠萍, 黄启斌, 等. 基于小波变换的便携式质谱重叠峰解析方法研究[J]. 质谱学报, 2015, 36(3): 199-205.
[17] Owusu-Ware S K, Chowdhry B Z, Leharne S A, et al. . Quantitative analysis of overlapping processes in the non-isothermal decomposition of chlorogenic acid by peak fitting[J]. Thermochimica Acta, 2013, 565(24): 27-33.
[18] 侯兴松, 张健, 镡云. 拉曼特征峰提取在多组分混合溶液检测中的应用[J]. 现代科学仪器, 2014( 4): 100- 104.
Hou XS, ZhangJ, TanY. Application of Raman spectra feature extraction in material identification[J]. Modern Scientific Instruments, 2014( 4): 100- 104.
Article Outline
刘财政, 朱启兵, 黄敏, 李敏. 基于拉曼光谱的混合物组分识别方法[J]. 激光与光电子学进展, 2019, 56(8): 083004. Caizheng Liu, Qibing Zhu, Min Huang, Min Li. Identification of Components in Mixtures Based on Raman Spectroscopy[J]. Laser & Optoelectronics Progress, 2019, 56(8): 083004.