作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
特殊恒星是金属丰度异常的恒星, 其中包含的信息对于研究宇宙起源、 太阳系的演变以及生命的演化都有着重要的意义。 因此, 特殊恒星的搜寻是国内外巡天项目中的重要目标。 恒星光谱中包含着恒星的化学成分、 物理性质以及运动状态等丰富的信息, 它是开展恒星研究的重要依据。 恒星的识别、 分类以及特殊恒星的发现主要依据的是恒星光谱数据。 随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开, 恒星光谱的数据量达到了前所未有的高度, 如此大的数据量为特殊恒星的发现提供了强有力的支撑。 因此如何利用这些数据快速准确地发现特殊、 稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。 数据挖掘是结合模式识别、 机器学习、 统计分析及相关专家背景知识, 从数据中提取出隐含的过去未知的有价值的潜在信息的技术, 其在处理大数据方面有着天然的优势, 越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。 目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、 聚类分析以及异常值检测等, 但随着巡天深度的拓展, 观测的目标越来越暗, 进而观测光谱的信噪比也随之变低。 低信噪比光谱中存在着大量的无用信息, 直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。 因此, 如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱, 是当前面临的一个重要问题。 由于低信噪比恒星光谱本身的特点, 对于从中搜寻特殊恒星光谱的工作开展较少。 为了解决此问题, 在仔细研究光谱数据处理方法的基础上, 针对低信噪比巡天数据中特殊恒星光谱的搜寻, 提出了一种以主成分分析(PCA) 和基于密度峰值聚类为基础的方法。 该方法首先选取O, B, A, F, G, K和M各种类型的高信噪比恒星光谱, 进行波长统一和流量插值后, 利用主成分分析得到特征光谱; 然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱; 最后利用重构之后的高信噪比光谱进行聚类, 聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。 在聚类时, 考虑到恒星光谱数据本身的特点, 采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。 实验表明, 该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。 同时, 也可应用于诸如LAMOST、 SDSS等各种银河系巡天的光谱数据分析与挖掘中。
银河系巡天 离群数据挖掘 低信噪比光谱 Galaxy survey Outlier data mining Low SNR spectra 
光谱学与光谱分析
2019, 39(2): 618
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 哈尔滨理工大学荣成学院, 山东 威海 264300
3 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
恒星的连续谱是由于黑体辐射导致的光辐射强度随波长(频率)连续光滑变化的光谱。 每条观测到的光谱数据中都会包含连续谱、 谱线和噪声。 恒星的分类主要是依据光谱的谱线、 连续谱的相对强度以及光谱的其他特征。 恒星连续谱的分布以及谱线的轮廓是由恒星大气内的物理因素决定的, 也可以根据连续谱及谱线对恒星大气的物理参数进行估计。 因而处理光谱的主要问题就是提取连续谱, 并且通过归一化进行谱线的提取。 恒星连续谱提取的算法主要有多项式逼近、 中值滤波、 形态滤波以及小波滤波等, 但是这些方法对于低质量光谱处理的鲁棒性不是很好, 因此有必要研究一种新的算法对低质量光谱的连续谱进行提取。 在仔细分析恒星低质量连续谱的基础上, 提出一种基于蒙特卡罗方法的低质量恒星连续谱拟合方法。 该方法对恒星光谱筛选过程中不在范围内的点利用蒙特卡罗均匀分布进行自动插值, 让每一个波长都对应一个流量点, 然后对这些流量点进行低阶多项式迭代拟合, 从而得到连续谱。 为了验证算法对不同信噪比的低质量光谱连续谱提取的鲁棒性, 利用不同的信噪比在原始光谱中加入不同的高斯白噪声对低质量光谱进行模拟。 结果表明蒙特卡罗算法对不同信噪比的低质量光谱的拟合具有较高的精度与较强的鲁棒性。
低质量光谱 连续谱 蒙特卡罗 随机分布 Low-quality spectrum Spectrum continuum Monte Carlo Uniform distribution 
光谱学与光谱分析
2018, 38(3): 963
刘杰 1潘景昌 1吴明磊 1,2刘聪 1[ ... ]刘猛 1
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 哈尔滨理工大学(荣成校区), 山东 威海 264209
3 中国科学院光学天文重点实验室, 中国科学院国家天文台, 北京 100012
大规模光谱巡天项目如LAMOST等产生了海量极具研究价值的观测数据, 如何对此数量级的数据进行有效的分析是当前的一个研究热点。 聚类算法是一类无监督的机器学习算法, 可以在不依赖于领域知识的情况下对数据进行处理, 发现其中的规律与结构。 恒星光谱聚类是天文数据处理中一项非常重要的工作, 主要对海量光谱巡天数据按照其物理及化学性质分类。 针对LAMOST巡天中的早M型矮恒星的光谱数据, 使用多种聚类算法如K-Means, Bisecting K-Means和OPTICS算法做了聚类分析, 研究不同聚类算法在早M型恒星数据的表现。 聚类算法在一定程度依赖于其使用的距离度量算法, 同时研究了欧氏距离、 曼哈顿距离、 残差分布距离和上述三种聚类算法搭配下的表现。 实验结果表明: (1)聚类算法可以很好地辅助分析早M型矮恒星的光谱数据, 聚类产生的簇心数据和MK分类吻合得非常好。 (2)三种不同聚类算法表现不尽相同, Bisecting K-Means在恒星光谱细分类方面更有优势。 (3) 在聚类的同时也会产生一些数量较少的簇, 从这些簇中可以发现一些稀有天体候选体, 相对而言OPTICS适合用来寻找稀有天体候选体。
聚类 降维 LAMOST LAMOST Clustering Dimension reduction 
光谱学与光谱分析
2017, 37(12): 3904
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
拼接异常是光谱在红蓝两端拼接区域表现出的光谱连续性差的一种现象。 在LAMOST的光谱处理中, 仪器的稳定性、 观测条件以及获得的响应函数等问题都是造成拼接异常的原因。 光谱拼接是否正常对于光谱发布等后续工作的质量有重要影响。 提出一种拼接异常光谱的自动检测方法, 有效地提高了工作效率。 该研究可以为LAMOST数据提供一个自动的标记, 来评价拼接质量, 也可以为用户提供一个使用数据时的选择。 该方法首先将待测光谱进行流量归一化、 去除钠线等预处理, 并将其分为红蓝两端; 然后对红蓝两端分别进行拟合; 最后对两条拟合曲线, 选取一系列等波长间隔的点, 计算在这些点处的流量差值, 得到所有流量差值的均值, 标准差, 并且计算两条曲线积分面积的差值; 基于上述统计量, 提出了一个判断光谱是否异常及其异常程度的评价函数。 大量的实验证明, 该方法具有良好的拼接异常光谱检测效果。
光谱拼接异常 光谱预处理 分段拟合 流量差 异常分级 Splicing wavelengths Spectra pretreatment Segmentation fitting Deviation Abnormal grading 
光谱学与光谱分析
2017, 37(7): 2250
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
连续谱异常是指恒星光谱在获得和处理过程中由于星际消光和流量定标等原因造成连续谱严重偏离甚至中断的现象, 这对光谱的谱线提取以及其他一些后续处理工作带来负面影响。 提出了一种基于距离度量的连续谱异常光谱的自动检测方法, 相比传统人眼检查在保证正确率的情况下大大地提高了工作效率。 该方法首先通过光谱的lick线指数来确定待测光谱的恒星类型, 同时对待测光谱进行归一化处理; 然后分别提取待测光谱和对应类型模板光谱的连续谱; 最后进行连续谱模板匹配, 在每个波长点计算待测光谱和其模板光谱的流量差值, 分析流量差值的分布, 检验有多少差值点分布在在均值(β)附近的±α个标准差(δ)的范围内, 进而可确定是否有连续谱异常。 实验表明提出方法的可以快速有效的识别出连续谱异常的恒星光谱。
连续谱异常 lick线指数 模板匹配 类型匹配 连续谱归一化 流量差 Continum problem Lick indices Template matching Subclass matching Continuum normalization Flux difference 
光谱学与光谱分析
2017, 37(7): 2246
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室国家天文台, 北京 100012
天光作为一种主要的噪声, 叠加在目标天体光谱之中, 降低了光谱的信噪比。 经过减天光处理后, 若光谱中仍含有大量强度高的天光残差将不利于对目标光谱的后续分析。 自动识别减天光异常恒星光谱的研究较少, 目前只能通过人工检测的方法去寻找减天光异常的光谱, 效率较低。 首先对影响减天光结果的因素进行分析, 找出减天光异常光谱的特征, 然后提出一种简单有效的方法能够自动识别LAMOST巡天经过Pipeline处理之后仍然存在减天光异常的恒星光谱并检测其位置。 该方法先对光谱进行归一化处理, 然后通过检测天光线附近是否有一定强度的类似发射线或吸收线的残留来判定该天光线位置是否出现减天光异常, 最后得出光谱中所有的减天光异常的天光位置。 通过对LAMOST光谱数据的实验表明, 这种方法可以有效识别出减天光异常的光谱和发现不同残留强度的天光线异常位置, 并且该方法简单易懂, 识别效率高, 可以应用于大量的减天光异常光谱的识别与检测问题。
减天光 天光残留检测 连续谱归一化 郭守敬望远镜(LAMOST) Sky-substraction Sky-residuals detection Spectral normalization LAMOST 
光谱学与光谱分析
2017, 37(1): 273
作者单位
摘要
1 上海理工大学 上海市现代光学系统重点实验室, 上海 200093
2 上海理工大学, 光电信息与计算机工程学院, 上海 200093
3 中国科学院上海微系统与信息技术研究所 太赫兹固态技术重点实验室, 上海 200050
高宝线是一种涂覆介质的单金属传输线,主要应用于高频电磁波的传输与传感领域。结合超材料技术制作出的平面高宝线能够在微波与太赫兹波频段高效激发伪表面等离子体激元,具有高效传输与高灵敏传感特性。介绍了近些年来国内外高宝线的研究进展,综合概述其主要结构的设计方法,分析其测试与仿真结果,并且简要介绍了高宝线的未来发展趋势以及潜在应用。
高宝线 传感器件 传输效率 表面等离子体激元 Goubau line sensor transmission efficiency spoof surface polaritons 
光学仪器
2016, 38(6): 555
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
大规模光谱巡天将产生海量的光谱数据, 为搜寻一些奇异甚至于未知类型的光谱提供了机会, 对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源, 巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。 利用线指数对光谱数据进行降维能够在尽可能多的保留光谱物理特征的同时, 有效解决高维光谱数据聚类分析中运算复杂度较高的问题。 提出了基于线指数特征的海量恒星光谱离群数据挖掘及分析的方法, 以恒星光谱的Lick线指数作为光谱数据的特征, 利用聚类搜寻离群数据的方法在海量光谱巡天数据搜寻离群数据, 以此为基础并给出线指数特征空间内离群光谱数据的分析方法。 实验结果证明: (1)以线指数作为光谱的特征值能快速的完成对高维光谱数据的离群数据挖掘, 可以解决高维光谱数据运算复杂度高的问题; (2)该方法是在聚类结果上进行的离群数据挖掘, 能够有效的挖掘出数量较少的发射线恒星、 晚M型恒星、 极贫金属星、 缺失数据光谱等数据; (3)线指数特征空间的离群数据挖掘可以得到线指数特征空间内特殊恒星的发现规则。 本文所提出的基于线指数特征的离群数据挖掘及分析方法可以应用到巡天数据的相关研究中。
Lick线指数 离群数据挖掘 恒星光谱 Lick line index Outlier datamining Stellar spectra 
光谱学与光谱分析
2016, 36(10): 3364
潘景昌 1,*王杰 1姜斌 1罗阿理 1,2[ ... ]郑强 3
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
3 烟台大学计算机与控制工程学院, 山东 烟台 264005
天体光谱中蕴含着非常丰富的天体物理信息, 通过对光谱的分析, 可以得到天体的物理信息、 化学成分以及天体的大气参数等。 随着LAMOST和SDSS等大规模巡天望远镜的实施, 将会产生海量的光谱数据, 尤其是LAMOST正式运行后, 每个观测夜产生大约2~4万条光谱数据。 如此海量的光谱数据对光谱的快速有效的处理提出了更高的要求。 恒星光谱的自动分类是光谱处理的一项基本内容, 该研究主要工作就是研究海量恒星光谱的自动分类技术。 Lick线指数是在天体光谱上定义的一组用以描述光谱中谱线强度的标准指数, 代表光谱的物理特性, 以每个线指数最突出的吸收线命名, 是一个相对较宽的光谱特征。 研究了基于Lick线指数的贝叶斯光谱分类方法, 对F, G, K三类恒星进行分类。 首先, 计算各类光谱的Lick线指数作为特征向量, 然后利用贝叶斯分类算法对三类恒星进行分类。 针对海量光谱的情况, 基于Hadoop平台实现了Lick线指数的计算, 以及利用贝叶斯决策进行光谱分类的方法。 利用Hadoop HDFS高吞吐率和高容错性的特点, 结合Hadoop MapReduce编程模型的并行优势, 提高了对大规模光谱数据的分析和处理效率。 该研究的创新点为: (1) 以Lick线指数作为特征, 基于贝叶斯算法实现恒星光谱分类; (2) 基于Hadoop MapReduce分布式计算框架实现Lick线指数的并行计算以及贝叶斯分类过程的并行化。
Lick线指数 恒星光谱分类 Lick line index Stellar spectral classification Hadoop Hadoop 
光谱学与光谱分析
2016, 36(8): 2651
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
聚类分析是数据挖掘中用以发现数据分布和隐含模式的一种重要算法, 能简单有效地研究大样本、 多参量和类别未知的光谱数据。 以线指数作为光谱数据的特征值能够在尽可能多的保留光谱物理特征的同时, 有效解决高维光谱数据聚类分析中运算复杂度较高的问题。 本文提出了基于线指数特征的海量恒星光谱数据聚类分析的方法, 提取恒星光谱中的Lick线指数作为海量巡天光谱数据的特征, 使用k均值聚类算法完成对光谱数据的聚类, 然后对聚类结果进行有效的分析。 实验结果证明该方法能够快速有效地将具有相似物理特征的恒星光谱数据聚集到一起, 该方法可以应用到巡天数据的研究中。
Lick线指数 聚类分析 恒星光谱 Lick line index Clustering Stellar spectra 
光谱学与光谱分析
2016, 36(8): 2646

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!