作者单位
摘要
1 山东大学(威海)数学与统计学院, 山东 威海 264209
2 山东大学(威海)机电与信息工程学院, 山东 威海 264209
主要研究了一种新的基于ELM算法的中低分辨光谱的恒星Mg元素丰度估计方法。 大科学工程郭守敬望远镜(LAMOST)为我们提供了海量的中低分辨率的光谱, 确定这些光谱的Mg元素丰度将有助于我们深入了解银河系的形成历史和演化过程。 目前从中低分辨率光谱中确定Mg元素丰度的方法主要是模板匹配法, 但该方法算法复杂, 优化参数较为困难且对噪声敏感, 因此有必要研究新的方法。 实验结果显示, ELM算法对MILES光谱的Mg丰度的估计的精度为0.009 9(0.15)dex, 而对信噪比大于50的LAMOST光谱的精度为0.002 7(0.11)dex。 通过与其他算法进行对比, 证实ELM算法是一种能精确估计中低分辨率光谱的Mg元素丰度的算法, 能够应用于LAMOST后期的光谱数据中。
ELM算法 Mg元素丰度 LAMOST光谱 MILES光谱 ELM algorithm Abundance LAMOST spectra MILES spectra 
光谱学与光谱分析
2019, 39(10): 3288
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 山东大学(威海)数学与统计学院, 山东 威海 264209
在赫罗图中, M巨星位于红巨星的顶端, 是由类太阳的主序星逐渐演化而成的最明亮的一类恒星。 M巨星的研究对于理解银河系, 特别是银河系晕的性质至关重要。 中低分辨率的M巨星光谱, 常因为特征不显著、 噪声影响等因素而与M矮星的光谱混在一起, 不易区分。 现有研究一般利用CaH2+CaH3 vs. TiO5分子谱指数初步筛选M巨星光谱候选体, 再通过人眼检查确认。 但这种方法仅利用了三个巨星相关的分子带指数, 没有利用识别M巨星的其他光谱特征, 可能会由于噪声对指数的污染而导致分类错误。 而且, 人眼检查数量众多的光谱不仅耗时而且检查质量依赖于人的经验, 可靠性无法得到保证。 LAMOST望远镜自2011年开始先导巡天到2017年6月, 已经发布了900多万天体的光谱, 最新释放的光谱数据DR5包含了52万的M型星光谱数据, 需要采用自动、 准确、 有效的方法来区分其中不同光度级的M子样本。 本研究利用集成树模型分类M巨星和M矮星光谱, 分别采用随机森林、 GBDT、 XGBoost和LightGBM算法, 构建区分M巨星和M矮星的光度分类器。 四种分类器的测试准确率分别达到97.23%, 98%, 98.05%和98.32%。 实验表明LightGBM模型比其他三种集成树模型准确率更高, 训练时间更少, 分类效率更高。 对分类器模型获取到的重要特征分析的结果表明, 集成树算法有效提取并表达了用于区分M巨星和M矮星的结构性特征, 模型提取到的重要特征不仅包括原子线或分子带吸收的波长位置, 还包含了它们相邻的伪连续谱, 这与传统上计算指数所需要特征波长和伪连续谱是一致的。 相比于传统M巨星和M矮星分类方法, 集成树模型能够采用光谱中的多个重要特征组合进行分类, 避免仅依赖某一种特征易受噪声影响而得出错误的分类结果。 研究结果表明集成树算法在巨星识别过程中具有显著优势, 完全可以替代传统上只利用CaH和TiO指数的巨星光谱判别方法。 基于集成树模型对M型星光谱的分类研究, 为LAMOST高效、 准确地处理海量天体光谱提供了有效的方法。 随着LAMOST巡天项目不断开展, 积累的M巨星和M矮星样本将为研究银河系的结构和演化提供重要的数据基础。
M巨星 集成树 光谱分类 特征提取 M giants Ensemble tree Spectral classification Feature extraction 
光谱学与光谱分析
2019, 39(7): 2288
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
特殊恒星是金属丰度异常的恒星, 其中包含的信息对于研究宇宙起源、 太阳系的演变以及生命的演化都有着重要的意义。 因此, 特殊恒星的搜寻是国内外巡天项目中的重要目标。 恒星光谱中包含着恒星的化学成分、 物理性质以及运动状态等丰富的信息, 它是开展恒星研究的重要依据。 恒星的识别、 分类以及特殊恒星的发现主要依据的是恒星光谱数据。 随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开, 恒星光谱的数据量达到了前所未有的高度, 如此大的数据量为特殊恒星的发现提供了强有力的支撑。 因此如何利用这些数据快速准确地发现特殊、 稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。 数据挖掘是结合模式识别、 机器学习、 统计分析及相关专家背景知识, 从数据中提取出隐含的过去未知的有价值的潜在信息的技术, 其在处理大数据方面有着天然的优势, 越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。 目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、 聚类分析以及异常值检测等, 但随着巡天深度的拓展, 观测的目标越来越暗, 进而观测光谱的信噪比也随之变低。 低信噪比光谱中存在着大量的无用信息, 直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。 因此, 如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱, 是当前面临的一个重要问题。 由于低信噪比恒星光谱本身的特点, 对于从中搜寻特殊恒星光谱的工作开展较少。 为了解决此问题, 在仔细研究光谱数据处理方法的基础上, 针对低信噪比巡天数据中特殊恒星光谱的搜寻, 提出了一种以主成分分析(PCA) 和基于密度峰值聚类为基础的方法。 该方法首先选取O, B, A, F, G, K和M各种类型的高信噪比恒星光谱, 进行波长统一和流量插值后, 利用主成分分析得到特征光谱; 然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱; 最后利用重构之后的高信噪比光谱进行聚类, 聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。 在聚类时, 考虑到恒星光谱数据本身的特点, 采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。 实验表明, 该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。 同时, 也可应用于诸如LAMOST、 SDSS等各种银河系巡天的光谱数据分析与挖掘中。
银河系巡天 离群数据挖掘 低信噪比光谱 Galaxy survey Outlier data mining Low SNR spectra 
光谱学与光谱分析
2019, 39(2): 618
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 哈尔滨理工大学荣成学院, 山东 威海 264300
3 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
恒星的连续谱是由于黑体辐射导致的光辐射强度随波长(频率)连续光滑变化的光谱。 每条观测到的光谱数据中都会包含连续谱、 谱线和噪声。 恒星的分类主要是依据光谱的谱线、 连续谱的相对强度以及光谱的其他特征。 恒星连续谱的分布以及谱线的轮廓是由恒星大气内的物理因素决定的, 也可以根据连续谱及谱线对恒星大气的物理参数进行估计。 因而处理光谱的主要问题就是提取连续谱, 并且通过归一化进行谱线的提取。 恒星连续谱提取的算法主要有多项式逼近、 中值滤波、 形态滤波以及小波滤波等, 但是这些方法对于低质量光谱处理的鲁棒性不是很好, 因此有必要研究一种新的算法对低质量光谱的连续谱进行提取。 在仔细分析恒星低质量连续谱的基础上, 提出一种基于蒙特卡罗方法的低质量恒星连续谱拟合方法。 该方法对恒星光谱筛选过程中不在范围内的点利用蒙特卡罗均匀分布进行自动插值, 让每一个波长都对应一个流量点, 然后对这些流量点进行低阶多项式迭代拟合, 从而得到连续谱。 为了验证算法对不同信噪比的低质量光谱连续谱提取的鲁棒性, 利用不同的信噪比在原始光谱中加入不同的高斯白噪声对低质量光谱进行模拟。 结果表明蒙特卡罗算法对不同信噪比的低质量光谱的拟合具有较高的精度与较强的鲁棒性。
低质量光谱 连续谱 蒙特卡罗 随机分布 Low-quality spectrum Spectrum continuum Monte Carlo Uniform distribution 
光谱学与光谱分析
2018, 38(3): 963
刘杰 1潘景昌 1吴明磊 1,2刘聪 1[ ... ]刘猛 1
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 哈尔滨理工大学(荣成校区), 山东 威海 264209
3 中国科学院光学天文重点实验室, 中国科学院国家天文台, 北京 100012
大规模光谱巡天项目如LAMOST等产生了海量极具研究价值的观测数据, 如何对此数量级的数据进行有效的分析是当前的一个研究热点。 聚类算法是一类无监督的机器学习算法, 可以在不依赖于领域知识的情况下对数据进行处理, 发现其中的规律与结构。 恒星光谱聚类是天文数据处理中一项非常重要的工作, 主要对海量光谱巡天数据按照其物理及化学性质分类。 针对LAMOST巡天中的早M型矮恒星的光谱数据, 使用多种聚类算法如K-Means, Bisecting K-Means和OPTICS算法做了聚类分析, 研究不同聚类算法在早M型恒星数据的表现。 聚类算法在一定程度依赖于其使用的距离度量算法, 同时研究了欧氏距离、 曼哈顿距离、 残差分布距离和上述三种聚类算法搭配下的表现。 实验结果表明: (1)聚类算法可以很好地辅助分析早M型矮恒星的光谱数据, 聚类产生的簇心数据和MK分类吻合得非常好。 (2)三种不同聚类算法表现不尽相同, Bisecting K-Means在恒星光谱细分类方面更有优势。 (3) 在聚类的同时也会产生一些数量较少的簇, 从这些簇中可以发现一些稀有天体候选体, 相对而言OPTICS适合用来寻找稀有天体候选体。
聚类 降维 LAMOST LAMOST Clustering Dimension reduction 
光谱学与光谱分析
2017, 37(12): 3904
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院国家天文台, 北京 100012
M矮星是银河系中最普遍的恒星, 它们的运动状况能提供银河系演化的线索, 视向速度(RV)是反映M矮星运动状况的重要参数之一。 我国的大科学工程LAMOST巡天项目已经获得了数十万M型星光谱, 测量这些恒星的视向速度需要自动、 高效的程序。 计算M矮星视向速度的一般方法是将观测光谱与模板光谱进行交叉相关得出。 然而在实际处理过程中, 由于本质上的不同或者噪声的影响, 一些观测光谱和模板光谱错误匹配, 从而使得这些光谱的视向速度测量产生偏差。 为了减少噪声等因素的影响, 对于信噪比较高、 但局部有较强噪声的光谱, 采用统计与经验特征相结合的方法选取光谱中的有效特征段、 避开噪声污染的波段计算M型星的视向速度。 利用该方法对LAMOST DR3 M型星星表中的部分实测光谱测量了视向速度, 将之与APOGEE星表中的对应视向速度进行了对比。 结果表明该方法有效地减少了局部噪声对视向速度的影响, 提高了视向速度测量的准确率。
视向速度 M型星 光谱 特征选择 Radial velocity LAMOST LAMOST M-type star Spectrum Feature selection 
光谱学与光谱分析
2017, 37(8): 2594
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
拼接异常是光谱在红蓝两端拼接区域表现出的光谱连续性差的一种现象。 在LAMOST的光谱处理中, 仪器的稳定性、 观测条件以及获得的响应函数等问题都是造成拼接异常的原因。 光谱拼接是否正常对于光谱发布等后续工作的质量有重要影响。 提出一种拼接异常光谱的自动检测方法, 有效地提高了工作效率。 该研究可以为LAMOST数据提供一个自动的标记, 来评价拼接质量, 也可以为用户提供一个使用数据时的选择。 该方法首先将待测光谱进行流量归一化、 去除钠线等预处理, 并将其分为红蓝两端; 然后对红蓝两端分别进行拟合; 最后对两条拟合曲线, 选取一系列等波长间隔的点, 计算在这些点处的流量差值, 得到所有流量差值的均值, 标准差, 并且计算两条曲线积分面积的差值; 基于上述统计量, 提出了一个判断光谱是否异常及其异常程度的评价函数。 大量的实验证明, 该方法具有良好的拼接异常光谱检测效果。
光谱拼接异常 光谱预处理 分段拟合 流量差 异常分级 Splicing wavelengths Spectra pretreatment Segmentation fitting Deviation Abnormal grading 
光谱学与光谱分析
2017, 37(7): 2250
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
连续谱异常是指恒星光谱在获得和处理过程中由于星际消光和流量定标等原因造成连续谱严重偏离甚至中断的现象, 这对光谱的谱线提取以及其他一些后续处理工作带来负面影响。 提出了一种基于距离度量的连续谱异常光谱的自动检测方法, 相比传统人眼检查在保证正确率的情况下大大地提高了工作效率。 该方法首先通过光谱的lick线指数来确定待测光谱的恒星类型, 同时对待测光谱进行归一化处理; 然后分别提取待测光谱和对应类型模板光谱的连续谱; 最后进行连续谱模板匹配, 在每个波长点计算待测光谱和其模板光谱的流量差值, 分析流量差值的分布, 检验有多少差值点分布在在均值(β)附近的±α个标准差(δ)的范围内, 进而可确定是否有连续谱异常。 实验表明提出方法的可以快速有效的识别出连续谱异常的恒星光谱。
连续谱异常 lick线指数 模板匹配 类型匹配 连续谱归一化 流量差 Continum problem Lick indices Template matching Subclass matching Continuum normalization Flux difference 
光谱学与光谱分析
2017, 37(7): 2246
作者单位
摘要
1 山东大学(威海)数学与统计学院, 山东 威海 264209
2 山东大学(威海)信息工程学院, 山东 威海 264209
3 中国人民大学统计学院, 北京 100872
4 山东青年政治学院信息工程学院, 山东 济南 250103
主要研究了一种新的基于LASSO算法的恒星α元素丰度估计方法。 海量恒星的α元素(O, Mg, Si, Ca 和Ti)丰度信息将有助于我们了解银河系的演化进程。 但目前从中低分辨率光谱中确定α元素丰度的方法主要是模板匹配法, 但该方法算法复杂, 优化参数较为困难且对噪声敏感, 因此有必要研究新的方法。 实验结果显示, LASSO算法对ELODIE光谱的α丰度的估计精度为0.003(0.078)dex。 为验证光谱分辨率变化对LASSO算法结果的影响, 我们首先用ELODIE光谱通过高斯卷积得到了分辨率为42 000, 21 000, 10 500, 4 200和2 100的光谱, 然后使用LASSO算法估计α元素丰度, 精度分别为0.003 3(0.078)dex, -0.05(0.059)dex, -0.007(0.060)dex, 0.008 0(0.069)dex和-0.004 5(0.067)dex。 上述结果证明LASSO算法对分辨率变化不敏感。 为验证LASSO算法对信噪比变化的鲁棒性, 使用ELODIE光谱分别构造了信噪比为30, 25, 20, 15和5的光谱。 LASSO算法在上述数据集上的精度分别为-0.002(0.076)dex, -0.09(0.073)dex, 0.003 6(0.075)dex, 0.007 6(0.078)dex 和-0.009(0.08)dex, 因而LASSO算法对信噪比变化不敏感。 因此, LASSO算法适用于低分辨率低信噪比的LAMOST和SDSS光谱。 LASSO算法在SDSS光谱上的估计精度为0.003 7(0.097)dex, 而在球状星团和疏散星团成员星上的结果显示LASSO算法给出的丰度与文献给出α丰度值误差在1σ以内。 因此, LASSO算法能够用于估计恒星的α元素丰度。
α元素丰度 线性回归 特征提取 LASSO LASSO Abundance Linear least square Feature extraction 
光谱学与光谱分析
2017, 37(1): 278
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室国家天文台, 北京 100012
天光作为一种主要的噪声, 叠加在目标天体光谱之中, 降低了光谱的信噪比。 经过减天光处理后, 若光谱中仍含有大量强度高的天光残差将不利于对目标光谱的后续分析。 自动识别减天光异常恒星光谱的研究较少, 目前只能通过人工检测的方法去寻找减天光异常的光谱, 效率较低。 首先对影响减天光结果的因素进行分析, 找出减天光异常光谱的特征, 然后提出一种简单有效的方法能够自动识别LAMOST巡天经过Pipeline处理之后仍然存在减天光异常的恒星光谱并检测其位置。 该方法先对光谱进行归一化处理, 然后通过检测天光线附近是否有一定强度的类似发射线或吸收线的残留来判定该天光线位置是否出现减天光异常, 最后得出光谱中所有的减天光异常的天光位置。 通过对LAMOST光谱数据的实验表明, 这种方法可以有效识别出减天光异常的光谱和发现不同残留强度的天光线异常位置, 并且该方法简单易懂, 识别效率高, 可以应用于大量的减天光异常光谱的识别与检测问题。
减天光 天光残留检测 连续谱归一化 郭守敬望远镜(LAMOST) Sky-substraction Sky-residuals detection Spectral normalization LAMOST 
光谱学与光谱分析
2017, 37(1): 273

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!