当前位置: 首页
业界动态
利用堆叠集成学习,英国研究团队实现251颗盾牌座δ型星星震学指数高精度预测

利用堆叠集成学习,英国研究团队实现251颗盾牌座δ型星星震学指数高精度预测

热心网友 时间:2026-04-27
转载

英国华威大学研究团队构建了一套堆叠式集成学习框架,直接从 TESS 光变曲线中预测盾牌座 δ 型星的关键星震学参数。该方法在 643 颗恒星样本上取得了显著效果:所有目标参数的决定系数 R² 均高于 0.77,并在未参与训练的 60 颗恒星上表现出良好的泛化能力,预测结果与传统星震学分析高度一致。

想窥探恒星的内心世界吗?星震学就是那把钥匙。通过解析恒星天然的振荡信号,科学家得以反演其内部结构与演化状态,这堪称现代恒星物理中最具穿透力的研究手段。而在众多研究对象中,盾牌座 δ 型星(质量约为太阳的 1.5–2.5 倍)因其丰富的脉动模式和高度密集的振荡频谱,当之无愧地成为了星震学的“黄金实验场”。这类恒星的脉动,主要源于氦电离区的不透明度(κ)机制驱动,而其内部活跃的对流核,则进一步引发了诸如对流超射、化学混合以及角动量再分配等一系列复杂过程。更棘手的是,较快的自转会让振荡模式发生耦合与频率分裂,这无疑给模式识别与参数提取的难度加了个“倍增器”。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在星震学分析中,功率谱中最高峰对应的频率、最大振荡功率频率,以及大频率间隔 Δν 等参数尤为重要。其中,Δν 对恒星的平均密度极为敏感,是刻画其整体结构的核心指标。然而,对于盾牌座 δ 型星而言,快速自转与多模式混叠,往往会把原本规则的频率间隔搅得一团糟,这让传统方法在测量 Δν 时举步维艰。

转机出现在数据洪流时代。近年来,TESS 卫星获取的大规模高精度光变曲线数据,极大拓展了该类恒星的研究样本,但随之而来的数据处理过程依然计算密集、高度依赖经验,想要高精度提取参数,依然不是件轻松的事。正是在这一背景下,机器学习提供了一条全新的技术路径。相比传统方法,集成学习能够巧妙融合多个模型的预测结果,在复杂数据环境下往往能实现更高的精度与稳定性。像随机森林、梯度提升和岭回归这些方法,近年来在天文学数据分析中已崭露头角,展现出不小的潜力。

英国华威大学的研究团队正是抓住了这一趋势,他们构建了一套堆叠式集成学习框架,目标直指一个核心问题:能否绕过繁琐的中间步骤,直接从 TESS 光变曲线中预测出盾牌座 δ 型星的关键星震学参数?答案是肯定的。该方法在 643 颗恒星样本上表现亮眼:所有目标参数的决定系数 R² 均高于 0.77,更关键的是,在未参与训练的 60 颗恒星上,它同样表现出优秀的泛化能力,预测结果与传统星震学分析高度吻合。

这项研究成果已以「Ensemble Machine Learning Approach to Estimate the Asteroseismic Indices for δ Scuti Stars Observed by TESS」为题,正式发表于 The Astronomical Journal。

研究亮点:

* 提出了一套直接从光变曲线估算关键星震学参数的机器学习框架,突破了传统方法的局限,大幅提升了参数提取的效率。

* 通过优化特征选择和模型架构,实现了高精度预测,并在独立样本上验证了其可靠性。

* 完成了 251 颗盾牌座 δ 型星的星震学指数测定,构建了新星表,丰富了相关恒星的参数数据库,为今后大样本统计分析和恒星演化研究提供了重要数据支撑。

论文地址:https://beta.iopscience.iop.org/article/10.3847/1538-3881/ae4bd8

数据集:TESS 光变曲线筛选与星震学样本构建

这项研究的基石,是一个包含 643 颗盾牌座 δ 型星的 TESS 光变曲线数据集,以及与之对应的三项关键星震学指数:ν(Aₘₐₓ)、νₘₐₓ 和 Δν。初始样本虽有 677 颗恒星,但经过多轮严格筛选,最终保留了 643 颗作为核心数据集。筛选标准相当明确:必须拥有 TESS 2 分钟短曝光光变曲线(数据来自 MAST 档案);每个观测天区的数据点不能少于 7,000 个;光变曲线需经过 PDC-SAP 校正处理;并且,三项星震学参数必须完整可用。

光有训练数据还不够。研究人员额外选取了 251 颗盾牌座 δ 型星作为补充样本。这些恒星同样拥有高质量光变曲线,但其星震学参数尚未被发表。它们的入选条件同样严格:至少覆盖 3 个观测天区,且每个天区数据点不低于 7,000 个。这部分样本,正是用来检验模型实战能力的“新战场”。

643 颗盾牌座 δ 型星的频数直方图

模型:多基模型堆叠的集成回归框架

整个模型的目标很清晰:基于光变曲线的特征,估算恒星的星震学参数。实现路径则环环相扣,主要包括特征提取、数据预处理、集成建模以及超参数优化。

在特征构建方面,研究采用了“两条腿走路”的策略。一类是统计特征,比如均值、标准差、中位数等,用来描述光度分布的基本性质;另一类是频域特征,包括主成分分析(PCA)、自相关函数(ACF)、快速傅里叶变换(FFT)以及离散小波变换(DWT),目的是为了从振荡信号中提取出周期性与多尺度结构信息。

在数据预处理阶段,第一步是剔除存在缺失值的样本,并对所有特征进行归一化处理,让它们站在同一起跑线上。此外,针对部分特征分布不均衡可能带来的模型偏差问题,研究引入了基于统计分布的重采样方法,通过生成合成数据来缓解这一问题,从而提升模型训练的稳定性。

框架是整个方法的核心。模型采用了堆叠式集成回归框架,随机森林、梯度提升回归和岭回归三大基模型各司其职:前两者分别从降低方差和减小偏差的角度提升预测性能,岭回归则通过正则化专门处理特征间的共线性问题。这些基模型的预测输出,并不会被直接采用,而是作为新的输入特征,去训练一个元回归器进行最终融合。这种“集各家之长”的策略,能有效提升整体泛化能力并降低预测误差。

当然,好模型离不开好参数。在模型训练过程中,研究人员采用了随机搜索结合交叉验证的方法,对树的数量、最大深度和学习率等关键超参数进行精细优化,以确保获得稳定且性能最优的模型配置。

以 60 颗独立星检验泛化,所有星震学指数 R²>0.77

实验验证是检验真理的唯一标准。整个过程分为模型训练、泛化能力评估以及新样本预测三个部分。

在训练阶段,研究人员从 643 颗恒星中随机选取 583 颗用于构建模型,并按照 8:2 的比例划分训练集与测试集。为了降低随机性的影响,这一过程重复了 100 次。剩下的 60 颗恒星则被完全“隔离”,作为独立的测试集,专门用于评估模型面对全新数据时的泛化能力。而那 251 颗未标注样本,则留待最后进行实际预测。

对比 583 颗星的实测与预测值、相对误差及误差分布

在训练与测试样本上,模型的表现堪称优秀:对 ν(Aₘₐₓ)、νₘₐₓ 和 Δν 的预测 R² 分别达到了 0.95、0.93 和 0.87,大多数样本的相对误差被控制在 0.2 以下。特征重要性分析揭示了哪些信息贡献最大:自相关函数(ACF)拔得头筹,FFT 与 DWT 紧随其后,部分统计特征(如偏度、峰度)也发挥了一定作用。学习曲线则显示模型收敛稳定,超参数优化效果显著。

模型学习曲线

真正的考验在独立测试集上。模型依然保持了强劲的性能,三个参数的 R² 分别为 0.91、0.87 和 0.77,预测结果与观测值高度一致。多次重复实验的结果波动很小,这充分说明了模型具有出色的稳定性与鲁棒性。最终,研究人员将训练好的模型应用于那 251 颗未标注恒星,成功得到了它们的星震学参数预测值。令人放心的是,所有预测结果都落在了盾牌座 δ 型星的合理参数范围内。

结语

总而言之,这项工作并非意在取代传统的星震学方法,而是提供了一种极具针对性的高效补充。在大规模观测数据滚滚而来的今天,这种思路的价值愈发凸显:先通过数据驱动方法实现参数的高效、批量预估,再结合精细的物理建模进行深入分析和验证。对于像盾牌座 δ 型星这样振荡模式复杂、传统处理方式效率瓶颈明显的目标,这条“机器学习+天体物理”的融合路径,无疑打开了一扇新的大门,让科学家能更从容地应对星海中的数据洪流。

来源:https://36kr.com/p/3784745204521990

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
全尺寸旗舰 车长超5.2米!领克900大五座上市:置换补贴25.48万起

全尺寸旗舰 车长超5.2米!领克900大五座上市:置换补贴25.48万起

全尺寸旗舰 车长超5 2米!领克900大五座上市:置换补贴25 48万起 4月27日晚,领克品牌的全新全尺寸旗舰SUV——领克900大五座版正式登场。新车共推出3款配置,官方指导价区间为29 98万至34 58万元。不过,真正的看点在于其上市限时置换价:25 48万至30 08万元。这个价格一公布,

时间:2026-04-27 22:22
乘客买到高铁08车01C座 上车却懵了

乘客买到高铁08车01C座 上车却懵了

乘客买到高铁08车01C座 上车却懵了 最近,一位旅客在小红书上分享了一段有趣的乘车经历,引发了不少讨论。她购买的D5419次列车票上,清晰地印着“08车01C号”,按照通常的理解,这应该是一个三人连排的靠过道座位。可当她上车找到对应位置时,却愣住了——眼前这一排明明只有两个座位,说好的B座去哪儿了

时间:2026-04-27 22:21
巨人网络年初至今股价跌超40%

巨人网络年初至今股价跌超40%

巨人网络一季度业绩爆发:日赚1200万,股价却为何“跌跌不休”? 游戏行业最近有个现象挺值得玩味:一边是财报数据亮眼,另一边资本市场却似乎不怎么买账。巨人网络刚刚发布的2026年第一季度报告,就是个典型例子。 根据这份新鲜出炉的财报,巨人网络一季度营收冲到了23 3亿元,同比增幅高达221 7%;归

时间:2026-04-27 22:21
随着技术的发展,RPA和大模型将如何融合,以提供更智能、

随着技术的发展,RPA和大模型将如何融合,以提供更智能、

随着技术的发展,RPA(机器人流程自动化)和大模型的融合将为企业提供更智能、更高效的自动化解决方案 这种融合趋势主要体现在以下几个方面: 一、融合背景与驱动力 先看RPA这边。RPA自诞生以来,已经稳稳坐上了企业流程自动化的关键位置。它的本事,就是模仿人类的操作,在不同系统和平台间穿梭,把那些重复、

时间:2026-04-27 22:01
学人工智能出来能干嘛

学人工智能出来能干嘛

学习人工智能后,可以从事哪些职业? 学完人工智能,你眼前打开的可不是一两条小路,而是一片广阔的职业生涯地图。这项技术的渗透力极强,从基础研发到商业落地,从技术攻坚到战略咨询,处处都需要相关人才。简单来说,你的技能能用在哪儿,很大程度上取决于你的兴趣点是想钻研技术底层,还是想用技术解决实际问题。 算法

时间:2026-04-27 22:00
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程