预测太阳的怒火:人工智能如何预测太阳耀斑

几个月前,太阳出现了过去 24 年来我们见过的最大太阳黑子。这个巨大的黑子,肉眼可见(即无需放大,但当然需要佩戴防护眼镜),爆发了 100 多次耀斑。

加入我们的科学爱好者社区!

本文发表于《大众科学》的前博客网络,仅反映作者的观点,不一定代表《大众科学》的观点。


几个月前,太阳出现了过去 24 年来我们见过的最大太阳黑子。这个巨大的黑子,肉眼可见(即无需放大,但当然需要佩戴防护眼镜),爆发了 100 多次耀斑。太阳黑子的数量呈周期性消长,每 11 年一个周期。目前,太阳正处于这个周期中最活跃的部分:我们预计未来几个月会出现大量黑子和耀斑。

通常,媒体关注的是太阳耀斑的破坏性力量——即有一天,太阳上的巨大爆炸会将大量的能量粒子抛向我们,并烧毁我们的通信卫星的可能性。但是,关于我们如何像天气预报一样预测这些东西,以便我们能够预防任何潜在损害的报道却很少。那么,究竟该如何预测太阳耀斑呢?

一种方法是使用机器学习程序,这是一种人工智能,可以从经验中自动学习。这些算法每次有新数据进来时都会逐步改进其数学模型。然而,为了正确学习,算法需要大量数据。在 2010 年太阳动力学观测台 (SDO) 发射之前,科学家们缺乏任何如此规模的太阳数据。SDO 是一颗观测太阳的卫星,每天下行链路约 1.5 TB 的数据——比 NASA 历史上任何其他卫星的数据都多。探索一个互动图形,显示多年来在太阳上不同级别的耀斑被观测到的位置:点击下图


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。


太阳耀斑以其复杂性而闻名。它们发生在太阳大气层中,位于表面太阳黑子的上方。太阳黑子通常成对出现,就像条形磁铁一样——即一个黑子像北极,另一个像南极。考虑到太阳黑子有很多,太阳的各个层以不同的速度旋转,并且太阳本身有南北两极,太阳大气层中的磁场变得非常混乱。就像橡皮筋一样,一个非常扭曲的磁场最终会断裂——并在过程中释放大量能量。这就是太阳耀斑。但有时扭曲的磁场不会爆发耀斑,有时耀斑来自看起来相当无害的太阳黑子,有时巨大的太阳黑子却什么也不做。

我们不理解太阳耀斑发生的物理机制。我们有一些想法——我们知道耀斑本质上肯定是磁性的——但我们并不真正知道它们是如何如此快速地释放如此多能量的。在缺乏明确的物理理论的情况下,预测太阳耀斑的最佳希望在于仔细检查我们庞大的数据集,从中寻找观测线索。

预测太阳耀斑通常有两种方法:数值模型和统计模型。在第一种情况下,我们采用我们已知的物理学原理,编写方程,随时间运行它们,并获得预测。在第二种情况下,我们使用统计学。我们回答诸如以下问题:与与小太阳黑子相关的活动区相比,与巨大太阳黑子相关的活动区爆发耀斑的概率是多少?因此,我们构建大型数据集,其中包含各种特征——例如太阳黑子的大小或其磁场强度——并寻找这些特征与太阳耀斑之间的关系。

机器学习算法可以为此提供帮助。我们在各处都使用机器学习算法。生物识别手表运行它们来预测我们应该何时醒来。它们在预测罕见遗传疾病方面比医生更优秀。它们识别出在整个历史中影响了艺术家的绘画作品。科学家们发现机器学习算法非常有用,因为它们可以识别非线性模式——基本上是所有无法用直线表示的模式——这很难做到。但这很重要,因为很多模式都是非线性的。

我们已经使用机器学习算法,利用 SDO 的庞大数据集来预测太阳耀斑。为此,我们首先构建了一个 SDO 观测到的所有活动区的数据库。由于这是历史数据,我们已经知道这些活动区是否爆发过耀斑。然后,学习算法分析活动区的特征——例如太阳黑子的大小、与其相关的磁场强度以及这些磁力线的扭曲程度——以识别爆发耀斑的活动区的一般特征。

为了做到这一点,算法首先进行猜测。假设它的第一个猜测是,一个磁场微弱的小太阳黑子会产生巨大的耀斑。然后它检查答案。哎呀,不对。然后算法调整其猜测方式。下一次,它会做出不同的猜测。通过反复试验——以数十万次的猜测和检查的形式——算法弄清楚哪些特征对应于爆发耀斑的活动区。现在,我们有了一个自学算法,可以将其应用于实时数据。

扩大这些努力可能有助于我们更好地预警即将到来的太阳耀斑。到目前为止,研究发现,机器学习算法预测耀斑的效果优于,或者至少与数值或统计方法一样好。这本身就是一个惊人的结果。这些算法无需任何人工输入,只需查找数据中的模式即可运行,并且非常通用,以至于你可以使用相同的算法(在不同的数据集上)来识别遗传疾病,它们的表现可以与迄今为止用于预测太阳耀斑的任何其他方法一样好。

如果我们有更多数据呢?谁知道呢。尽管我们已经有大量数据——SDO 已经运行了四年半——但在此期间并没有出现大量耀斑。那是因为我们正处于本世纪最平静的太阳活动周期。这更有理由继续收集数据并让算法保持忙碌。

© . All rights reserved.