计算机模型提高了化石搜寻成功的几率

在世界许多伟大的化石发现中,运气都扮演了重要的角色。新的模型预测了骨骼的位置,并将意外发现放在次要位置

2009年7月的一个酷热的日子里,一支由四轮驱动汽车组成的车队行驶在怀俄明州西南部大分水岭盆地一条隐约可见的双轨土路上。探险队的目的是前往被称为盐圣贤洼地的地区,寻找埋藏的宝藏:可以追溯到5500万至5000万年前的化石,即始新世初期,当时许多现代哺乳动物目的祖先开始取代早期古新世时期存在的更古老的哺乳动物。我们中的一位(Anemone)自1994年以来一直带领人类学家、古生物学家和地质学家的野外考察队前往该盆地,多年来,盐圣贤洼地已被证明是一个富有成果的狩猎场,在几个地点都发现了化石。然而,这一次我却找不到这个地点。我突然意识到,我们现在走的这条路并不是我们前几年走的那条路。我的错误最终将被证明是非常幸运的。

当车辙开始在蒿属植物和高草丛中消失时,我停下了车队,走了一段路,看看我是否能看到前方的路。绕过一个小山丘,我注意到远处有一大片砂岩层,而那条难以捉摸的路就在它旁边。由于大分水岭盆地和美国西部许多其他沉积盆地的砂岩中经常蕴藏着化石,我决定在我们继续前往盐圣贤洼地之前,花一些时间搜索这些沉积物。在用手和膝盖系统地扫描岩石大约一个小时后,我当时的研究生蒂姆·赫尔德和贾斯汀·吉什大喊,他们发现了几块不错的哺乳动物下颌骨。我急切地加入了他们。带有牙齿的化石下颌骨非常珍贵,因为它们包含足够的信息来识别它们来自哪种动物,即使在没有骨骼其他部分的情况下也是如此,而且因为它们揭示了动物吃什么。

接下来发生的事情只能用每个古生物学家的梦想来形容。我的学生们发现了一个化石“热点”。但这并不是一个普通的“热点”,只有少数下颌骨或几十颗牙齿和骨头从砂岩中侵蚀出来。相反,他们发现了一个非凡的宝藏,我们现在已经从中收集了近500块保存完好的下颌骨和数千颗牙齿和骨头,这些牙齿和骨头来自大约5000万年前生活在这里的20多种不同的化石哺乳动物物种。我们称这个地点为“蒂姆的忏悔”,今天它不仅仍然是我们在大分水岭盆地最好的地点,也是整个美国西部早期始新世哺乳动物最丰富的宝藏之一。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


我的团队绝不是第一个或多或少偶然地做出重大化石发现的团队。古生物学的历史充斥着这样的意外发现的故事。事实上,脊椎动物古生物学家试图找到高产化石地点的途径自我们科学的早期以来并没有太大变化。就像我们这个领域的19世纪先驱一样,我们使用地质和地形证据来确定我们可能最有机会找到从古代沉积物中侵蚀出来的化石的地方。但除此之外,我们是否能有所收获仍然在很大程度上取决于运气,而且寻找化石的艰苦工作往往得不到回报。

我们在蒂姆的忏悔处的经历让我开始思考,是否有一种更好的方法来确定我的野外考察队应该在哪里花费精力寻找新的化石地点。我们知道我们感兴趣的化石出现在可以追溯到5500万至5000万年前的砂岩中,并且我们知道盆地中的一些沉积层暴露在哪里,因此适合勘探。但是,尽管这些信息在一定程度上缩小了我们的搜索范围,但仍然留下了数千平方公里的地面需要覆盖,并且有很多空手而归的机会。

然后有一天晚上在营地里,一个想法开始萌芽。在野外,远离最近的光污染源数公里,我们经常注意到卫星从头顶飞过。我想知道我们是否可以将我们对大分水岭盆地当地地质、地形和古生物学的专家知识与卫星对整个10,000平方公里区域的视野结合起来,本质上是绘制其可能的化石热点图。也许卫星可以“看到”肉眼看不见的地貌特征,这些特征可以帮助我们找到更多的砂岩露头,并将那些含有可获取化石的砂岩露头与那些不含有的砂岩露头区分开来。

天眼

当然,其他古生物学家也推测过卫星图像是否可以提高我们在野外寻找化石的能力。作为灵长类动物和人类进化化石记录的专家,我知道在20世纪90年代,裂谷研究服务处的伯哈内·阿斯法乌和他的同事们使用此类图像来识别埃塞俄比亚可能产生人类祖先化石的岩石露头。大约在同一时间,丹佛自然与科学博物馆的理查德·斯塔基证明,根据对该地区卫星图像的分析,怀俄明州中部富含化石的风河盆地中不同的岩石单元可以被区分和绘制出来。这两个项目都涉及古生物学家和来自美国国家航空航天局的遥感专家之间的合作,并证明了这种跨学科努力的价值。但我想知道是否有一种方法可以从卫星图像中提取更多信息,从而更好地集中我们的搜索。

我转向一位地理学家,也就是本文的另一位作者(艾默生),我们两人很快就勾画出一个计划。我们将从陆地卫星7号及其所谓的增强型专题制图仪Plus传感器获取盆地的免费图像,该传感器探测从地球表面反射或发射的辐射,波长跨越电磁频谱——从蓝色到红外线——并将其表示为八个离散的光谱带。这些波段可以用来区分土壤和植被,例如,或绘制矿藏图。然后,我们将开发一种方法,使我们能够根据卫星图像表征大分水岭盆地已知高产化石地点的辐射剖面,并查看它们是否共享一个明显的频谱特征。如果是这样,我们可以从我们的计算机上搜索整个大分水岭盆地,以定位共享此频谱特征的新地点,从而有很高的概率蕴藏化石。然后,我们可以亲自访问这些地点(以及具有不同频谱特征的地点),并彻底搜索化石以测试该模型。

确定我们已知的化石地点是否共享独特的光谱特征并非易事,因为对于每个地点,我们都必须评估陆地卫星数据提供的电磁频谱六个波段中值的组合。我们的问题本质上是在多个维度上的模式识别问题,这是人类不擅长但计算机擅长的事情。因此,我们招募了一个所谓的 искусственный 神经网络——一种能够学习复杂模式的计算模型。

我们的人工神经网络显示,盆地已知的化石地点确实共享一个频谱特征,并且它能够轻松地区分这些砂岩地点与其他类型的地面覆盖物,例如湿地和沙丘。但该模型有其局限性。神经网络本质上是分析“黑匣子”,这意味着它们可以区分模式,但它们不会揭示使不同模式能够区分的实际因素。因此,尽管我们的人工神经网络可以轻松准确地区分化石地点与湿地或沙丘,但它无法告诉我们不同地面覆盖物的光谱特征在陆地卫星数据的六个波段中实际有何不同——这些信息可能有助于我们进行更有针对性的搜索。神经网络方法的另一个局限性在于,它完全基于对单个像素的分析。问题在于,单个陆地卫星像素的面积为225平方米,不一定对应于化石地点的尺寸:有些地点大于单个像素;有些地点小于单个像素。因此,神经网络对潜在化石地点(或某种类型的地面覆盖物,就此而言)的位置和范围的预测并不总是与现实相符。

为了克服这些限制,我们需要能够分析多个相邻且光谱相似的像素,并统计描述整个区域(无论是化石地点还是森林)的独特光谱特征。我们转向一种称为地理对象图像分析的技术,以及商业上可用的高分辨率卫星图像,其中单个像素的直径小于一米。与人工神经网络不同,这种方法允许将卫星图像分割成图像对象——即光谱同质像素组——然后可以通过统计参数(如平均或中值亮度或纹理)来表征这些图像对象。这些图像对象更接近地面上的兴趣点,例如化石地点或成片森林。使用这种图像分析技术,我们能够开发出一组独立的关于在哪里寻找化石的预测。

真相时刻

我们的预测模型都生成了大分水岭盆地的地图,这些地图精确地标出了未开发的区域,这些区域的光谱特征与已知地点的光谱特征最相似。尽管这些模型在预测中表现出很大程度的重叠,但在某些情况下也存在分歧。我们选择关注那些两个模型都确定为高优先级潜在地点的地点。手持地图,我们在2012年和2013年的夏季前往怀俄明州,看看我们的模型是否会将我们引向大分水岭盆地的新化石宝藏。令人欣慰的是,它们确实做到了。

事实证明,人工神经网络模型在识别砂岩沉积物方面非常有效,这些沉积物几乎总是值得探索的,因为该盆地中的许多砂岩沉积物都含有脊椎动物化石。2012年7月,它引导我们到达的第一个砂岩产出了十几个典型的始新世哺乳动物化石,包括五趾马始祖马、早期灵长类动物坎提乌斯和几种属于已灭绝的有蹄哺乳动物群体的动物,这些动物被称为踝节目。神经网络还引导我们到达了几个地点,这些地点产出了水生脊椎动物化石,包括鱼类、鳄鱼和海龟。

我们的地理对象图像分析模型也带我们去了新的地点。在最初的缓慢起步之后,模型指向我们的前三四个地点都没有发现化石,我们搬到了大分水岭盆地的北部,靠近一个叫做货运通道的地方,进行为期一周的密集“地面验证”我们的新技术。研究生布莱恩·博默斯巴赫在前一周带领我们长途跋涉到一个完全没有化石的地方(我们称之为“布莱恩的愚蠢之举”),他在根据模型的预测选择要调查的区域方面发挥了主导作用。几乎立即,我们开始在许多这些地点发现骨骼。我们在景观上31个独立的地点搜索了遗骸,我们的模型表明这些地点的光谱与已知地点相似,并在其中25个地点发现了脊椎动物化石,这比在没有预测地图的帮助下进行调查时通常的成功率要高得多。哺乳动物化石从其中10个地点出土,其中一个地点可以追溯到古新世的最后一部分——这是一个极其罕见的发现。

我们完全有理由相信,类似于我们开发的预测模型将在大分水岭盆地以外的地区发挥作用。事实上,它们应该在世界上几乎任何地方都有效。从理论上讲,只要拥有相关区域的卫星图像和少量已知的化石地点来训练模型,就可以生成自定义地图,显示该区域中可能包含感兴趣化石的地点。

为了保守地测试这种方法,我们使用了我们为大分水岭盆地开发的神经网络来预测附近的野牛盆地中含化石沉积物的位置,众所周知,野牛盆地蕴藏着古新世哺乳动物化石。(我们没有专门使用来自野牛盆地的化石地点来训练模型,因为它包含与大分水岭盆地相同类型的化石沉积物。)令人鼓舞的是,我们的人工神经网络预测了野牛盆地已知的三个最高产的化石地点。因此,一个首次使用我们的预测模型探索这个广阔区域的野外考察队,比一个使用传统调查方法的考察队更有可能发现这些地点。

我们在2012年和2013年在怀俄明州的试运行表明,卫星图像与地理空间预测模型的结合大大提高了我们野外工作的效率,帮助我们在更短的时间内找到更多的化石。但我们还有更多的工作要做。我们现在专注于改进我们的模型,以更好地表征和区分高产地点的光谱特征。我们还在研究如何对我们的预测模型施加更多约束,以限制我们生成的地图中的误报结果数量,从而提高我们确定最高优先级调查区域的能力。

我们深信,借助这些工具,我们可以将未来的古生物勘探置于更安全和科学的基础上,并减少意外发现对寻找重要化石的作用。实现这一目标是非常值得付出的努力。拼凑地球上生命的起源和演化是一项非常有趣和重要的事业,不容听天由命。我们不能再等15年才找到下一个“蒂姆的忏悔”了。

更多探索

地理信息系统与古人类学:将地理空间科学的新方法纳入灵长类动物和人类进化的分析中。 R. L. Anemone, G. C. Conroy 和 C. W. Emerson 发表于美国体质人类学杂志,第 54 卷,增刊第 53 号,第 19–46 页;2011 年。

以新方式寻找化石:预测高产化石地点位置的人工神经网络方法。 Robert Anemone, Charles Emerson 和 Glenn Conroy 发表于进化人类学,第 20 卷,第 5 期,第 169–180 页;2011 年 9 月/10 月。

用于识别怀俄明州大分水岭盆地哺乳动物化石地点的基于人工神经网络的方法。 Charles W. Emerson 和 Robert L. Anemone 发表于遥感快报,第 3 卷,第 5 期,第 453–460 页;2012 年。

有关此研究的更多信息,包括其资金来源,请访问 ScientificAmerican.com/may2014/anemone

来自我们的档案

我们同类的第一个 Kate Wong;2012 年 4 月。

大众科学在线

要查看来自大分水岭盆地探险的更多照片,请访问 ScientificAmerican.com/may2014/fossil-hunting

大众科学 Magazine Vol 310 Issue 5这篇文章最初以“化石 GPS”为标题发表在大众科学杂志 第 310 卷第 5 期 (), 第 46 页
doi:10.1038/scientificamerican0514-46
© . All rights reserved.