拥有 18.2 万片叶子的庞大数据库正在帮助预测植物家谱

这项技术可用于从花朵到细胞的一切事物,以检查影响植物部分形状的因素

植物的故事铭刻在它的叶片中。生长在水分充足的寒冷环境中的树木更可能拥有边缘有许多锯齿的大叶片。但是,如果同一物种生活在温暖干燥的地区,它的叶片可能更小更光滑

现在,一本追踪来自世界各地 141 个植物科和 75 个地点的 18.2 万片叶片形状的图集,显示出有望提高科学家解读这个故事的能力。研究人员利用该图集发现,仅叶片形状就能准确预测叶片采集地点,准确率达 14.5%,正确预测植物科,准确率达 27.3%。这远优于使用传统方法描述叶片形状所做的预测。

研究人员希望这种方法将帮助他们更多地了解塑造植物叶片的力量,甚至可以通过分析化石植物的形状来了解古代气候。德克萨斯州韦科市贝勒大学的古植物学家丹·佩佩说:“这是一个惊人的数据集。我们越来越接近叶片形状测量的自动化,并利用它来弄清植物的分类学并重建气候。”


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。


研究结果已发布在生物学预印本服务器 bioRxiv 上,发布日期为 6 月 20 日。植物形态学家兼主要作者丹·奇特伍德还在 6 月 27 日在德克萨斯州沃斯堡举行的 2017 年植物学会议上介绍了这项研究。

塑造数据

奇特伍德,前密苏里州圣路易斯市唐纳德·丹佛斯植物科学中心的研究人员,和他的同事们汇集了他们自己关于特定植物群(如葡萄和番茄植物)的研究数据,以及来自旨在编目更广泛植物物种和地点的几个大型数据集。

然后,他们使用一种称为持久同源性的拓扑方法来分析每片叶片的形状。该方法根据图像中像素周围像素的密度为每个像素分配一个值。研究小组将每片叶片分成 16 个部分,并分析了每个部分的值模式。研究人员使用由此产生的叶片形状目录来寻找物种之间的分类学和地理关系。

奇特伍德的最终目标是重建叶片“形态空间”:所有可能的叶片形状的完整目录。“如果你可以测量目前存在的所有叶片和曾经存在的所有叶片,它会是完全随机的吗?”他问道。“或者是否会有些叶片从未出现过?是因为植物无法制造它们吗?”

持久同源性已被用于绘制从神经元网络到乐句结构的一切事物,奇特伍德希望它可以为分析植物的所有部分提供一种统一的方法。其他人也渴望将相同的方法应用于他们自己的研究需求。维也纳大学的植物形态学家扬尼克·施泰德勒希望使用这项技术来分析他不断增长的花朵 X 射线图像库。他希望这将有助于他克服传统形态学方法的一个障碍,其中许多方法涉及在图像上放置地标(在不同物种中重复出现的结构上的点)。

他说,这些技术对动物效果很好,动物往往有明显的标志:两块骨头相遇的点、眼睛的角落、鼻子的尖端。但花朵通常具有光滑的曲面,这使得研究人员难以精确定位特定地标。“这在叶片和花朵中一直是一个可怕的问题,”施泰德勒说。“它阻碍了我们。”

逐叶分析

像佩佩这样的古植物学家希望找到自动化分析化石叶片的方法——这个过程目前需要艰苦的工作才能手动在化石上放置地标进行分析。

其他项目正在分析植物特征,包括叶片、果实和花朵,以使研究人员和爱好者能够在野外快速识别它们。法国蒙彼利埃国际发展农业研究中心的植物学家皮埃尔·邦内特说,例如,一个名为 Pl@ntNet 的项目通过手机应用程序收集了来自世界各地用户提交的数百万张图像。到目前为止,该项目已使用机器学习技术分析了来自 13,000 种植物的 580,000 张图像。

邦内特的合作者之一,法国蒙彼利埃计算机科学与自动化研究所的计算机科学家亚历克西斯·乔利说,Pl@ntNet 在识别植物方面比奇特伍德的图集更好。他补充说,该团队尚未将 Pl@ntNet 用于研究叶片形状的多样性。

奇特伍德希望将他的拓扑方法的结果输入到机器学习算法中,以查看这些算法是否可以改进他的分类学和地理预测。但他表示,他更感兴趣的是理解叶片形状,而不是对植物进行分类。

施泰德勒说,曾经有一段时间,似乎理解植物形态的努力正在消亡。但该领域正在经历复兴,部分原因是广泛努力表征植物(特别是作物)的性状,并了解遗传和环境如何影响它们。

“形态学正在重生,”施泰德勒说。“这就是该领域的发展方向。而且我认为,特别是与遗传数据相结合,我们拥有非常光明的未来。”

本文经许可转载,并于 2017 年 7 月 7 日首次发表

© . All rights reserved.