以下文章经 The Conversation 许可转载,这是一个涵盖最新研究的在线出版物。

密歇根州弗林特的水危机突显了一系列严重问题:公共卫生爆发、城市基础设施不足、环境不公正和政治失误。但就复苏而言,核心挑战,也是相对较少受到关注的一个挑战,是我们缺乏有用的信息和理解。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。
谁的风险最大?有害的铅源在哪里?资源应该分配到哪里?利用现代大数据工具,我们可以回答这些问题,并帮助指导应对这场危机。
在我们 密歇根大学学生团队 的支持下,我们汇总了有关弗林特水问题的现有数据,包括水质测试结果、向家庭供水的服务管线记录、土地和用水信息。利用新的算法和统计工具,我们能够更全面地了解弗林特的风险和挑战。
这些方法与 Facebook、亚马逊和其他大型科技公司使用的方法非常相似,这些公司从用户那里收集大量数据。但 Facebook 的算法会处理上传的照片以检测人脸,而亚马逊的模型会预测您会喜欢哪些产品,我们则使用这些分析工具来检测铅污染风险高的房屋,并预测埋在地下或隐藏在居民家中的铅管位置。
我们学到了什么?以下是我们研究的一些要点。
铅污染在各个家庭之间差异很大,并且在弗林特周围高度分散,但它出奇地可预测
关于弗林特的头条新闻很容易让人相信,该市所有家庭的铅含量都非常高。但事实上,使用该州的 哨兵计划 的数据,我们发现在 2 月份的某个时期,只有 8% 到 15% 的家庭的铅含量高于联邦行动水平 15 ppb(十亿分之一)。
事实上,根据哨兵计划的测试数据,从 2016 年 1 月到 8 月,情况一直在改善。基于对大约 750 个家庭的反复监测,随着时间的推移,测试结果高于行动水平的家庭越来越少。几乎一半的样本几乎没有可检测到的水平(低于 1 ppb)。
当我们不知道哪些家庭处于危险之中时,这些低数字并不能提供多少安慰。根据政府数据,弗林特只有大约 30% 的家庭进行了水质测试,而且这些水质测试并不能保证安全;它们只能识别危险。此外,从数据中可以清楚地看出,较慢进行水样检测的家庭往往是那些风险更大的家庭。
那么我们能找到这些家庭吗?答案是肯定的,在一定程度上是准确的。我们构建了基于几个属性(建造年份、位置、价值、大小等)分析家庭情况的统计模型,并提供风险等级的估计。
这些模型的质量受到水样大量数据的驱动,这些水样由居民提交,并由政府官员在危机发生后进行测试。这为我们提供了一个测量数据库,其中包括自 2015 年 11 月至今在弗林特采集的 20,000 多个水样,覆盖了大约 10,000 个家庭。我们已将我们的风险评估提供给政府官员,并正在将其纳入一个移动应用程序,该应用程序由 谷歌资助,并由弗林特大学的学生构建,使弗林特居民可以了解他们房屋的风险等级。
这些统计模型不仅提供预测;它们还让人们更好地了解问题。这具有更广泛的意义,因为这些预测铅的因素可能会推广到弗林特以外的地区。
数据表明,铅污染与许多因素有关;例如,较旧的房屋往往风险较高,而房屋价值较低的房屋也往往风险较高。价值较低的房屋也往往是水样检测率最低的房屋。此外,虽然最高的读数在地理上是分散的,但预测为高风险的房屋往往聚集在特定的社区。
弗林特的铅管记录零散且混乱,但统计方法可以显著填补空白
媒体报道和政治努力继续关注所谓的“水服务管线”,这些管线将每栋房屋连接到街道上的配水系统。假设是带有铅服务管线的房屋最容易受到铅暴露和中毒的风险。因此,大部分注意力都集中在定位和更换这些管线上。
密歇根州议会已拨款超过 2500 万美元用于更换有害管线,首先是 大约 250 个家庭的试点阶段。这项工作由 国民警卫队准将迈克尔·麦克丹尼尔 领导的团队负责。
然而,问题不仅在于由铅材料制成的管线:铅颗粒会积聚在腐蚀的镀锌钢管的内壁上。另一方面,由铜或塑料制成的管道通常被认为是安全的。
但是,管线更换计划面临着直接的挑战。最明显的问题是:这些危险的管道在哪里?
不幸的是,该市没有保持关于服务管线安装和材料的一致记录。但市政官员最终在经过一番搜索后发现了一套带有手写注释的地图(最后更新于 1984 年),这些记录由 马蒂·考夫曼教授领导的弗林特大学研究团队进行了数字化处理。这些记录似乎确定了弗林特大多数住宅地块的服务管线材料。
这些记录的完整性和准确性如何?不幸的是,不太好。对于超过 30% 的家庭,要么缺少标签,要么记录与服务管线一部分的房屋检查不符。
我们可以再次借助算法和数据来填补空白。通过查找现有记录中的模式,统计工具可以对家庭服务管线中的材料类型做出合理的“有根据的猜测”。我们一直在与迈克尔·麦克丹尼尔准将的管线更换团队直接合作,提供统计估计,表明最有可能发现铅管的位置,这指导了他们对更换资源的定位。
我们的建议正在适应传入的数据,使用在线广告实验或临床试验中应用的技术,以快速有效地识别有风险的房屋。
我们的机器学习技术利用所有可用的城市数据、地块记录和 3,000 多份检查报告的数据库,能够以高于 80% 的准确率估计管线材料。例如,我们发现,1920 年代至 1940 年代建造的房屋比 1960 年之后建造的房屋服务管线中存在铅的可能性高出许多倍。我们的猜测绝非完美,但这种水平的估计可以为恢复工作节省数百万美元。
家庭服务管线可能不是铅的最大贡献者
尽管媒体对服务管线给予了极大的关注,但我们分析的主要结论之一是,这些服务管线可能不是弗林特饮用水中铅的主要驱动因素。是的,事实是,服务管线中带有铜的房屋的铅含量平均低于服务管线中带有铅的房屋。但是,当您仔细查看水质测试数据时,差异比您想象的要小得多。
虽然由于记录零散,很难确定,但我们发现的是,无论是否带有铅服务管线,房屋中都会出现大量铅峰值。这表明,大部分危险高铅读数可能不是由服务管线材料驱动的,而是由其他因素驱动的。 研究这些问题的土木工程师报告说,铅会从多个来源浸出,包括家庭内部管道、水龙头装置和老化的管道焊料。
我们可以得出的结论是,公民和政策制定者可能需要将他们的注意力扩大到服务管线材料之外,并考虑其他措施来解决其他铅来源。更换服务管线当然是解决方案的必要组成部分,但这还不够。
为了解决更广泛的问题,数据和统计工具可以帮助大大降低风险,而且成本更低,而且对弗林特问题的以数据为导向的理解可以指导解决 其他地区铅问题的努力。
欲了解更多关于获取滤水器和检测水质的信息,请访问 michigan.gov/flintwater/
本文最初发表于 The Conversation。阅读原文。