本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点
为了解俄亥俄州的百日咳何时开始卷土重来,或者麻疹在美国的致死率有多高,我们会查阅历史记录。但如果这些记录被藏在遥远的办公室地下室里,就没什么用处了。当它们被嵌入报告中时也是如此——你只能像欣赏画作一样观看它们,但你无法将数据放入电子表格并寻找统计显著性。如果你只查看几年的信息,格式问题并不算什么大问题。你可以仔细查阅数据并手动将其输入到你的分析中。只有当你查看数百或数千个数据点时,这才会成为一个巨大的问题。
这正是匹兹堡大学的公共卫生专家在探索旧医疗数据并开发预测未来疫情的模型时遇到的问题。“我们发现自己不断地回顾并提取历史数据集。我们一遍又一遍地这样做,最终达到这样的程度,我们认为如果所有数据都数字化并开放访问,不仅对我们自己,而且对每个人都是一项服务,”匹兹堡大学公共卫生研究生院院长唐纳德·伯克说。
四年前,在国家卫生研究院和盖茨基金会资金的支持下,他们开始了将125年医疗记录数字化的过程。这项工作被称为泰科计划,以丹麦贵族第谷·布拉赫的名字命名,他进行了大量的天文观测,开普勒后来利用这些观测结果发展出行星运动定律。(但没有压力,对吧?)
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述有关塑造我们当今世界的发现和想法的具有影响力的故事。
这个在线、开放获取的资源现在收录了1888年至今47种疾病的记录。它包括来自每周发布的美国国家法定传染病监测报告的数据,这些数据经过标准化处理,可以立即进行分析。
在研究领域,这是一项巨大的成就。要使这些数据可用,需要的不仅仅是悠闲地一边喝咖啡一边监控扫描仪。数据必须统一化,这是一个繁琐的手动输入过程,其中包括令人羡慕的任务,例如删除句点、破折号和其他不一致之处,同时识别数据空白。
匹兹堡的研究人员还对他们的新数据宝库进行了试用,以说明这些数据可以做什么。他们从泰科计划中挖掘了有关记录中详细描述的八种常见疾病的信息——脊髓灰质炎、麻疹、风疹、腮腺炎、甲型肝炎、白喉和百日咳。通过查看疫苗被发现用于这些疾病之前和之后的可用记录,他们估计自1924年以来已预防了1.03亿例这些传染病(假设这些减少都归因于疫苗接种计划)。他们的研究结果发表在本周的《新英格兰医学杂志》上。数据还指出了当社区对疫苗接种变得过于松懈时(以及其他因素)可能发生的情况。他们量化了近年来百日咳在全国范围内的复苏,特别是在中西部到西北部以及东北部,以及持续发生的腮腺炎病例。“据报道,疫苗拒绝或延迟接种率正在上升,”作者写道。“未接种疫苗被认为是导致百日咳再次出现的原因,包括2012年的大规模流行病。”
伯克说,当疫苗效果良好时,有时“人们不再害怕这种疾病,他们低估了疫苗的价值,在某些方面,这就是现在正在发生的事情,”他指的是已被证伪的疫苗与自闭症之间的联系,这促使一些家长放弃儿童疫苗。有了这个新近可用的数据收集,可以做的不仅仅是查看疾病在哪里发生——或不发生。研究人员可以开始寻找疾病的驱动因素,并确定疾病负担的模式,例如,气候或社会经济地位。
在11月28日向公众开放搜索后,您可以在这里亲自浏览一些数据。