自闭症风险因素数据库或可助力该疾病的流行病学研究

一个全新的数据库汇集了来自七个国家的健康登记数据，极大地提升了自闭症流行病学研究的潜在样本量

经许可转载自SFARI.org，西蒙斯基金会的编辑独立部门。（在此处查找原始报道。）

一个全新的数据库汇集了来自七个国家的健康登记数据，极大地提升了自闭症流行病学研究的样本量。这个由国际研究联盟构建的虚拟工具，允许研究人员有效地比较不同人群的数据。

“这在自闭症领域是首创，” 丹麦奥胡斯大学精神病流行病学教授戴安娜·申德尔说道，她是该项目的先锋。“国际自闭症登记流行病学合作组织 (iCARE)”项目汇集了来自丹麦、芬兰、以色列、挪威、瑞典和西澳大利亚州以及加利福尼亚州的人口健康登记数据。

支持科学新闻报道

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。

国家健康登记处对自闭症和其他领域的流行病学研究来说是一大福音。但很少有人尝试整合来自不同国家的数据，部分原因是严格的法规禁止信息传输到原籍国境外。

“原则上，这种数据协作应该很久以前就完成了，但没有人有足够大的雄心来应对后勤和技术挑战，” 费城德雷塞尔大学流行病学和生物统计学助理教授布莱恩·李说道。李使用瑞典或丹麦国家登记处的数据单独进行过自闭症研究，但没有合并这些数据。他不是 iCARE 的成员。

该资源于 2009 年 5 月启动，获得了研究和倡导组织 Autism Speaks 提供的为期四年、120 万美元的资助。它汇集了来自超过 80,000 名自闭症患者的数据，这些患者来自 1967 年至 2009 年间约 1080 万新生儿，包括出生体重、出生顺序和诊断年龄等因素。

大多数分析可能侧重于一个较小的出生年份范围，在该范围内，感兴趣的数据在所有站点中都有代表性。

“iCARE 可以在全球任何地方的星巴克的 iPad 上进行分析，并且安全可靠，” 纽约西奈山伊坎医学院精神病学教授兼联盟成员亚伯拉罕·赖兴伯格说道。他补充说，该小组欢迎研究人员提出使用该资源的想法并提交申请。

虚拟数据池
研究人员通常通过将大型数据集物理传输到中心位置来共享数据，但这对于 iCARE 计划整合的国家和州健康登记处来说是不可能的。该小组的首要任务是设计一种简单的方法，让每个人都能访问数据，同时仍然允许研究人员完全控制其本国的数据库。

“当我们开始时，很大程度上是，‘让我们看看我们是否能做到这一点’，” 澳大利亚珀斯儿童健康研究所生物信息学副教授金·卡特说道，她是领导数据分析系统开发的研究人员之一。

解决方案涉及一种称为联邦制的数据库排序技术，该技术在给定的分析会话中虚拟地汇集来自各个站点的数据。一旦分析完成，研究人员可以下载分析结果，但汇集的数据集会消失，而不会保存到研究人员的计算机或在任何原始站点上更改，从而消除了伦理和数据隐私方面的担忧。

哥伦比亚大学流行病学和精神病学教授埃兹拉·苏瑟说道，另一个挑战是协调不同的数据集，他在 iCARE 团队的组建中发挥了关键作用。“即使是像出生体重或妊娠周这样的简单变量，在不同的登记处也可能有不同的含义，” 他说道。

该联盟正在使用该平台来检查自闭症与三个环境因素之间的联系：父母年龄、出生体重和胎龄，以及出生季节。

虽然尚未发表任何分析结果，但申德尔表示，与以前相比，iCARE 能够更精细地观察许多变量。例如，关于父母年龄对自闭症影响的研究主要局限于广泛的年龄类别，但 iCARE 的汇集分析包括足够多的个体，可以检查特定母亲和父亲年龄的自闭症风险。她说，分析已经揭示了某些年龄段风险的惊人分布，这在仅使用单个数据库的分析中永远不会出现。

虽然该小组最初的资助支持即将结束，但基础设施将继续运行五年。

赖兴伯格正在领导一个基于 iCARE 基础设施的新项目，该项目将包括许多相同的研究人员。该项目去年获得了美国国立卫生研究院自闭症卓越中心计划的网络资助，将从多代人的角度审视自闭症的潜在风险因素，例如怀孕期间接触各种药物是否与儿童的自闭症有关。

合作参与者表示，一旦出版物开始涌现，研究界将会注意到。“我们在流行病学中需要采取的步骤之一是遗传学中已经完成的——创建这些存储库，以便您可以合并样本并获得更大的数量，” 苏瑟说道。“这是未来需要发展的方向。”