2010年4月12日

研究人员旨在防止医疗记录中的身份盗窃

本文发表于《大众科学》的前博客网络，反映了作者的观点，不一定反映《大众科学》的观点

随着时间的推移，患者最终会向其医疗保健提供者提供大量信息，当所有数据汇总在一起时，它们也成为研究疾病和人口趋势的研究人员的福音，从中寻找更好治疗疾病的线索。如今，随着越来越多的患者医疗保健记录数字化，患者信息在研究人员之间得到更广泛的共享——这可能是好事，也可能是坏事，取决于谁有权访问它。

电子病历(EMR) 系统包含详细但匿名的患者级别数据，这些数据以代码表示，这些代码对应于不同的健康状况，包括疾病、症状或损伤。近来，EMR越来越多地被用于为全基因组关联研究(GWAS)提供数据，GWAS用于识别特定基因组变异与健康相关现象之间的关系，这是兑现个性化医疗承诺的关键。然而，范德堡大学纳什维尔分校的一个研究团队在周一发表于《美国国家科学院院刊》上的一项研究中得出结论，当个人信息通过公共数据库和电子病历中可用的代码与遗传信息关联时，患者隐私可能会受到威胁。

关于支持科学新闻

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻事业订阅。通过购买订阅，您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。

研究人员声称已在他们的研究中阐明了这个问题，他们借助患者记录中的诊断代码识别出 2,762 名患者组中的 96%。

范德堡大学研究人员 Grigorios Loukides、Aris Gkoulalas-Divanis 和 Bradley Malin 认为，一种可能的解决方案是使用一种创建匿名记录的方法，该方法用一系列相关代码取代当前的系统——即国际疾病与相关健康问题统计分类(ICD)。研究人员创建了一种算法，该算法概括了临床信息，从而使患者保持匿名，同时提供研究人员所需的医疗和遗传联系。

Loukides 及其同事使用来自 2,600 多名患者的实际信息，针对模拟的恶意计算机黑客攻击测试了该算法的数据保护性能，假设潜在的黑客知道患者的身份、患者的部分或全部 ICD 代码，以及患者记录是否包含在发布的数据中。研究人员写道，该技术挫败了揭露患者私人信息的企图，并保持了数据完整性，这对于保留用于验证全基因组研究的有用信息是必要的。