几十年来,研究人员一直在进行纵向研究,以获得对健康和疾病的新见解。例如,通过定期记录同一批人在多年内的病史和护理信息,他们已经证明,油漆剥落中的铅会损害儿童的大脑和身体,并证明高血压和胆固醇水平会导致心脏病和中风。时至今日,著名的弗雷明翰心脏研究(Framingham Heart Study)的一些最初参与者(现在至少95岁)仍在向研究人员提供健康信息,这项研究始于1948年。
然而,健康研究人员并不是唯一长期收集和分析医疗数据的人。越来越多的公司专门从数亿份医院和医生的记录,以及处方和保险索赔以及实验室测试中收集纵向信息。将所有这些数据汇集在一起,使其成为一种有价值的商品。其他企业愿意为从这些集合中收集到的见解付费,以指导他们在制药行业的投资,例如,或更精确地定制推广新药的广告活动。
法律规定,这些商业数据库中所有人的身份都应保密。实际上,向数据挖掘公司出售医疗信息的组织会删除其记录中的社会安全号码、姓名和详细地址,以保护人们的隐私。但是,数据经纪人也会在他们收集的记录中添加唯一的数字,使他们能够将不同的信息片段与同一个人匹配起来——即使他们不知道这个人的姓名。这种信息匹配使整体集合更有价值,但随着数据挖掘技术的普及,这也使得学习以前匿名个人的身份变得更容易。
关于支持科学新闻
如果您喜欢这篇文章,请考虑订阅以支持我们屡获殊荣的新闻报道。 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事能够继续存在。
目前,该系统非常不透明,以至于许多医生、护士和患者都没有意识到,他们在电子健康记录中记录或泄露的信息,或者他们要求或同意进行的实验室测试结果可能会被匿名化并出售。但他们不会永远对这些做法一无所知。在为即将出版的书籍研究医疗数据交易业务时,我发现,不仅隐私倡导者,而且医疗行业内部人士也对我们医疗信息不断扩大的销售感到日益不安。
整个医疗保健系统都依赖于患者信任他们的信息将被保密。当他们得知其他人可以深入了解他们与医疗服务提供者之间发生的事情时,他们可能会在描述自己的病情或寻求帮助时变得不那么坦诚。越来越多的医疗保健专家认为,现在是时候采取措施,让患者更好地控制自己的数据了。
数十亿美元的生意
医疗数据交易行业的主导者是 IMS Health,该公司在 2014 年的收入为 26 亿美元。该公司成立于 1954 年,于 2010 年被私有化,并于 2014 年重新上市。此后,它被证明是投资者最喜欢的公司,股价在一年多一点的时间里上涨了 50% 以上。截至发稿时,IMS 是一家价值 90 亿美元的公司。竞争对手包括 Symphony Health Solutions 和各个国家的规模较小的竞争对手。
几十年前,在计算机普及之前,IMS 的现场代理在药房拍摄了数千张处方记录,供数百名文员抄写——这是一个缓慢且成本高昂的过程。如今,IMS 自动接收来自药房、保险公司和其他医疗机构(包括联邦和许多州卫生部门)计算机化记录的拍字节(1015 字节或更多)数据。美国四分之三的零售药房将其电子记录的一部分发送给 IMS。据该公司称,总而言之,它已经汇集了从美国到澳大利亚的 5 亿个人的档案。
IMS 和其他数据经纪人不受美国医疗隐私规则的限制,因为他们的记录被设计为匿名的——仅包含出生年份、性别、部分邮政编码和医生姓名。《1996 年健康保险流通与责任法案》(HIPAA)例如,仅管理直接与个人身份相关的医疗信息的传输。
即使是匿名数据,也能卖出高价。例如,据辉瑞公司负责匿名患者数据分析的 Marc Berger 称,辉瑞公司每年花费 1200 万美元从包括 IMS 在内的各种来源购买健康数据。但从事数据交易的公司倾向于让这种做法不为公众所知。
举例来说:在 20 世纪 90 年代,IMS 开始销售关于美国医生给患者开什么处方的数据,以帮助制药公司为特定的护理提供者量身定制销售说辞。(HIPAA 保护患者的身份,但不保护医疗保健工作者的身份。)多年来,医生们并没有意识到外人可以深入了解他们的处方习惯。“当时,这是禁忌。永远不允许提及这个话题,”Shahram Ahari 说,他曾在 1999 年至 2000 年期间作为礼来公司的医药代表访问医生时使用过这些数据,现在正在罗切斯特大学完成住院医师实习。“这是一个大秘密。” 当被要求回应时,礼来公司的发言人在一封电子邮件中回复说:“我们一直坦诚地表示,我们从 IMS 接收数据。”
最终,医生们意识到了这一点并提出了投诉。有些人认为这种数据收集侵犯了隐私;另一些人则反对商业公司从其执业细节中获利。一些州通过了法律,禁止收集医生开处方习惯的数据。IMS 一路将这些规则告到美国最高法院,尽管有 36 个州、司法部以及众多医疗和消费者权益倡导团体支持数据限制的论点,但 IMS 还是在 2011 年以公司“言论自由”为由胜诉。这种做法至今仍在继续,而且大部分时间都超出了公众的注意范围。
可能出什么问题?
曾经,仅仅从医疗记录中删除一个人的姓名、地址和社会安全号码可能就足以保护匿名性。但今天并非如此。简单的数据挖掘工具可以搜索包含匿名和非匿名数据的多个数据库,以重新识别来自其表面上私密的医疗记录的个人。
事实上,计算机科学家已经多次展示了破解看似匿名的数据集有多么容易。例如,哈佛大学教授 Latanya Sweeney 在 1997 年还是麻省理工学院的研究生时,就使用了这种方法,在公开的医院记录中识别出了时任马萨诸塞州州长 William Weld。她所要做的就是将关于州雇员的所谓匿名医院数据与她知道州长居住的剑桥市的选民登记册进行比较。很快,她就能够根据年龄和性别来精确定位某些记录,这些记录可能只属于 Weld,并且详细记录了他最近一次去医院就诊的情况,包括他的诊断和他带回家的处方。
“从匿名数据中识别出人变得越来越容易,”疾病控制与预防中心公共卫生科学服务办公室主任 Chesley Richards 说。“您可能无法从实体收集的特定数据集中被识别出来,但如果您是一个正在组装多个数据集并寻找方法来链接这些数据的经纪人,那么潜在的身份识别风险就会更大。”
IMS 官员表示,他们对识别患者没有兴趣,并采取谨慎措施来保护匿名性。此外,没有公开记录的案例表明有人从 IMS 或竞争对手公司获取匿名患者数据并重新识别个人。然而,IMS 不想过多谈论纵向数据的收集和销售。在 IMS,首席执行官、医疗保健信息学研究所负责人、行业关系副总裁和首席隐私官拒绝接受本文的采访,但一位公司发言人确实协助进行了事实核查。
界限在哪里?
除了通过向其他企业出售信息赚钱外,IMS 还免费或以折扣价与学术和其他研究人员共享一些数据。该公司发布了一长串依赖其纵向数据的医学文章。例如,研究人员了解到,较新的心血管药物可以缩短住院时间,但不会延长寿命。相比之下,较新的化疗药物可能是法国癌症死亡率最近下降的部分原因。
这些益处表明,从多个来源收集医疗数据可能具有社会效益。然而,哈佛医学院医学教授 Jerry Avorn 说,在“只想在大学医学院环境中了解药物的正面和负面影响的有意识、负责任的研究人员,与坐在(大型超市)幕后试图弄清楚如何通过侵犯他人隐私来销售更多 X 产品的人之间,存在差异。”
重建对医疗信息保密性的信任的一小步是让个人有机会禁止收集他们的信息用于商业用途——弗雷明翰研究现在为其参与者提供了这种选择,罗德岛州在共享匿名保险索赔时也提供了这种选择。“我个人认为,归根结底,个人拥有自己的数据,”辉瑞公司的 Berger 说。“如果有人正在使用(他们的)数据,他们应该知道。” 而且,如果收集“仅用于商业目的,我认为患者应该有权选择退出。”
寻求更详细的同意书本身无法阻止患者隐私的侵蚀,但它将提高意识——没有意识,就不可能采取进一步的行动。对医疗系统的信任对于避免牺牲给不受控制的市场力量至关重要。
本报道项目由纽约大学亚瑟·L·卡特新闻学院的报道奖资助.