这是有史以来规模最大、最重要的针对高血压治疗的调查,其耗资也十分巨大。美国医生招募了来自 623 个办公室和诊所的 42,418 名患者,使用四种常用处方药之一对参与者进行治疗,并对他们进行了至少五年的随访,以观察药物控制血压的效果以及降低心脏病发作、中风和其他心血管问题的风险。它符合医学研究的最高标准:医生和患者都不知道谁被分配到哪个治疗组,并且患者有均等的机会被分配到任何一组。长期以来,这种随机对照试验在确定药物和其他治疗的安全性和有效性方面是无与伦比的。这项名为 ALLHAT(抗高血压和降脂治疗预防心脏病发作试验)的试验,估计耗资 1.2 亿美元,耗时八年完成。
2002 年 12 月宣布的结果令人震惊:最古老且最便宜的药物,即噻嗪类利尿剂,在降低高血压方面比更新、更昂贵的药物更有效。此外,利尿剂通过排出体内多余液体发挥作用,在降低发生心力衰竭、住院和中风的风险方面效果更好。美国国家心肺血液研究所 (NHLBI) 认为,ALLHAT 绝对物有所值,该研究所负责运行该试验。如果患者因高血压而开具利尿剂而不是更昂贵的药物,那么仅处方药费用一项,全国每年就可节省 31 亿美元,并且通过避免中风治疗、冠状动脉搭桥手术和高血压的其他后果,还能节省数亿美元。
但是,如果像 60% 的 ALLHAT 患者那样,仅靠利尿剂无法控制血压,患者应该怎么办?他们接下来应该转向哪些药物?那是接下来要进行的合乎逻辑的研究,但 NHLBI 无法负担得起进行另一项随机对照试验来找出答案。这时,大卫·J·马吉德有了他的伟大想法。作为科罗拉多州珀曼内特医疗集团(巨型凯撒珀曼内特医疗保健组织的一部分)的研究主任,马吉德和任何一位科学家一样尊重经典的临床试验。但他认为,有一种方法可以在不经历漫长的时间和试验费用的情况下,获得同样严谨的结果。相反,他认为,他可以梳理凯撒数据库中数千份电子健康记录,以找出如果利尿剂不能带来所需的血压降低,哪些抗高血压药物效果最好。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
马吉德在一年半的时间里找到了答案,成本仅为 20 万美元,仅为临床试验预期成本的一小部分。他和他的同事在 2010 年报告称,另外两种心脏药物,即血管紧张素转换酶 (ACE) 抑制剂和 β 受体阻滞剂,作为二线治疗药物,效果同样有效。医生可以为仅靠利尿剂无法控制血压的患者开具这两种药物中的任何一种。“随机试验非常昂贵且耗时,我们不可能为所有需要解答的重要问题都进行试验,”马吉德说。“使用健康记录[比较治疗方法]提供了一种实用的替代方案。”
艰难的真相
马吉德是日益有影响力的运动的先驱,该运动旨在改变临床医生和研究人员确定哪种药物、手术或其他治疗方法对特定疾病或病症最有效的方式。正式名称为比较效果研究 (CER),它科学地确定哪些疗法有效,哪些无效。这种方法通常最容易理解为不同药物之间或药物和手术之间的直接比较。但其方法正被用于评估范围越来越广的干预措施,其中许多措施与药物无关,例如,提供交通和住房援助的社区健康计划在让体弱多病的老年男女远离医院方面,是否比侧重于更传统的医疗服务的计划更有效。
对更大程度审查的需求源于紧迫的医疗和经济挑战。对 CER 的医疗需求源于一个鲜有患者意识到,更少医生承认的事实:许多医疗治疗的科学依据往往站不住脚,甚至根本不存在。例如,美国传染病学会发布的一半以上的指南仅基于“专家意见”,而不是实际的比较数据,更不用说临床试验了。“实践中所做的事情与科学已经表明的事情之间存在着巨大的鸿沟,”凯撒有效性和安全研究中心新任主任伊丽莎白·A·麦格林说。与此同时,她指出,临床医生抱怨说,科学研究通常无法轻易转化为现实世界的环境。
比较效果研究的经济必要性同样具有说服力。多年来,各个医疗保健计划一直在比较各种治疗方法的成本和结果,以努力削减预算,然而,预计美国医疗保健支出将在 2011 年达到 2.7 万亿美元。对于消费者重视的东西来说,这个数额听起来可能是一个合理的价格(即使它使其他支出相形见绌,例如五角大楼明年将支出的 6710 亿美元)。然而,不必要的医疗保健支出意味着可用于投资、教育、研究和其他国家需求的资金减少。“我们[医疗]支出中高达三分之一用于无效或不必要的护理,”麦格林说,换句话说,每年约为 9000 亿美元。(相比之下,根据国会预算办公室 2009 年的分析,医疗事故改革可以在 10 年内节省约 540 亿美元。)“我们不能把钱花在无效的东西上,”她继续说,尤其是当国家不断飙升的医疗保健账单威胁到州和地方政府、企业和医疗保险时,这些是为大多数医疗费用支付的“第三方”。为了通过确保国家只为有效的治疗方法付费来节省资金,2009 年的经济刺激法案为比较效果研究拨款 11 亿美元。
这是一大笔钱,但与此类研究的成本相比,只是一笔小数目——至少是传统类型的 CER,它使用临床试验来区分帮助患者的疗法和无效的疗法——以及需要多少此类研究。国家科学院所属的医学研究所 2009 年的一份报告轻松确定了 100 个需要解答的相对有效性问题。将 100 个问题乘以每个问题几亿美元,就等于“负担不起”。因此,需要新颖、成本较低的比较效果研究方法,例如马吉德的方法,该方法利用最新的信息技术工具——从挖掘凯撒等大型综合医疗网络数据库到疾病的复杂数学建模——努力以随机对照试验成本的一小部分来发现有效的方法。
临床试验的成本并不是 CER 正在发生的巨变的唯一推动力。新研究有望产生更好的信息:比传统试验数据更有用于临床实践的数据。
原因是临床试验倾向于招募更年轻、更健康且更可能服用处方药的人;研究对象也比普通患者受到医生的更密切监测。因此,一些医生反对说,试验结果可能不适用于他们治疗的年龄较大、病情较重、依从性较差的患者。此外,传统的随机临床试验评估的是疗效,这是药物或其他疗法益处的最佳情况、通常是理想化的衡量标准。相比之下,大多数医生更关心有效性,这意味着治疗在现实世界条件下对真实患者的效果如何。因此,医生可以并且确实会驳回在随机临床试验的温室中获得的结果,认为这些结果不适用于他们的患者。例如,尽管有 ALLHAT,但 2009 年的一项研究发现,只有 36% 的高血压首诊处方是利尿剂,这部分反映了一些医生认为结果与他们的患者无关的观点。马吉德认为,如果严谨的研究评估不同干预措施的现实世界有效性,更多的医生可能会将结果纳入他们的临床实践。
与美国医疗保健交付方式的任何重大变革一样,CER 也引起了批评者的警惕,他们担心 CER 可能会限制医生的自主权和患者的选择。但是,随着该领域开发出严谨、高效的方法来回答任何患者或医生都可能提出的最重要的问题——什么有效?——它将不可避免地在个人和政策层面的医疗保健中发挥越来越重要和关键的作用。
进入数据矿井
幸运的是,寻找廉价方法来进行比较效果研究并获得与现实世界中的真实患者相关的结果的需求,与医疗保健领域的另一项重大变革不谋而合:电子病历的普及。凯撒珀曼内特拥有 860 万人的电子病历。一个新的由六家医疗机构组成的联盟,包括克利夫兰诊所和梅奥诊所,拥有 1000 万人的电子病历。退伍军人事务部是电子健康记录以及 CER 的先驱,每年为超过 600 万退伍军人提供护理。至关重要的是,在每种情况下,医疗机构的记录都比标准的医疗保险索赔数据更完整,因此更有用,后者通常缺少有关患者的关键细节。凯撒、该联盟和退伍军人事务部都启动了计划来挖掘这些记录,例如,获取所有 2 型糖尿病患者,确定他们接受的治疗并比较结果。“借助这些大型数据库和详细的临床信息,我们可以在现实世界的环境中,对全方位的患者(而不仅仅是为临床试验选择的患者)进行比较效果研究,”凯撒研究部门主任乔·V·塞尔比说。
分析数百万患者而不是标准临床试验中的数百或数千名患者也意味着结果可能在统计学上更可靠——也就是说,发现结果不太可能是偶然的。挖掘患者记录的另一个优势:它们包括儿童和育龄妇女,这些人通常被排除在临床试验之外,因为风险被认为超过了益处。
乍一看,挖掘数据库以获取信息可能很像进行旧式的观察性研究,在观察性研究中,研究人员找到一组恰好正在接受特定疗法的患者,以及另一组未接受治疗或接受不同疗法的患者。相比之下,随机对照试验将患者分配为接受一种或另一种治疗。观察性研究产生了巨大的公共卫生效益(例如,表明吸烟会导致肺癌),但它们也可能产生误导。例如,观察性研究得出的结论是,在更年期前后雌激素水平开始下降的老年妇女中,长期激素疗法降低了患心脏病的风险,并带来了其他益处。事实上,正如 2002 年的妇女健康倡议(一项前瞻性随机对照试验)所表明的那样,激素替代疗法并不能预防心脏病,反而会增加中风和乳腺癌的风险。问题是,在观察性研究中使用激素替代疗法的妇女在重要方面与未使用激素替代疗法的妇女不同(如果没有任何其他不同,她们正在接受医生的治疗)。这些差异,而不是激素疗法,导致了妇女患心血管疾病的风险明显较低。
今天,在健康记录用于 CER 方面的先驱们非常清楚他们正在进行观察性研究。但他们已经开发出统计和其他方法来防范可能困扰此类调查的错误。关键步骤是确保导致特定结果的原因是治疗方法,而不是患者的某些特征,就像激素替代疗法的观察性研究中的情况一样。“接受一种治疗的人与接受另一种治疗的人总是可能在某些方面存在差异,”塞尔比说。“为了对此进行调整,您需要非常详细的数据,而凯撒珀曼内特拥有这些数据。它可以告诉您[比较组中的]患者在所有实际目的上都是相同的,或者允许您在统计上调整任何剩余差异。”
盲人将看见
南加州珀曼内特医疗集团的眼科医生唐纳德·方利用这些数据比较了两种治疗年龄相关性黄斑变性的方法,年龄相关性黄斑变性是 60 岁以上人群严重视力丧失的主要原因。自 2004 年以来,医生一直在使用基因泰克公司生产的癌症药物阿瓦斯汀来对抗这种疾病。但这是一种标签外使用——也就是说,该公司没有获得美国食品和药物管理局的批准,但医生仍然可以开处方。2006 年,FDA 批准了基因泰克公司生产的另一种药物 Lucentis 用于治疗黄斑变性。阿瓦斯汀和 Lucentis 非常相似,但阿瓦斯汀每剂的成本为 50 美元,而 Lucentis 为 2200 美元。这让医生陷入了两难境地:他们应该继续标签外使用阿瓦斯汀,还是将患者转用 Lucentis?
方知道这个问题迫切需要进行科学比较。然而,他决定不进行漫长而昂贵的随机对照临床试验。相反,从 2005 年到 2008 年,他和他的同事将 452 名凯撒患者纳入一个单独的登记处——所有以前未接受治疗且仅接受一种黄斑变性药物治疗的患者。记录显示,324 人恰好接受了阿瓦斯汀治疗,128 人接受了 Lucentis 治疗,这反映了个别医生和患者的偏好,而不是临床试验将使用的随机分配。科学家在 2009 年报告称,尽管阿瓦斯汀患者在开始治疗时恰好视力较差,并且在随访的 12 个月内平均注射次数减少了两次,但两种药物的视力改善程度相同。
这种观察性研究不如随机对照试验的统计学纯度。但与其他挖掘健康记录以进行 CER 的研究人员一样,方和他的同事使用了标准的统计技术来控制他们的人群研究选择中隐藏的偏差。他们还确保阿瓦斯汀和 Lucentis 患者在年龄、视力丧失严重程度和其他关键因素方面相匹配。方认为,结果既科学严谨,又比标准临床试验更贴近临床医生。“这项研究的人群更符合实际情况,”他说。患者的平均年龄约为 80 岁,他们没有像临床试验中的患者那样受到密切的审查和护理。“我们没有排除任何人。这使得医生更难说,‘这不适用于我的患者。’”碰巧的是,4 月份在《新英格兰医学杂志》上在线发表的阿瓦斯汀和 Lucentis 随机对照试验第一年的结果也支持了方的发现。
确保统计数据的正确性
通过电子病历进行 CER 的科学家正在开发多种技术,以确保他们的结果在统计学上是可靠的。最关键的是确保两个或多个比较组中的患者——例如,接受 Lucentis 和阿瓦斯汀的患者,或 β 受体阻滞剂和 ACE 抑制剂的患者——是等效的。为了做到这一点,研究人员分析了大量变量(100 个并不少见),从社会经济数据到实验室结果,以查看是否有任何变量在接受一种治疗而不是另一种治疗的患者中更常见。塞尔比解释说,通过考虑这些变量,“您最终会比较具有相同接受治疗倾向但实际上接受了其中一种治疗的人。”这消除了激素替代疗法类型错误的风险,在这种错误中,接受治疗实际上是获得更好护理的标志。
例如,在他的抗高血压研究中,马吉德分析了医疗记录,以识别任何不太可能平等地接受两种药物(ACE 抑制剂或 β 受体阻滞剂)的患者,例如患有先前存在的疾病,该疾病作为两种药物之一的禁忌症。马吉德说:“我们排除了这些病例,只剩下那些有平等机会被处方 ACE 抑制剂或 β 受体阻滞剂的患者。”然后,他识别出具有相似健康特征的患者,以减少药物比较因一种药物被给予病情较重的患者而产生偏差的可能性。
“我们使人群尽可能地平等,”他说,基于年龄、性别、并发症、生命体征、实验室结果(例如,肾功能)以及社会经济因素(例如,教育和收入)。对于每位 54 岁的白人女性,高中辍学,基线血压为 150/80,在 β 受体阻滞剂组中,患有这两种并发症并服用这三种药物,马吉德将她与另一位 54 岁的白人女性,高中辍学,基线血压为 150/80 的 ACE 抑制剂组中的女性相匹配,后者患有相同的疾病并服用相同的药物。当他完成时,马吉德已经精心匹配了每位接受 ACE 抑制剂治疗的患者和一位接受 β 受体阻滞剂治疗的患者。无法以这种方式匹配的患者从研究中剔除。
由于分析详细的健康记录比前瞻性随机对照试验产生结果的速度快得多,因此它挽救了生命。当一位学术界的同事提到实验室动物研究暗示用于止痛的万络可能增加心脏病发作和中风的风险时,凯撒风湿病学家大卫·H·坎彭使用了这种方法。坎彭和他的同事分析了凯撒的患者记录,在默克公司于 2004 年自愿将万络从市场上撤回的几个月前,发现了完全相同的情况。碰巧的是,服用万络和相关药物(称为 COX-2 抑制剂)的凯撒患者少于全国平均水平。COX-2 抑制剂不像阿司匹林等其他非甾体抗炎药 (NSAID) 那样构成相同的胃肠道出血风险,但并非所有患者都有这种出血风险,因此不需要更新、更昂贵的 COX-2 抑制剂。坎彭回忆说,一度,在美国,COX-2 的使用量接近 NSAID 处方量的 50%,但在凯撒,它一直低于 10%。
医疗保健支出的价值
除了评估不同疗法治疗特定疾病的效果如何外,新一代比较效果研究人员还旨在比较这些疗法的成本,并询问额外的成本是否能带来额外的效果。到目前为止,这个问题一直被禁止:美国医学的核心原则长期以来一直是成本考虑因素在临床决策中没有地位。因此,传统上,CER 并未考虑成本。评估两种或多种治疗方法并按临床有效性进行排名,仅此而已。但是,医疗保健费用的飙升增加了选择以最少的医疗保健支出获得最大效果的治疗方法的压力。
然而,在过去几年中,成本效益已成为越来越多分析的重点。2006 年,退伍军人事务部研究人员研究了患有难以治疗的缺血性心脏病的患者。一些人接受了血管成形术,外科医生在血管成形术中拓宽阻塞的血管(通常使用球囊状装置),另一些人接受了冠状动脉搭桥术,在冠状动脉搭桥术中,血液通过植入的移植物绕过阻塞物重新定向流动。每种手术都有令人印象深刻的三年生存率(血管成形术为 82%,搭桥术为 79%)。但血管成形术的总成本为 63,900 美元,而搭桥术为 84,400 美元。换句话说,血管成形术略微有效,而且成本更低。五年后,75% 的血管成形术患者仍然活着,而搭桥术患者为 70%,各自的成本分别为 82,000 美元和 101,000 美元——再次,更好的生存率,更低的成本。
使用这些结果来实际控制成本的道路不一定一帆风顺。2010 年的医疗保健改革法禁止医疗保险使用比较效果研究来决定支付什么费用(例如,阿瓦斯汀而不是 Lucentis 用于治疗黄斑变性),这是对立法者的让步,立法者希望确保患者和医生仍然可以自由选择他们喜欢的任何治疗方法,并且威胁说,如果没有该条款,他们将投票反对该法案。但是,医疗保险可以使用该研究来设定支付率,从而鼓励提供商以给定的价格提供最佳护理,这种系统称为“同等结果同等支付”。以黄斑变性为例,医疗保险可能会每次注射支付 50 美元,这意味着坚持使用 Lucentis 或医生的患者将留下 2150 美元的共同支付额。
让人们自掏腰包支付更多钱不是目标。这只是达到目标的手段,目标是为患者带来最有效的治疗方法——并且不要通过补贴成本更高但没有额外益处的治疗方法来提高国家的医疗保健费用。“当我们进入医疗保健改革时代时,我们需要解决如何为此付费的问题,”方说。“一个明显的答案是,你只想为有效的东西付费。”当两种药物的效果同样好时,正如他发现阿瓦斯汀和 Lucentis 对年龄相关性黄斑变性的效果一样好,那么计算应该很容易。但是,如果药物 A 的成本是药物 B 的 20 倍,但仅产生 5% 的更大益处,例如,以生存率、视力敏锐度、胰岛素控制或住院次数来衡量,情况又如何呢?“我们必须开始作为一个社会来问,这种边际改善是否值得这个价格,”他指出。这肯定会是一场痛苦的对话,迫使社会努力应对我们愿意在边际健康改善上花费多少钱。
未来的障碍
尽管消除无效治疗听起来像是患者、医生和付款人都会欢迎的事情,但事实上,CER 已经陷入了关于医疗保健改革的辩论的交火之中。指控中最主要的是:正如密歇根州众议员迈克·罗杰斯在 2009 年警告的那样,该研究将被用来“拒绝或配给护理”。事实上,该研究并未比较不同类型的患者是否从给定的治疗中受益,以此来阻止某个群体接受治疗,正如“拒绝或配给”可能暗示的那样。比较效果研究的目标是淘汰对所有人效果较差的治疗方法,并用更有效的替代方法取而代之。“现在正在对 CER 进行攻击,说这完全是为了医疗保健配给,”克利夫兰诊所的心脏病专家史蒂文·尼森说。“即使那不是我们正在谈论的内容,他们也在取得进展。CER 是关于提供最佳护理,而不是配给护理。”
健康专家说,这种疑虑是美国独有的。英国研究人员在去年《药物经济学》杂志的一篇文章中辩称,在没有其他国家的人“像美国利益相关者(包括很大一部分政策制定者)那样怀疑地看待证据”。英国很久以前就接受了比较效果研究,将其研究结果纳入关于其国家医疗服务体系将涵盖哪些内容的决策中。证据表明,CER 并非万能药;英国的医疗保健费用仍在上涨——尽管没有美国那样陡峭。但是,基于 CER 做出医疗保健决策显然并没有伤害英国人,他们的预期寿命实际上高于美国人。
“如果世界上有任何国家需要比较效果研究,那就是美国,”尼森说。“可以肯定地说,美国的医疗是最不具成本效益的。浪费了太多钱,如果我们消除这种浪费,我们就可以为每个人提供医疗保健。”在一个比尊重科学更尊重个人选择权的国家,这将是一场艰苦的战斗。但比较效果研究是我们公平地改善医疗保健而又不至于倾家荡产的最佳希望。