住院患者面临许多危及生命的并发症风险,尤其是脓毒症——这种疾病可在数小时内致死,并且是美国医院死亡的三分之一的促成因素。在美国医院死亡。过度劳累的医生和护士通常没有太多时间陪伴每位患者,这个问题可能会被忽视,直到为时已晚。
学术界和电子健康记录公司已经开发出自动化系统,发送提醒以检查患者是否患有脓毒症,但大量的警报会导致医护人员忽略或关闭这些通知。研究人员一直在尝试使用机器学习来微调此类程序,并减少它们生成的警报数量。现在,一种算法已在真实医院中证明了其价值,帮助医生和护士平均提前近两小时治疗脓毒症病例,并将该疾病的医院死亡率降低了 18%。
脓毒症发生在身体对感染的反应失控时,可能导致器官衰竭、肢体丧失和死亡。据美国疾病控制与预防中心称,美国每年约有 170 万成年人患上脓毒症,其中约有 27 万人死亡。虽然大多数病例起源于医院外,但这种情况是住院患者死亡的主要原因。尽快发现问题对于预防最坏的结果至关重要。“脓毒症螺旋式发展非常快——如果你不及时治疗,可能在几个小时内就会恶化,” Bayesian Health 首席执行官兼创始人 Suchi Saria 说,该公司开发用于医疗用途的机器学习算法。“我的侄子死于脓毒症。例如,在他的案例中,直到他已经处于所谓的感染性休克的晚期阶段时,才怀疑或检测到脓毒症……那时就更难康复了。”
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
但在繁忙的医院中,及时的脓毒症诊断可能很困难。Saria 解释说,根据目前的护理标准,当患者出现发烧和意识模糊等四种脓毒症警告信号中的任何两种时,医护人员应注意。一些现有的警告系统会在发生这种情况时提醒医生——但 Saria 说,许多患者在典型的住院期间至少会出现四项标准中的两项,这可能会使警告程序的误报率很高。“许多其他程序的误报率非常高,以至于提供者甚至在没有确认的情况下就关闭了警报,” 紧急医学医师兼非营利组织脓毒症联盟主席 Karin Molander 说,她没有参与新的脓毒症检测算法的开发。由于警告信号的普遍性,医生还必须考虑患者的年龄、病史和最近的实验室检查结果等因素。然而,汇总所有相关信息需要时间——脓毒症患者没有时间。
在一个连接良好的电子记录系统中,已知的脓毒症风险因素是可用的,但可能需要时间才能找到。这就是机器学习算法的用武之地。一些学术界和行业团体正在教导这些程序识别脓毒症和其他并发症的风险因素,并警告医护人员哪些患者处于特别危险之中。Saria 和她在约翰·霍普金斯大学(她在那里指导机器学习和医疗保健实验室)的同事于 2015 年开始研究一种此类算法。该程序扫描患者的电子健康记录,查找增加脓毒症风险的因素,并将此信息与当前的生命体征和实验室检查相结合,以创建一个评分,表明哪些患者可能发展为感染性休克。几年后,Saria 创立了 Bayesian Health,她的团队在那里使用机器学习来提高其程序的灵敏度、准确性和速度,该程序被称为有针对性的实时早期预警系统 (TREWS)。
最近,Saria 和一个研究团队评估了 TREWS 在现实世界中的表现。该程序在两年多的时间里被纳入约翰·霍普金斯医学系统附属的五个地点的约 2,000 名医护人员的工作流程中,涵盖了资源充足的学术机构和社区医院。医生和护士在超过 76 万次患者就诊中使用该程序,其中包括超过 17,000 名患上脓毒症的患者。这项试验的结果表明,TREWS 导致了更早的脓毒症诊断并降低了死亡率,这些结果描述在三篇论文中,这些论文于上个月底发表在 npj Digital Medicine 和 Nature Medicine 上。
“我认为这种机器学习模型可能对脓毒症护理至关重要,就像心电图 [心电图] 机器在诊断心脏病发作方面所证明的那样,”Molander 说。“它将允许临床医生从计算机……试图分析 15 年的信息,回到床边,更迅速地重新评估患者——这正是我们需要做到的。”
TREWS 不是第一个在此类试验中证明其价值的程序。Mark Sendak 是杜克大学健康创新研究所的医生、人群健康和数据科学负责人,他致力于杜克大学研究人员开发的类似程序,称为 Sepsis Watch。他指出,其他专注于医疗保健的机器学习系统——不一定是专门为脓毒症检测而创建的系统——已经经历了大规模试验。一项开创性的基于人工智能的系统用于诊断糖尿病并发症的测试是在美国食品和药物管理局的投入下设计的。 其他程序也在多个不同的医院系统中进行了测试,他指出。
“这些工具在改善我们护理患者的方式方面发挥着重要作用,”Sendak 说,并补充说新系统“是另一个例子”。他希望看到更多的研究,最好是标准化的试验,这些试验涉及外部合作伙伴(如 FDA)的研究支持和指导,这些合作伙伴与结果没有利害关系。这是一个挑战,因为设计机器学习系统的医疗保健试验非常困难,包括关于 TREWS 的新研究。“任何将算法投入实践并研究其使用方式及其影响都是非凡的,”他说。“并在同行评审的文献中做到这一点——非常值得称赞。”
作为一名急诊室医生,Molander 对人工智能不会代表医护人员做出脓毒症决定这一事实印象深刻。相反,它会标记患者的电子健康记录,以便当医生或护士检查记录时,他们会看到一条注释,指出患者有脓毒症风险,以及列出原因。与某些程序不同,TRWES 的警报系统不会阻止“临床医生在未确认警报的情况下进行任何其他计算机工作”,Molander 解释说。“他们在系统的角落里有一个小提醒,说‘看,这个人因脓毒症而导致失代偿[器官衰竭]的风险更高,这些是我们认为您需要关注的原因。’”这有助于忙碌的医生和护士优先考虑首先检查哪些患者,而不会剥夺他们做出自己决定的能力。“他们可以选择不同意,因为我们不想剥夺提供者的自主权,”Saria 说。“这是一个辅助工具。这不是一个告诉他们该怎么做的工具。”
该试验还收集了有关医生和护士是否愿意使用 TREWS 等警报系统的数据。例如,其 89% 的通知实际上被评估了,而不是像 Molander 描述的其他一些系统那样被自动驳回。医护人员愿意检查该程序可能是因为 TREWS 将脓毒症误报警告通知的高发生率降低了 10 倍,根据 Bayesian Health 的新闻稿,这减少了警报的狂轰滥炸,并使其更容易区分哪些患者真正处于危险之中。“这太令人震惊了,”Molander 说。“这非常重要,因为它使提供者能够提高他们对机器学习的信任。”
建立信任很重要,但收集证据也很重要。如果没有证据证明机器学习系统运行良好,医疗机构不太可能接受它们。“在科技领域,如果人们相信思考过程,他们会更愿意采纳新想法。但在医学领域,您真的需要严格的数据和前瞻性研究来支持可扩展采用的主张,”Saria 说。
“在某种程度上,我们正在构建产品,同时也在构建证据基础和标准,以规范这项工作需要如何进行,以及潜在的采用者需要如何审查我们正在构建的工具,”Sendak 说。任何算法警报系统要实现广泛采用都具有挑战性,因为不同的医院可能使用不同的电子记录软件,或者可能已经有竞争系统到位。许多医院的资源也有限,这使得他们难以评估算法警报工具的有效性——或在这些系统不可避免地需要维修、更新或故障排除时获得技术支持。
尽管如此,Saria 希望使用新的试验数据来扩大 TREWS 的使用范围。她说她正在与多家电子记录公司建立合作伙伴关系,以便将该算法纳入更多医院系统。她还想探索机器学习算法是否可以警告人们在医院可能经历的其他并发症。例如,必须监测一些患者的心脏骤停、大出血和褥疮,这些都可能影响住院期间和之后的健康。
“我们已经对‘正确完成的人工智能’有了很多了解,并且我们已经对此进行了大量发表。但现在表明的是,正确完成的人工智能实际上获得了提供者的采用,”Saria 说。通过将人工智能程序纳入现有的记录系统,在那里它可以成为医护人员工作流程的一部分,“您可以突然开始削减所有这些可预防的危害,以改善结果——这有利于系统、有利于患者,也有利于临床医生。”