美国急诊室的平均等待时间超过两个小时,这使得临床医生和患者都感受到系统负担过重的痛苦。许多父母都经历过带着焦躁不安的孩子等待数小时,由于不紧急而被分流,最终却因为普通的病毒感染而被送回家,还服用了不必要的抗生素。
考虑到去急诊室和紧急护理中心花费的金钱和时间,重新回到老式的医生上门问诊的方式具有很强的吸引力。如果上门问诊的是一台智能机器呢?人工智能系统已经擅长识别医学影像中的模式以辅助诊断。2月11日发表在《自然医学》上的新研究结果显示,类似的训练可以用于从儿童病历中的原始数据中得出诊断。
在这项中国南方广州市妇女儿童医疗中心的研究中,一个医生团队将数千份健康记录中的信息提炼成与不同诊断相关的关键词。然后,研究人员将这些关键词教给人工智能系统,使其能够检测真实病历中的术语。经过训练后,该系统梳理了567,498名儿童的电子健康记录(EHR),解析了现实世界中医生的笔记并突出了重要信息。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将有助于确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。
它从55个类别中由宽泛到具体地进行诊断。那么这个机器人医生做得如何?“我认为它相当不错,”杜克大学医学中心放射学副教授穆斯塔法·巴希尔说,他没有参与这项工作。“从概念上讲,它不是那么原创,但数据集的大小和成功执行很重要。” 巴希尔说,数据处理遵循典型的步骤,即获取“庞大的混乱数据集”,将其通过算法,并从混乱中产生秩序。从这个意义上说,他说这项工作不是特别新颖,但“也就是说,他们的系统似乎表现良好。”
医学既是一门艺术,也是一门科学。怀疑论者可能会争辩说,一台处理了大量患者数据的计算机无法提供全科医生从远处诊断人类所做的那种定性判断。不过,在这种情况下,在机器训练开始之前,已经投入了大量的人力专业知识。“这是一个我们大约四年前启动的大型项目,”加州大学圣地亚哥分校眼科教授、眼科遗传学主任,研究作者张康说。他和他的同事首先组成一个医生团队,审查了6,183份病历,以收集标记疾病相关症状或体征(例如“发烧”)的关键词。然后,人工智能系统对这些关键词及其与55个国际上使用的特定疾病诊断代码(例如急性鼻窦感染)的关联进行了训练。在解析图表以查找相关术语时,该系统逐步执行特定短语的“存在/不存在”选项,以得出最终的诊断决定。
为了检查系统的准确性,张和他的同事还采用了老式的“技术”——人类诊断医师。他们将机器的结论与原始记录中的结论进行了比较,并且他们还让另一组临床医生使用与人工智能系统相同的数据进行诊断。
该机器获得了良好的评分,大约 90% 的时间与人类的诊断一致。它在识别神经精神疾病和上呼吸道疾病方面尤其有效。对于最常见的急性上呼吸道感染,该人工智能系统在 95% 的时间里都做出了正确诊断。95% 是否足够好?张说,下一个需要研究的问题之一是该系统是否会遗漏一些严重的问题。他说,基准应该是高级医生的表现,他们也不是 100% 正确。
人类临床医生将作为人工智能系统的质量控制备份。实际上,人和机器可能会遵循类似的步骤。就像医生一样,机器从一个广泛的类别(如“呼吸系统”)开始,从上到下进行工作以得出诊断结果。“它模仿了人类医生的决策过程,”韦恩州立大学计算机科学副教授朱东晓说,他没有参与这项研究。
但朱认为这是“增强智能”而不是“人工智能”,因为该系统仅处理了 55 个诊断选项,而不是现实世界中的数千种可能性。他说,该机器还不能深入研究诊断的更复杂方面,例如伴随状况或疾病阶段。该系统在中国环境之外的翻译效果如何尚不清楚。巴希尔说,尽管在任何地方将人工智能应用于患者信息都很困难,但这些作者已经证明这是可以实现的。
此外,朱还表达了更多的怀疑。他说,在电子病历中从文本注释中提取诊断关键词在英语等语言中将与中文“截然不同”。他还指出,仅进行 55 种诊断需要付出大量努力,包括 20 名儿科医生花费人力对 11,926 份记录进行评分,以将其结论与机器的诊断进行比较。考虑到整个过程花费了四年时间,父母们可能还需要等待很长时间,才能让计算机化的临床医生让他们免去前往急诊室的麻烦。