本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
本博客是庆祝《大众科学·心灵》创刊十周年而推出的关于技术与大脑的系列客座文章中的第一篇。《大众科学·心灵》杂志十一月/十二月特刊也同样突出了代码与思想之间的联系,以此来描绘未来更数字化的您。
“你知道我的方法,华生。”——夏洛克·福尔摩斯
关于支持科学新闻事业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您将帮助确保未来能够继续创作关于塑造我们当今世界的发现和思想的具有影响力的报道。
即使是对计算机技术只有一般兴趣的人也可能听说过 沃森,这是IBM开发的第三代计算系统,它因在电视智力竞赛节目“Jeopardy!”中击败两位精英选手而声名鹊起。许多人可能不知道的是,这台计算机的能力,包括自然语言处理、假设生成和机器学习,可能会从根本上改变人类与计算机交互的方式,并彻底改变医疗保健的交付方式
在世界各地。在一个突出的例子中,计算机的力量为患者带来了最好的医疗,休斯顿的MD安德森癌症中心的医生正在使用沃森来驱动一个名为肿瘤学专家顾问的软件工具,该工具既可以作为执业临床医生的实时参考手册,也可以作为虚拟专家顾问。最终,它可以在全国各地的医疗中心,甚至在缺乏癌症治疗专业知识的地方,为个体癌症患者提供最佳治疗方案。
沃森:优秀的对话者
沃森与高级搜索引擎(如谷歌),甚至与IBM的另一个系统“深蓝”(第一个击败世界象棋冠军的计算机系统)有何不同?首先,沃森被设计用来回答以自然、会话式语言向其提出的问题。这在医学领域尤为重要,因为相关但经常被忽视的病例记录或数据嵌入在临床医生的报告中。然而,即使在已发表文献和共识指南中通常使用的更严格定义的词汇表中,也可能出现歧义,这限制了第二代计算机为临床医生处理和分析相关数据的能力。这些语言歧义是公认的,以至于已经建立了生物医学本体论等整个研究领域,以帮助阐明给定主题领域内术语的含义和关系。
例如,基因本体论联盟代表着一项宝贵的努力,旨在为遗传学中的大数据带来秩序,规范跨物种和数据库的基因和基因产物属性的表示,并提供受控的术语词汇表。1 本质上,遗传学研究人员的这项合作旨在为不同的术语建立明确的“含义”,因为即使在专家领域内也可能出现歧义。该联盟已经阐明了超过34万个物种的遗传词汇,而这种严格的术语定义对于第二代计算程序的可访问性至关重要。但是,如果我们超越更严格的专家领域,只看“基因”这个词呢?这个看似简单的术语可能有不同的定义:一个基因组数据库可能将基因定义为“可以转录和翻译成蛋白质的DNA片段”,而其他数据库可能将其定义为“具有名称并携带遗传特征或表型的生物学意义的DNA区域”。2 在这个例子中,术语的上下文对于正确的分析至关重要,而正是评估这种上下文的能力使沃森与第二代计算机区分开来。
一台对母亲的担忧“敏感”的计算机
如果严格定义或编码的医学术语的处理对当前的计算系统构成了挑战,那么非结构化临床医生报告的整合则代表了完全不同的难度级别。请考虑以下两位母亲与儿科医生对话的假设记录
“母亲注意到她的儿子非常聪明和敏感,但即使只是进行轻松阅读,也很难集中注意力完成课堂以外的功课。”
“母亲说她的孩子似乎对光敏感,并表示当阳光非常强烈时,他甚至不会到外面去和其他孩子玩,直到太阳快要落山的时候。”
很少有人会难以理解这些笔记,即使它们包含几个相同的词语具有不同但相关的含义(多义词)的例子,包括“敏感”、“聪明”、“外面”、“落山”和“光”。大多数人也不会对“聪明的儿子”和“明亮的太阳”感到困惑,也不会不确定第二句话中的“太阳快要落山”是指“太阳”还是“外面”。许多人甚至可能会在第一句话中感觉到一丝防御性的骄傲,因为这位母亲在表达她的担忧之前,先评论说她的儿子聪明而敏感。然而,对于大多数计算系统来说,这种会话歧义几乎是理解人类意图和意义的不可逾越的障碍。但沃森并非如此。虽然它无法评估母亲谈话中微妙的情感基调,但沃森确实有能力处理自然语言,并且对母亲的预期含义“敏感”。
沃森天才的根源
沃森可以使用与人脑相似的过程来提取自然语言的含义。我们不会随身携带一本巨大的字典,查阅我们听到的每个单词的定义,并一丝不苟地拼凑出给定表达的综合含义。我们也不仅仅依靠一套语法规则来确定含义。事实上,人类经常违反语法、拼写和语义表达的正式规则,但我们仍然非常擅长理解别人想说什么。我们通过推理他们的表达方式的语言学,同时还利用我们共同的历史背景来解决歧义、隐喻和习语。沃森使用类似的技术来确定我们询问的意图。
作为此过程的第一步,沃森会摄取大量的文献——例如已发表的关于乳腺癌治疗的参考文献——这些文献作为关于给定主题领域或领域的信息基础。这些文献可以以各种数字编码格式提供,包括HTML、Microsoft Word或PDF,然后由沃森“整理”——验证该语料库中包含的信息的相关性和正确性,并剔除任何具有误导性或不正确的信息。例如,一位受人尊敬的研究人员关于乳腺癌的临床讲座对于评估手术策略非常有价值,除非它是在1870年发表在《英国医学杂志》上的,并且指出乳房切除术是最有希望的选择。3 一个世纪后,乳腺癌专家的共识声明将与评估非手术治疗方案相关,除非它是在20世纪90年代末引入关键单克隆抗体(如赫赛汀和利妥昔单抗)之前发表的。沃森的工作是将这些已发表的建议置于适当的上下文中。
摄取过程还准备了内容,以便在系统中更有效地使用。一旦内容被摄取,就可以训练沃森识别该领域的语言模式,然后认知系统通过在问题和从信息语料库中产生的候选答案之间进行推断,来针对该内容回答问题。沃森使用许多不同的算法来检测这些推断。例如,如果问题暗示了任何关于时间范围的信息,沃森的算法将评估候选答案是否与该时间范围相关。同样,如果问题暗示了任何关于位置的信息,算法将评估相对于该位置的候选答案。它还会考虑问题和潜在答案来源的上下文。它评估问题要求的答案类型(称为词汇答案类型),以确保候选答案可以满足它。对于已知的主题、条件从句、同义词、时态等也是如此。
沃森对每个特征进行评分,以指示在问题和候选答案之间可以找到推断的程度。然后,一种机器学习技术使用所有这些分数来决定特征的组合在多大程度上支持该领域内的答案。4 沃森本质上是经过训练来识别相关语言推断模式的。这种训练体现在其对候选答案的置信度评分中。沃森也可以根据需要进行重新训练,以反映领域语言模式的变化。
系统按置信度级别对候选答案进行排序,如果置信度级别超过指定的最低阈值,则提供答案。这与经典人工智能 (AI) 技术截然不同,因为经典人工智能技术的含义是从实际语言模式中推导出来的,而不是仅仅依赖于基于受固定关系约束的受控词汇表的规则。结果是一个系统,其性能水平比经典人工智能系统高得多。
改善癌症护理
前沿的癌症疗法吸引了头条新闻,人们不得不惊叹于过去十年肿瘤学研究取得的进展。不幸的是,只有相对较少的患者能够在MD安德森等专业癌症中心获得先进的治疗方案。大多数人接受的癌症护理效果远不如前者,甚至根本没有护理。此外,即使是最专注的专家也无法跟上不断扩大的医学文献的步伐。为了填补这些医疗保健缺口,MD安德森的医生和计算机科学家开发了MD安德森肿瘤学专家顾问(TM)认知临床决策支持系统 (OEA(TM)),该系统的实现得到了Jynwel慈善基金会向MD安德森“登月计划”捐赠5000万美元的支持。OEA(TM) 将MD安德森医生的临床专业知识和经验与临床试验的结果以及医学专家的已发表研究和共识指南相结合,从而为个体患者提出最佳治疗方案。
具体而言,沃森首先摄取然后分析患者护理的全面摘要,这些摘要涵盖一段时间内以及各种实践,包括症状、诊断、实验室和影像学检查以及治疗史。这些信息被输入到软件中,该软件将该患者与其他患者进行比较,并将人群划分为根据其对个体治疗的最可能反应定义的群体。然后,沃森捕获和分析标准护理实践、该领域临床医生的专业知识、队列研究(比较不同患者人群随时间推移以评估给定疾病的风险因素)以及临床文献中的证据,以评估和排序临床医生要考虑的各种治疗方案。它将这些数据与患者当前和以前的病情进行匹配,并揭示患者的最佳治疗方法。医生可以查看沃森治疗建议的所有基础数据,从而让他们判断数据的临床相关性并做出自己的治疗决策。换句话说,沃森不会规定治疗方案,而是为医生提供他们为每位患者量身定制治疗方案所需的工具。“肿瘤学专家顾问(TM)”目前正在MD安德森进行白血病治疗的试点研究,预计将扩展到其他癌症以及糖尿病等慢性病。
将大型计算系统视为“人性化”医疗保健的一种手段似乎有悖常理,但通过其理解大量数据的能力,“肿瘤学专家顾问(TM)”代表着朝着真正个性化医疗迈出的重要一步。它不仅将使少数能够负担得起精英护理或居住在三级护理中心车程范围内的人受益。我们相信,沃森最终将为世界各地的患者带来高质量、循证医学,而无论其经济或地域限制如何。医疗保健的这种民主化可能被证明是沃森最持久的贡献。
参考文献
1. www.geneontology.org
2. Gangemi A, Pisanelli DM, Steve G. 理解多义医学术语中的系统概念结构。Proc AMIA Symp. 2000:285-9。
3. Savoy WS. 关于乳腺癌切除术治疗的临床讲座。Br Med J. 1870 Mar 12;1(480):255-6。
4. Ferrucci DA. “这就是沃森”导言。《IBM研究与开发杂志》。第54卷,第3.4期,2012年5月-6月:1-15。
>>系列下一篇:“心灵的哈勃望远镜”