IBM 曾大力宣传其沃森超级计算机为癌症治疗领域的革命。但事实远非如此

在 IBM 开始销售 Watson for Oncology,旨在向医生推荐癌症治疗方案三年后,它未能达到 IBM 为其设定的崇高期望

即使对于一家历史悠久的美国公司来说,这也是一项大胆的尝试:IBM 希望凭借一台机器,解决人类最棘手的疾病并彻底革新医学。

IBM 不遗余力地推广其标志性品牌——沃森——试图抓住世界的想象力,并迅速将目标锁定在一个备受瞩目的领域:癌症。

但在 IBM 开始销售沃森,旨在向全球医生推荐最佳癌症治疗方案三年后,STAT 的一项调查发现,这台超级计算机并未达到 IBM 为其设定的崇高期望。它仍在努力学习不同形式的癌症的基本步骤。只有少数几十家医院采用了该系统,这与 IBM 在数十亿美元市场中确立主导地位的目标相去甚远。而在国外医院,医生们抱怨说,它的建议偏向于美国患者和治疗方法。


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将有助于确保未来能够继续刊登关于塑造我们当今世界的发现和想法的具有影响力的报道。


STAT 调查了沃森肿瘤学的应用、营销和在世界各地医院(从韩国到斯洛伐克再到南佛罗里达州)的性能。记者采访了数十名医生、IBM 高管、人工智能专家以及其他熟悉该系统底层技术和推广情况的人士。

访谈表明,IBM 为了提振不断下滑的收入,匆忙推出了一款产品,但并未充分评估在全球医院部署该产品所面临的挑战。虽然 IBM 大力宣传 沃森用于癌症治疗,但 IBM 尚未发表任何科学论文来证明该技术对医生和患者的影响。因此,它的缺陷正在医疗一线被医生和研究人员揭露,他们表示,该系统在某些方面前景广阔,但仍未得到充分开发。

“沃森肿瘤学仍处于蹒跚学步的阶段,我们必须等待并积极参与,希望能帮助它健康成长,”韩国癌症专家姜泰佑医生(Dr. Taewoo Kang)说,他曾使用过该产品。

沃森肿瘤学的核心在于使用基于云的超级计算机来消化海量数据——从医生笔记到医学研究再到临床指南。但其治疗建议并非基于其自身从这些数据中获得的洞见。相反,它们完全基于人类监督员的培训,这些监督员费力地向沃森输入关于具有特定特征的患者应如何治疗的信息。

IBM 高管承认,沃森肿瘤学 已经开发了近六年,仍处于起步阶段。但他们表示,它正在迅速改进,并指出到年底,该系统将为占全球病例 80% 的 12 种癌症提供治疗指导。他们表示,这节省了医生的时间,并确保患者获得高质量的护理。

“我们看到有患者说,‘它给了我安心感’,”沃森健康总经理黛博拉·迪桑佐(Deborah DiSanzo)说。“这让我们感到非常欣慰,我们所做的事情将为患者及其医生带来改变。”

但与 IBM 将沃森描绘成数字神童相反,这台超级计算机的能力是有限的。

也许最令人震惊的夸大之处在于该公司声称沃森肿瘤学可以通过人工智能筛选大量数据来产生新的见解,并识别出,正如一位 IBM 销售代表所说的那样,“甚至是癌症治疗的新方法”。STAT 发现,该系统不会创造新知识,并且仅在最基本的意义上是人工智能。

虽然沃森通过赢得电视智力竞赛节目《危险边缘!》而家喻户晓,但它的程序设计类似于另一种游戏机:机械土耳其人,一种 18 世纪的国际象棋机器人,它曾让观众眼花缭乱,但却隐藏着一个秘密——一个躲藏在里面的操作员。

就沃森肿瘤学而言,那些人类操作员是美国一家医院——纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)——的几十名医生,尽管这家医院备受尊敬。那里的医生有权将自己的建议输入沃森,即使支持这些建议的证据很薄弱。

公众甚至一些使用沃森肿瘤学的医院,对该系统的实际能力并不了解。数据工程师和医生花费了近六年时间进行艰苦的工作,才训练沃森掌握了仅七种癌症的知识,并使该系统与最新的知识保持同步。

“更新一直很困难,我实话实说,”纪念斯隆-凯特琳的首席沃森培训师马克·克里斯医生(Dr. Mark Kris)说。他指出,在一次癌症会议的研究报告展示之后,全球每位转移性肺癌患者的治疗指南最近在一周内发生了变化。“改变认知计算系统并不能像那样立即转变,”他说。“你必须输入文献,你必须输入病例。”

沃森的诞生源于 IBM 将自身从一家老牌硬件公司转型为一家在云端和人工智能前沿领域运营的公司的努力。尽管沃森被应用于银行业到制造业等一系列行业,但它未能结束 IBM 连续 21 个季度收入下滑的颓势。在最近一个季度,IBM 的认知解决方案部门(以沃森为核心,本应是其业务的未来)的收入甚至较去年同期有所下滑。

针对 STAT 的问题,IBM 表示,沃森在医疗保健和其他领域仍然处于上升轨道,“并且已经是其 200 亿美元分析业务的重要组成部分”。医疗保健是沃森企业的重要组成部分。IBM 在其沃森健康部门雇用了 7,000 名员工,并将该行业视为未来几年 2000 亿美元的市场。该公司认为,只有金融服务业的市场机遇更大,达到 3000 亿美元。

在这台超级计算机的性能中,利害攸关的不仅仅是一家著名全球公司的命运。在医学领域,沃森也是某种数字金丝雀——利用人工智能来确定预防和治疗疾病的最佳方法的、最引人注目的尝试。IBM 高管表示,该系统更大的目标是普及医疗知识,使每位患者,无论其地理位置或收入水平如何,都能够获得最佳的医疗护理。

但在癌症治疗领域,对乌托邦式理想的追求已经动摇。

STAT 的调查重点是沃森肿瘤学,因为该产品在临床护理方面进展最快,尽管沃森也销售单独的软件包来分析基因组信息并将患者与临床试验相匹配。它还在将沃森应用于其他任务,包括磨练 预防医学实践 和阅读 医学影像

各医院对沃森肿瘤学的依赖程度各不相同。专家较少的机构更依赖其建议,而其他机构则将该系统降级为后台角色,就像一位主要技能是研究现有知识的律师助理。

医院为沃森肿瘤学和超级计算机支持的其他产品支付每位患者的费用。根据迪桑佐的说法,费用金额取决于医院购买的产品数量,每位患者的费用在 200 美元到 1,000 美元之间。该系统有时附带咨询费用,并且与电子病历系统连接的成本很高。在没有将其与医疗记录连接的医院,必须花费更多时间输入患者信息。

在佛罗里达州的朱庇特医疗中心(Jupiter Medical Center),这项任务落在了护士珍·汤普森(Jean Thompson)身上,她每周花费大约 90 分钟向机器输入数据。一旦她完成这项工作,她就会点击“询问沃森”按钮,以获得超级计算机为患者提供的治疗建议。

在最近的一个上午,一位 73 岁的肺癌患者的检查结果令人失望:沃森推荐了一种化疗方案,而肿瘤学家们已经标记了这种方案。

“还不错,”肿瘤内科医生苏贾尔·沙阿医生(Dr. Sujal Shah)在与同事讨论病例时评价沃森的治疗建议。

他后来表示,沃森提供的背景信息(包括医学期刊文章)很有帮助,让他更有信心使用特定的化疗方案是明智的。但该系统并没有直接帮助他做出决定,也没有告诉他任何他不知道的事情。

朱庇特是美国仅有的两家采用沃森肿瘤学的医院之一。该系统在印度和东南亚产生了更多业务。这些国家的许多医生表示,沃森正在节省时间,并帮助更多患者获得高质量的医疗护理。但他们也表示,由于医疗实践和经济环境的差异,其准确性和整体价值受到限制。

尽管 IBM 进行了铺天盖地的营销宣传,多年来推出了由塞雷娜·威廉姆斯(Serena Williams)、鲍勃·迪伦(Bob Dylan)和乔恩·哈姆(Jon Hamm)等名人代言的沃森商业广告,但该公司高管并非总是赞不绝口。在接受 STAT 采访时,他们承认该系统面临挑战,需要更好地与电子病历系统集成,并需要更多真实患者的数据来寻找模式并提出前沿治疗方案。

“随着沃森变得更智能,目标是让它以更自动化的方式提出一些建议,以便在有希望的治疗方案出现时,能够提示‘现在可能是时候了,让我们拨动开关’,”前 IBM 卫生部门副主管安德鲁·诺登医生(Dr. Andrew Norden)说,他于 8 月初离开了公司。“正如我所描述的那样,你可能会感觉到这真的很难且细致入微。”

这种细致入微之处在 IBM 为推销沃森而精心构建的叙事中是缺失的。

正是出于设计,目前还没有一项独立的第三方研究来检验沃森肿瘤学是否能够实现其承诺。IBM 尚未将该产品提交给外部科学家进行批判性审查,也未进行临床试验来评估其有效性。

公司在早期避免外部审查并非闻所未闻,但 IBM 的情况不同寻常,因为沃森肿瘤学并非处于开发阶段——它已经在世界各地部署。

韩国风险投资家和研究人员崔允燮(Yoon Sup Choi)撰写了一本关于人工智能在医疗保健领域应用的书,他表示,监管机构并未要求 IBM 在韩国或美国销售该系统之前进行临床试验。而且,鉴于医院已经在使用该系统,临床试验不太可能改善业务前景。

“风险太大了,对吧?”崔允燮说。“如果临床试验的结果不太好——[如果]沃森带来的临床益处微乎其微——这对整个 IBM 来说都是非常糟糕的消息。”

威斯康星大学法学院的法律和生物伦理学教授皮拉尔·奥索里奥(Pilar Ossorio)表示,沃森应该受到更严格的监管,因为它在治疗患者方面发挥着作用。“从伦理角度和科学角度来看,你应该在这样做之前证明其安全性和有效性,”她说。

诺登驳斥了 IBM 应该在商业化沃森之前进行临床试验的说法,他指出,医学领域的许多实践都被广泛接受,即使它们没有随机对照试验的支持。

“有没有人对跳伞运动员的降落伞进行过随机试验?”诺登问道。“答案当然是没有,因为存在非常强烈的直觉价值主张。……所以我相信,将最佳信息用于医疗决策是无需动脑筋的事情。”

IBM 在其声明中表示,它已与研究界合作,并在行业会议和同行评审期刊上展示了关于沃森的数据。一些医生表示,他们不需要看到更多研究就知道该系统很有价值。“人工智能将在未来的所有医学领域得到采用,”韩国嘉泉大学吉尔医疗中心(Gachon University Gil Medical Center)沃森项目负责人李恩医生(Dr. Uhn Lee)说。“如果这种趋势、这种变化是不可避免的,那么我们为什么不早点开始呢?”

到目前为止,关于沃森肿瘤学的研究仅为会议摘要。完整的研究结果尚未在同行评审期刊上发表——而且每一项研究(除了一项)要么是由付费客户进行的,要么作者名单中包含 IBM 员工,或者两者兼而有之。大多数研究都宣扬积极的结果,表明沃森节省了医生的时间,并且与他们的治疗建议具有很高的符合率。

“符合率”研究构成了关于沃森肿瘤学的大部分公开研究。医生会要求沃森就大量患者的治疗提出建议,然后将其建议与肿瘤学家的建议进行比较。在丹麦一项未发表的研究中,一致率约为 33%——因此该医院决定不购买该系统。在其他国家,某些癌症的一致率可能高达 96%。但表明沃森与医生意见一致,只证明了它在应用现有治疗方法方面是 competent 的,而不是它可以改进它们。

IBM 高管表示,他们正在进行研究,以检验对医生和患者的影响,但迄今为止尚未完成任何研究。

关于沃森的质疑已经开始进入公众视野,包括最近一篇 Gizmodo 的报道,标题为“为什么每个人都讨厌 IBM 沃森——包括那些帮助它诞生的人”。最突出的失败发生在去年 2 月,当时德克萨斯大学 MD 安德森癌症中心(MD Anderson Cancer Center)取消了与沃森的合作关系。

MD 安德森联盟基本上是沃森在医疗保健领域的 早期面孔。这家休斯顿医院是 IBM 最早的合作伙伴之一,它正在使用该系统创建自己的专家肿瘤学顾问,类似于 IBM 与纪念斯隆-凯特琳癌症中心合作开发的顾问。但该项目因内部指控超支、延误和管理不善而解体。总而言之,MD 安德森花费了三年多的时间和 6000 万美元——其中大部分用于外部顾问——最终搁置了这项工作。

该医院拒绝回答问题。但项目负责人琳达·秦医生(Dr. Lynda Chin)在她就此事接受的首次媒体采访中,向 STAT 讲述了她面临的挑战。秦医生在项目崩溃前离开了 MD 安德森;随后的审计指出,在她领导下存在多项违反采购规定的行为。

秦医生表示,沃森是一项强大的技术,但将其应用于医疗保健领域极其困难。她和她的团队遇到了许多障碍,其中一些障碍 IBM 尚未在 MD 安德森或其他地方完全解决。

这家癌症医院面临的第一个主要挑战是让机器处理医疗记录的特殊性:首字母缩略词、人为错误、速记短语和不同的书写风格。“教会机器阅读记录比任何人想象的都要困难得多,”她说。她的团队花费了无数小时来解决这个问题,试图让沃森从医疗记录中提取有价值的信息,以便将其应用于其建议。

秦医生表示,她的团队还在临床实践中部署该系统方面遇到了困难。沃森,即使在医生的指导下,也已经非常接近于让机器帮助决定向人类提供的治疗方案。这带来了一些棘手的问题,例如如何测试数字治疗顾问的安全性,如何确保其符合法规,以及如何将其纳入医生和护士的日常工作。

“重要的是,”秦医生说。“我们如何创建一个能够确保医学中最重要原则的环境:不伤害?”

最后,该项目遇到了一个更大的障碍:即使你能让沃森理解患者变量并提出 competent 的治疗建议,你如何让它访问足够多的、来自足够多不同来源的患者数据,从而获得可以显著提高护理标准的见解?

秦医生表示,这是一个决定性因素。沃森没有一个由机构组成的互联网络来提供关于特定患者群组的数据。“你可能有 10,000 名肺癌患者。但当你仔细思考时,这个数字仍然不是很大,”她说。

秦医生说,如果拥有更多患者的数据,你就可以看到模式——“对某种疗法有反应的[患者]亚群,没有反应的亚群,具有某种毒性的亚群。这种模式将有助于更好地实现个性化和精准医疗。但如果我们实际上无法找到一种方法来聚合它们,我们就无法实现这一目标。”

IBM 告诉 STAT,秦医生的工作与创建沃森肿瘤学的努力是分开的,沃森肿瘤学在部署之前已获得纪念斯隆-凯特琳癌症中心的癌症专家的验证。该公司表示,沃森肿瘤学可以从患者记录中提取和总结大量文本,但这些信息必须经过临床医生的验证,并且该公司在获取更多数据以提高沃森的性能方面取得了重大进展。该公司提到了与医疗保健出版商爱思唯尔(Elsevier)和分析公司 Doctor Evidence 的合作关系。

迄今为止,五大洲的 50 多家医院已与 IBM 或中介技术公司达成协议,使用沃森肿瘤学来治疗患者,其他医院也在使用基因组学和临床试验产品。

但与纪念斯隆-凯特琳癌症中心的合作,以及由此产生的产品的推广,导致了一些复杂情况,IBM 通过仔细措辞的声明和具有误导性的营销手段掩盖了这些情况。

在其新闻稿中,IBM 赞扬 纪念斯隆-凯特琳癌症中心作为沃森的唯一培训者的角色。毕竟,谁比世界上最著名的癌症医院之一的医生更适合教育该系统呢?

但几位医生表示,纪念斯隆-凯特琳癌症中心的培训将偏见注入了该系统,因为其输入沃森的治疗建议并不总是符合世界各地其他医生的实践。

在相同的临床情况下,医生可能会——而且经常会——对最佳治疗方案、是建议手术还是化疗,还是另一种治疗方式存在分歧。对于初始治疗失败后给予的二线和三线治疗,这些差异尤其大,因为这些治疗的益处证据较少,共识也更难达成。

IBM 高管在营销材料和采访中,并没有承认这种困境,而是试图淡化它。在接受 STAT 采访时,沃森健康主管迪桑佐驳斥了纪念斯隆-凯特琳癌症中心的参与会造成任何偏见的观点。

“我们拥有的海量数据消除了偏见,”她说,她指的是输入沃森的患者病例以及数百万篇文章和研究。

但这误解了沃森肿瘤学的工作原理。(IBM 后来声称迪桑佐指的是一般的沃森。)

该系统本质上是纪念斯隆-凯特琳癌症中心的便携式版本。其治疗建议完全基于医生的培训,这些医生决定沃森需要哪些信息来制定其指导,以及这些建议应该是什么。

当用户向沃森寻求建议时,该系统还会搜索已发表的文献——其中一些文献由纪念斯隆-凯特琳癌症中心策划——以提供相关的研究和背景信息来支持其建议。但该建议本身来源于医院医生的培训,而不是外部文献。

纪念斯隆-凯特琳癌症中心的医生承认他们对沃森的影响。“我们毫不犹豫地插入我们的偏见,因为我认为我们的偏见是基于最接近前瞻性随机试验的东西,那就是拥有大量的经验,”该医院沃森首席培训师之一安德鲁·赛德曼医生(Dr. Andrew Seidman)说。“所以这是一种非常直言不讳的偏见。”

赛德曼医生表示,当证据存在时,医院会小心地将其培训建立在临床证据的基础上,但当证据不存在时,他们会毫不犹豫地给出建议。“我们希望癌症治疗能够普及化,”他说。“我们不希望那些没有数千名患者经验的医生在治疗更罕见的癌症时处于不利地位。我们希望分享这种知识库。”

在曼哈顿上东区最近一次沃森培训会议上,编程该系统所涉及的紧张关系展露无遗。STAT 旁听了纪念斯隆-凯特琳癌症中心的医生(由赛德曼医生领导)与 IBM 工程师聚集在一起培训沃森治疗膀胱癌的过程。五名 IBM 工程师坐在桌子的一侧。坐在他们对面的是三位肿瘤学家——一位专攻外科手术,一位专攻放射治疗,还有一位专攻化疗和靶向药物。

讨论开始几分钟后,一个问题出现了:对于那些癌症在六个疗程的化疗后仍然持续存在的患者,应该推荐哪种治疗方法?在这种情况下,可供选择的方案往往与支持它们的证据一样少。沃森应该建议进行根治性手术切除膀胱吗?外科肿瘤学家蒂姆·多纳休医生(Dr. Tim Donahue)指出,根据他的经验,这种手术很少能治愈患者,而且与提高生存率无关。

那么,另一种化疗方案联合放疗呢?

当沃森给出建议时,它会将最佳建议用绿色标出,替代方案用橙色标出,不推荐的方案用红色标出。

但在某些临床情况下,很难区分这些颜色。

“这是整个游戏中最难的部分,”放射肿瘤学家玛丽莎·科尔迈尔医生(Dr. Marisa Kollmeier)在培训期间说。“缺乏证据。而且你不知道在没有证据的情况下,某些东西是否应该用绿色标出。我们没有随机试验来支持每一个决定。”

但摆在他们面前的任务要求医生们继续前进。他们确实这样做了,仔细研究了一系列临床情况。在某些情况下,大量的证据支持他们的答案。但许多其他情况都属于灰色地带,或者被患者偏好的不可避免的不确定性所笼罩。

这次会议是长达数月的过程中众多会议之一,目的是让沃森在膀胱癌方面达到最新水平。随后的会议将涉及向沃森输入纪念斯隆-凯特琳癌症中心的真实患者病例数据,以便医生可以通过重复来加强沃森的培训。

这种培训并没有教会沃森将其建议建立在这些患者的结局之上,无论是他们存活、死亡还是比相似患者活得更久。相反,沃森的建议是基于纪念斯隆-凯特琳癌症中心医生的治疗偏好。

在一些使用沃森的机构,IBM 对该癌症中心角色的不明确导致了混乱。有些人似乎认为他们正在获得来自世界各地医生的建议。

“正如我们告诉患者的那样,这就像另一次咨询,但这是一次全球咨询,”朱庇特医疗中心胸腔肿瘤科医疗主任 K·亚当·李医生(Dr. K. Adam Lee)在 STAT 6 月份访问时说。

“真的是全球性的,”该医院的肿瘤科护士克里·沃德(Kerri Ward)补充道。“它从 300 种期刊中提取信息,仅肿瘤学就有 300 种期刊、临床数据库、国家临床数据库、期刊、教科书,然后斯隆-凯特琳是目前正在输入临床[信息]的机构。”

哈肯萨克经络健康(Hackensack Meridian Health)首席执行官罗伯特·加勒特(Robert Garrett)表示,该集团正在使用沃森肿瘤学的一个版本,沃森中的信息是“全球性的”。

“如果你是一名结肠癌患者,据我所知,他们的数据库中记录了全球各地临床医生如何治疗结肠癌,以及在结肠癌的不同阶段,哪种治疗方法最有效,”加勒特说。“这就是 IBM 沃森带来的价值。”

以上说法均未准确描述沃森肿瘤学的工作原理。

几位在其他国家检查过沃森的医生告诉 STAT,纪念斯隆-凯特琳癌症中心的角色让他们感到担忧。丹麦和荷兰的研究人员表示,他们国家的医院没有与沃森签约,因为它过于关注少数美国医生的偏好。

荷兰阿姆斯特丹大学医学中心(Academic Medical Center)的流行病学家和副教授马丁·范·奥伊恩(Martijn van Oijen)表示,纪念斯隆-凯特琳癌症中心聚集了顶尖专家,但它并没有垄断癌症专业知识。“糟糕的是,这是一家以美国为基地的医院,其方法与其他一些国家的医院不同,”范·奥伊恩说,他参与了一项评估沃森等技术的国家倡议,并且坚信使用人工智能来帮助癌症医生。

在丹麦,一家医院的肿瘤学家表示,在发现当地医生仅在约 33% 的病例中同意沃森的意见后,他们已完全放弃该项目。

“我们曾与 [IBM] 进行过讨论,他们对国际文献的看法非常有限,基本上是将过多的重点放在美国研究上,而对大型国际、欧洲和世界其他地区的研究关注不足,”哥本哈根 Rigshospitalet 中心主任莱夫·延森医生(Dr. Leif Jensen)说,该中心设有肿瘤科。

在医生在美国接受培训的国家,或者他们使用与纪念斯隆-凯特琳癌症中心医生类似的治疗指南的国家,沃森肿瘤学可能会有所帮助。台北医学大学台北癌症中心副院长邱仲峰医生(Dr. Jeng-Fong Chiou)表示,台湾使用的指南与美国人相同,因此沃森的建议在那里将很有用,该中心于 7 月开始对患者使用沃森肿瘤学。

但他也表示,美国患者和台湾患者之间存在差异——他的患者通常接受较低剂量的药物以最大限度地减少副作用——他的肿瘤学家将不得不根据沃森的建议进行调整。

纪念斯隆-凯特琳癌症中心治疗的通常是富裕人群,这并不能反映世界各地人民的多样性。威斯康星大学法学院教授奥索里奥指出,因此,用于训练沃森的病例没有考虑到较贫穷国家患者面临的经济和社会问题。

“它将要学习的是种族、性别和阶级偏见,”她说。“我们正在将这些社会分层融入其中,并且我们正在使这些偏见变得更加不明显,甚至更难被人识别。”

有时,沃森给出的建议与医生们的意见大相径庭,而原因与科学无关,例如医疗保险。在2017年韩国全球乳腺癌大会上展示的一张海报中,研究人员报告称,沃森最常为乳腺癌患者推荐的治疗方案根本不在国家医保系统的覆盖范围内。

IBM 表示,他们已经召集了一个国际顾问小组,以收集关于沃森表现的反馈。他们还表示,该系统可以进行定制,以反映治疗实践的差异、药物可及性和财务因素的考量。此外,公司最近还推出了工具,以减少沃森调整所需的时间和成本。

在回复 STAT 的提问时,纪念斯隆-凯特琳癌症中心表示,国际期刊是他们提供给沃森的文献资料的一部分,其中包括《柳叶刀》、《欧洲癌症杂志》、《肿瘤学年鉴》和《英国医学杂志》。“正如我们在所有癌症研究领域所做的那样,我们将继续观察和研究沃森肿瘤学系统如何在国际上影响医疗护理,遵循循证医学的原则,并与 IBM 合作优化该系统,”该医院表示。

一些国外的医院正在根据当地患者的情况定制该系统,添加有关本地治疗方案的信息。泰国康民国际医院沃森肿瘤学项目的负责人 Nan Chen 表示,他的肿瘤科医生在治疗胃癌时,使用的是日本的指南,而不是美国的指南。

但他表示,医生们可能会觉得这种本地化是多余的或不必要的:他们对被告知那些他们刚刚教给沃森的指导意见并不感兴趣。

“我们的医生说,这种疗法是我们自己医院的疗法,我们很清楚,” Chen 说。“你们不需要再把这些疗法输入到沃森中,然后让沃森来告诉我们,我们医院正在使用什么样的疗法。”

然而,Chen 表示,这种改进后的系统非常有用,尤其对于蒙古首都一家没有聘请任何肿瘤专家的医院而言。

在 UB Songdo 医院(Chen 的公司是该医院的大股东),医生们几乎 100% 采纳沃森的建议。原本可能由几乎没有或根本没有接受过癌症培训的全科医生治疗的患者,现在能够从顶级的专业知识中获益。

“这正是 IBM 梦寐以求的应用场景,” Chen 说道。

在韩国,釜山国立大学医院的乳腺癌外科肿瘤专家姜泰宇医生指出,沃森还需要解决另一个重要问题。目前,它会为其提出的建议提供支持性证据,但实际上并没有解释清楚它是如何为特定的患者推荐特定的治疗方案的。

姜医生说,有时他会就一位癌细胞尚未扩散到淋巴结的患者向沃森寻求建议,而沃森却会推荐一种名为紫杉烷的化疗药物。但他表示,这种疗法通常只在癌细胞已经扩散到淋巴结时才会使用。而且,为了支持这项建议,沃森还会展示一项研究,这项研究证明了紫杉烷对于癌细胞已扩散到淋巴结的患者的有效性。

姜医生对此感到困惑,不明白沃森为何会推荐一种他通常不会用于像他眼前这位患者的药物。而且沃森也无法解释原因。

尽管存在种种担忧,但世界各地一些使用沃森的医生坚持认为,人工智能终将彻底变革医疗保健行业。他们表示,临床医生正在意识到切实的益处——节省医生们宝贵的文献检索时间,更好地教育患者,并削弱诊所中可能妨碍循证治疗的等级制度。

在台湾,邱医师表示,沃森能够立即提供关于某种疗法的“最佳数据”,例如生存率,从而使医生们不必再费力检索文献来比较各种可能的治疗方案。

李医生(在韩国吉尔医疗中心 负责沃森项目的医生)表示,沃森的信息也增强了患者的自主权。以前,医生只是口头向患者解释不同的治疗方案。现在,医生可以给患者提供由沃森准备的综合资料包,其中包括潜在的治疗计划以及相关的科学文章。患者可以自行研究这些疗法,甚至可能在正确的治疗方案上与医生意见相左。

“这是最重要和意义深远的改变之一,” 李医生说。

沃森还让资深医生对数据负责。在吉尔医疗中心,患者会与五位医生以及沃森本身(界面显示在所谓的“沃森中心”的平板电视上)同处一室。李医生表示,沃森的存在对医生的决策过程产生了巨大影响,削平了传统上资深医生的意见优先于年轻同事的等级制度。

沃森为年轻医生提供了快速便捷地获取数据的途径,这些数据可能证明资深医生的观点是错误的,屏幕上会显示生存率等信息,与推荐的治疗方案并列。李医生说,在这种证据面前,资深医生如果继续坚持推行不同的治疗方案,将会很丢脸。

在印度的马尼帕尔医院,S.P. Somashekhar 医生表示,虽然沃森对直肠癌和乳腺癌患者的建议存在一些地区差异,但这些病例只是少数例外:对于绝大多数患者,该程序的建议与医院肿瘤委员会(一个由 20 名医生组成的团队,他们通常会研究病例一周,并花费一小时进行讨论)给出的建议相符。

这意味着沃森在短短几秒钟内完成了 20 位医生花费一周时间才能完成的工作。“这非常宝贵,价值极高,” Somashekhar 医生说。“我们的医生不可能讨论每一个病例。对于我们在肿瘤委员会讨论的每一个病例,还有五个病例我们无法讨论。”

虽然这些益处意义重大,但它们仍未达到能够预测或根除疾病的突破性发现的程度。

IBM 的高管表示,这并不意味着沃森无法实现这些壮举。Norden(沃森肿瘤学和基因组学的前任副健康官)表示,最终目标是将临床试验数据和真实世界的患者数据汇集在一起,以便沃森能够开始自行找出最佳治疗方案。

“我个人认为,随着时间的推移,我们将更擅长衡量和报告结果,这些数据的影响力也将越来越大,” 他说。“就目前的癌症治疗水平而言,我认为任何计算系统都还没有准备好在没有专家人工监督的情况下投入使用。”

对于 IBM 来说,更大的问题不是医疗保健行业是否会迎来人工智能的革命,而是由谁来推动这场革命。

一位前 IBM 员工表示,该公司可能会成为自身营销成功的受害者——其设定的不切实际的期望掩盖了真正的成就。

“IBM 应该停止尝试治愈癌症,” Peter Greulich(一位前 IBM 品牌经理,曾撰写多本关于 IBM 历史和现代挑战的书籍)说。“他们放任营销引擎运转,却不控制如何构建和制造产品。”

Greulich 表示,IBM 需要在沃森身上投入更多资金,并聘请更多人才,才能使其获得成功。他说,在 20 世纪 60 年代,IBM 花费了相当于其年收入 11.5 倍的资金来开发其大型计算机,而这项业务至今仍占其盈利能力的大部分。

如果 IBM 要对沃森进行同等规模的投资,就需要花费 1370 亿美元。“它唯一花费了这么多钱的地方就是股票回购,” Greulich 说。

IBM 表示,他们创造了人工智能市场,并对沃森的增长速度感到满意,并指出沃森和其他新兴业务部门在过去三年中增长了超过 200 亿美元。“Facebook 和亚马逊用了超过 13 年的时间才增长了 200 亿美元,”该公司在一份声明中表示。

自从沃森在 2011 年的“危险边缘!”节目中展示其能力以来,数百家公司已经开始使用人工智能开发医疗保健产品。这些公司包括无数初创企业,但 IBM 也面临着来自行业巨头的激烈竞争,例如亚马逊、微软、谷歌以及 UnitedHealth 集团旗下的 Optum 部门。

例如,谷歌的 DeepMind 最近展示了其在游戏方面的实力,使用其 AlphaGo 程序击败了围棋世界冠军,围棋是一项拥有 3000 年历史的中国棋类游戏。

DeepMind 正在与伦敦的医院合作,学习检测眼部疾病并加快头颈癌靶向治疗的流程,尽管他们也遇到了隐私问题

与此同时,亚马逊也启动了一个医疗保健实验室,探索从电子健康记录中挖掘数据的机会,并有可能构建一个虚拟医生助手。

金融公司 Jefferies 最近发布的一份报告指出,IBM 正迅速失去竞争优势。“IBM 在人工智能人才争夺战中似乎处于劣势,并且可能会面临日益激烈的竞争,” 该公司总结道。

虽然该报告并非专门针对沃森的医疗保健产品,但报告指出,潜在客户正在逐渐远离该系统,原因是与其部署相关的咨询费用过高。报告还指出,亚马逊的职位招聘数量是 IBM 的 10 倍,而 IBM 最近没有续签少量为该公司工作的承包商的合同,这些承包商是在 IBM 去年以 26 亿美元收购 Truven 公司(为了获取 1 亿患者的病历)后加入公司的。

IBM 在声明中表示,这些员工的合同已经到期,并且公司正在继续积极招聘位于马萨诸塞州剑桥市的沃森健康部门和其他部门的员工,在美国有超过 5000 个职位空缺。

但那些与沃森肿瘤学系统密切合作的人表示,该系统的前景充满挑战。Kris(纪念斯隆-凯特琳癌症中心的首席培训师)表示,该系统有潜力改善医疗护理,并确保更多患者获得专家级的治疗。但就像医学生一样,沃森也只是刚刚开始学习如何在真实世界中发挥作用。

“没有人想听到这个,” Kris 说。“他们只想听到沃森就是答案。它总是能给出正确的答案,而且你能立即得到答案,而且会更便宜。但就像其他任何事物一样,它也有点像人类。”

STAT 许可转载。本文最初发表于 2016 年 9 月 5 日

STAT delivers fast, deep, and tough-minded journalism. We take you inside science labs and hospitals, biotech boardrooms, and political backrooms. We dissect crucial discoveries. We examine controversies and puncture hype. We hold individuals and institutions accountable. We introduce you to the power brokers and personalities who are driving a revolution in human health. These are the stories that matter to us all.

More by STAT
© . All rights reserved.