医学界长期以来一直在讨论需要更多地倾听患者的声音——现在这种说法正在被字面理解。
学者和企业家们正在竞相开发技术,以基于一种不寻常的数据来源:你的说话方式,来诊断和预测从躁狂发作到心脏病再到脑震荡等各种疾病。
越来越多的证据表明,一系列精神和身体疾病会导致你口齿不清、拉长音调或用更鼻音的方式说话。它们甚至可能使你的声音出现细微的颤抖或抖动,以至于人耳无法察觉。分析语音模式是否可以产生准确或有用的诊断结果,目前还不是很清楚。但这场尝试的竞赛已经开始。
支持科学新闻
如果您喜欢这篇文章,请考虑订阅我们的获奖新闻,以支持我们的工作。 订阅。通过购买订阅,您正在帮助确保未来关于塑造我们当今世界的发现和想法的影响深远的故事能够继续发表。
最新进入这个领域的玩家是Sonde Health,一家位于波士顿的公司,该公司于周二由风险投资公司PureTech推出,基于麻省理工学院研究人员授权的技术。Sonde希望开发面向消费者的软件,该软件可以筛查抑郁症以及呼吸道和心血管疾病。
“说话是我们每天自然而然的事情,”Sonde首席运营官吉姆·哈珀说。
该公司将首先分析患者朗读的音频片段,但目标是开发一种无需实际录制单词即可提取语音特征的技术。哈珀说,目标是“将监测转移到后台,并用人们已经拥有的设备收集一些信息。”
Sonde将面临激烈的竞争:IBM正在与学术研究人员合作,利用其沃森超级计算机,试图通过语音模式预测患者是否可能患上精神病。一家柏林公司一直在研究通过语音录音诊断ADHD。另一家波士顿公司Cogito正在开发一款语音分析应用程序,该应用程序正被美国退伍军人事务部用于监测士兵的情绪;它也在双相情感障碍和抑郁症患者中进行测试。
甚至陆军也对此感兴趣:本月早些时候,它与麻省理工学院的研究人员在同一个实验室建立了合作伙伴关系,目标是开发一种经美国食品和药物管理局批准的设备,以检测脑损伤。
这个领域非常热门,以至于一些企业家正直接冲向消费市场,在几乎没有临床证据的情况下就提出了大胆的声明。一个团队在众筹网站Indiegogo上筹集了超过27,000美元,承诺发布一款应用程序,计划于今年夏天推出,该应用程序将分析“语音模式,以帮助您实现最佳健康和活力”。(该众筹活动还提到了收集与癌症症状相关的“频率生物标志物”数据的计划。)
但是,将声音诊断技术转化为临床实用性并非易事,圣母大学研究神经系统疾病生物标志物的计算机科学家克里斯蒂安·波拉鲍尔警告说。他说,要找出语音模式变化的真正原因可能非常困难。录音必须具有高质量才能有用,而这可能会很昂贵。你需要大量的数据来确保相关性可靠。
然后是文化差异的问题:例如,在测试语音分析以诊断脑震荡时,波拉鲍尔的团队发现,许多年轻运动员在说“地狱”这个词时犹豫或改变了语气——原因可能与脑损伤无关。
“语音是一种非常非常复杂的机制,”波拉鲍尔说。
另一个关键问题:这些信息对患者有多大用处,以及临床医生是否能够帮助他们知道如何处理这些信息。
“如果你使用这个应用程序,它说你口齿不清并且正在中风,那可能很有用。你会立即去医院。另一方面,如果它说你下周有 38% 的几率会偏头痛,我不确定这对你有多大帮助。你可能早就知道了,”纽约大学的医学伦理学家亚瑟·卡普兰说。
卡普兰还表示,这种技术可能被用来预测患者爆发愤怒或失去自制力的可能性——并将这些短暂的失误变成一种病态。“你想要监控的和不想要监控的之间的界限在哪里?”他问道。
批评人士还提出了隐私方面的担忧,认为语音分析技术可能会变得非常先进,以至于即使语音样本没有附上姓名,也可以通过患者的语调和语气识别他们。
哥伦比亚大学的精神分裂症研究员谢丽尔·科科伦与 IBM 沃森合作,她说:“我不认为我们现在有技术仅凭一个人的声音就识别出他们是谁。但是,这种技术在未来很可能会存在。”
梅加纳·凯沙万为本报告做出了贡献。