你看到我所看到的吗?从脑电波中翻译图像

视觉解码器允许研究人员将脑电波活动转化为图像

加入我们的科学爱好者社区!


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。


将此归类为未来主义的(也许有点吓人):为了有一天或许能破译视觉和梦想,一项新的研究揭示了一种可以转化人类大脑活动中的算法。

来自加州大学伯克利分校的科学家今天在《自然》杂志上报告说,他们开发了一种能够解码大脑视觉区域模式以确定某人所见的方法。不用说,这对社会的潜在影响是巨大的。

研究人员说:“这种通用的视觉解码器将具有巨大的科学和实用价值。” “我们可以使用解码器来研究不同人在感知上的差异,研究诸如注意力之类的隐蔽心理过程,甚至可能访问纯粹心理现象(如梦想和意象)的视觉内容。”

科学家说,先前尝试从“大脑活动中提取心理内容”的尝试只允许他们解码有限数量的模式。研究人员会一次向个体提供图像(或要求他们考虑一个物体),然后寻找相应的脑活动模式。“你需要[事先]知道,对于你想读取的每一个想法,什么样的活动模式与之相对应,”柏林伯恩斯坦计算神经科学中心和马克斯·普朗克人类认知和脑科学研究所的教授约翰·迪伦·海恩斯说,他没有参与这项新工作。

他继续说道,“这里提出的进步是,他们建立了一个数学模型,该模型捕获了大脑视觉部分的属性”,然后可以将其应用于先前未见过的物体。

研究人员使用功能性磁共振成像(fMRI)来记录一对志愿者(该研究的两位合著者)在观看一系列图像时视觉皮层的活动。他们通过将区域划分为体素(体积单位或 3D 像素)并注意每个部分响应的图片部分来检查大脑。例如,一个体素或切片可能以某种模式响应照片左上角的颜色,而另一个体素会被图片的不同部分触发。

海恩斯说,该团队可以通过监测每个大脑区域的活动并破译最可能在视觉视野或照片的相应部分中找到哪种信息,来“回溯并推断出一个人正在看到的图像”。

当志愿者扫描一组新的 120 张图像时——描绘了从人到房屋到动物到水果和其他物体的所有事物——计算机程序正确识别他们所看到的内容,准确率高达 92%;当图像库增加到 1,000 张时,该算法的成功率为 80%。当然,随着可能图片数量的增加,其准确性会降低,但即使数量比 Google 在互联网上索引的图像数量大 100 倍,据科学家称,该模型的成功率也会超过 10%。(这远远超过了随机猜测的成功率。)

研究人员写道:“这表明fMRI 信号包含大量的刺激信息,并且这些信息可以在实践中成功解码。”

海恩斯说,该方法仅限于破译可以在空间中映射的信息,例如感觉输入(声音来自何处)或运动功能(某人的手臂执行了什么动作)。他说,挑战在于,它不能“轻易地应用于没有明确数学模型的情况”,例如记忆、意图和情绪。“如果没有这样的数学模型,很难掌握高层次的想法,”他补充道。

所以,你现在可以把你的锡箔头盔放在你的壁橱里了。这些算法仍然无法读取我们内心深处的想法——至少现在还不能。

© . All rights reserved.