数字生活

新的系统可能允许人们记录他们看到和听到的一切——甚至包括他们无法感知的事物——并将所有这些数据存储在个人数字档案馆中

人类的记忆可能令人恼火地难以捉摸。我们每天都会遇到它的局限性,例如忘记朋友的电话号码、业务联系人的姓名或喜爱书的书名。人们已经开发出各种策略来对抗健忘——例如,在便利贴上潦草地写信息,或在手持设备中携带电子地址簿——但重要的信息仍然会从指缝中溜走。然而,最近,我们在微软研究院的团队已经开始了一项任务,以数字方式记录一个人生活的方方面面,从我们自己生活中的一个(贝尔的生活)开始。在过去的六年里,我们一直试图记录贝尔与其他人和机器的所有通信,以及他看到的图像、听到的声音和他访问的网站——将一切都存储在一个可搜索且安全的个人数字档案馆中。

数字记忆的功能不仅仅是帮助回忆过去的事件、对话和项目。便携式传感器可以读取人类甚至无法感知的事物,例如血液中的氧气水平或空气中的二氧化碳量。然后,计算机可以扫描这些数据以识别模式:例如,它们可能会确定哪些环境条件会加重儿童的哮喘。传感器还可以记录一个人一生中大约三十亿次的心跳,以及其他生理指标,并警告可能发生的心脏病。这些信息将使医生能够及早发现异常情况,在疾病变得严重之前发出警告。您的医生将可以访问详细的、持续的健康记录,您将不再需要绞尽脑汁来回答诸如“您第一次感觉这样是什么时候?”之类的问题。

我们的研究项目名为“MyLifeBits”,它提供了一些编译终身数字档案馆所需的工具。我们发现,数字记忆可以让人生动地重温带有声音和图像的事件,以与互联网帮助科学研究非常相似的方式增强个人反思。一个人曾经读过的每一个词,无论是在电子邮件、电子文档还是在网站上,都可以通过几次击键再次找到。计算机可以分析数字记忆来帮助进行时间管理,指出您何时没有将足够的时间花在最重要的优先事项上。您的位置可以定期记录,生成动画地图来追踪您的漫游。也许最重要的是,数字记忆可以让所有人以引人入胜、细致入微的方式向后代讲述他们的人生故事,而这在过去只为富人和名人保留。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。


轨迹网络
机器扩展记忆的愿景最早在二战结束时由时任美国政府战时研究办公室主任的范内瓦尔·布什提出。布什提出了一种名为 Memex(“记忆扩展器”的缩写)的设备——一种基于缩微胶卷的机器,可以存储个人所有的书籍、记录和通信。Memex 将被内置到办公桌中,并配备键盘、麦克风和多个显示表面。办公桌后面的人可以使用相机制作照片和文件的缩微胶卷副本,或者通过在触摸屏上书写来创建新文档。Memex 用户还可以将相机安装在前额上,以便在离开办公桌时捕捉图像。布什最具远见卓识的想法之一是建议 Memex 的设计应该模仿人类思维的联想思维,他在生动的语言中描述了这种思维:“当大脑掌握一个项目时,它会立即跳到下一个项目,这由思想的联想暗示,并符合大脑细胞携带的复杂轨迹网络。”

在接下来的半个世纪里,包括泰德·纳尔逊和道格拉斯·恩格尔巴特在内的勇敢的计算机科学先驱开发了布什的一些想法,而万维网的发明者借鉴了“轨迹网络”的概念来构建他们的网站链接系统。但是 Memex 本身在技术上仍然遥不可及。然而,近年来,存储、传感器和处理器技术的快速进步为新的数字记录和检索系统铺平了道路,这些系统最终可能会远远超出布什的愿景。

数字存储容量的增长令人震惊:今天,一块 600 美元的硬盘可以容纳一兆字节(一万亿字节)的数据,这足以存储您阅读的所有内容(包括电子邮件、网页、论文和书籍)、您购买的所有音乐、八小时的语音以及未来 60 年每天 10 张照片。如果目前的趋势继续下去,十年之内,您将能够在手机的闪存中携带相同数量的信息,同时无线连接到 PC 上价值 100 美元的 4TB 硬盘。20 年后,600 美元将购买 250TB 的存储空间——足以容纳数万小时的视频和数百万张照片。这种容量应该能够满足任何人 100 多年的记录需求。

与此同时,制造商正在生产新一代廉价传感器,这些传感器可能很快就会变得无处不在。其中一些设备可以记录有关用户健康和身体运动的大量信息。另一些设备可以测量周围环境的温度、湿度、气压和光照水平,甚至可以检测附近温暖物体的存在。有些监视器旨在佩戴,另一些则旨在放置在房间中或集成到冰箱等电器中。(冰箱传感器可以通过测量门打开的次数来跟踪您的零食习惯。)麦克风和摄像头现在也足够便宜,几乎可以安装在任何地方——尤其是在手机中,摄像头的普及正在成为常态,语音录制也将紧随其后。

最后,过去十年计算能力的显着提高促使引入了可以有效地检索、分析和可视化大量信息的处理器。一台普通的笔记本电脑可以运行一个比 1980 年代一家大型银行的数据库更强大且几乎大 100 倍的数据库。一部廉价的手机可以上网、播放视频,甚至可以理解一些语音。

随着数字记录硬件的改进,越来越多的人开始创建他们生活的电子编年史。廉价、高质量的数码相机(包括那些集成到手机中的相机)的出现引发了摄影热潮。包含照片的博客现在比个人网站更常见。年轻人尤其热衷于博客和移动设备的使用。这种数字编年史的激增发生在只有非常简陋的工具的情况下,这一事实表明这种渴望必定有多么强烈。一旦数字记录过程变得更容易和更全面,这种兴趣肯定会增长。

一个人的记忆
我们自己对数字记忆的体验始于 1998 年,当时贝尔决定无纸化,摒弃了成堆的文章、书籍、卡片、信件、备忘录、海报和照片。为了将这堆记忆转移到数字记录中,贝尔痴迷于扫描他个人生活和他漫长的计算机业务生涯中的所有文档和文物。(他甚至扫描了咖啡杯和 T 恤上的徽标。)他还开始数字化家庭电影、录像讲座和录音。贝尔现在已经无纸化了,但代价很高:一位私人助理花了几年时间才完成这项任务。(归档最近的项目不需要如此费力的努力,因为绝大多数文档、图像和视频现在都是以数字格式创建的,因此捕获是自动的。)

然而,在扫描了所有这些信息之后,贝尔对自己无法使用当时可用的软件真正利用这些信息感到沮丧。这种挫败感促成了 MyLifeBits 项目。当我们于 2001 年启动该项目时,为台式计算机开发的搜索工具非常笨拙。我们开始创建一个数据库,该数据库不仅使我们能够对我们的 PC 进行全文搜索(现在这已成为普遍功能),而且还可以使用称为元数据的属性快速检索数字记忆:例如,照片的日期、地点和主题,或数据库附加到文件的书面或口头评论。元数据通常是回忆的关键部分;例如,一个人在寻找特定的电子邮件时,可能会记得它是在一年中的某个时间发送的。通过将这些元数据(其中大部分是自动获得的)链接到数字记忆,数据库允许用户有效地梳理即使是最大的档案。

MyLifeBits 还为贝尔提供了一套新的工具,用于捕获他与其他人和机器的互动。该系统记录了他的电话以及广播和电视上播放的节目。当他在 PC 上工作时,MyLifeBits 会自动存储他访问的每个网页的副本以及他发送或接收的每条即时消息的记录。它还会记录他打开的文件、他播放的歌曲以及他执行的搜索。该系统甚至可以监控他屏幕前台的窗口以及鼠标和键盘活动的频率。当贝尔在移动时,MyLifeBits 会从便携式全球定位系统设备持续上传他的位置,无线传输信息到他的档案中。这种地理跟踪使软件能够根据拍摄每张照片的时间自动为贝尔的照片分配位置。

为了获得他一天的视觉记录,贝尔佩戴了 SenseCam,这是一款由微软研究院开发的相机,当其传感器指示用户可能想要拍照时,它会自动拍照。例如,如果 SenseCam 的被动红外传感器检测到附近有温暖的身体,它就会拍摄该人。如果光照水平发生显着变化——这表明用户可能已经进出房间并进入了新的环境——相机就会拍摄另一张快照。英国剑桥 Addenbrooke 医院的研究人员最近领导的一项研究表明,每晚回顾 SenseCam 图像的记忆障碍患者能够保留记忆两个多月。(相比之下,每晚回顾书面日记几乎没有改善记忆力。)英国利兹大学的神经心理学家马丁·康威推测,SenseCam 可能成为“21 世纪第一个真正强大的记忆刺激物”。

六年后,贝尔积累了一个超过 300,000 条记录的数字档案,占用了大约 150GB 的内存。这些信息存储在贝尔的双盘笔记本电脑和他助手的台式电脑上,这些电脑在本地和异地备份。视频文件占据了大部分存储空间——超过 60GB——而图像占用了 25GB,音频文件(主要是音乐)占用了 18GB。其余部分由 100,000 个网页、100,000 封电子邮件、15,000 个文本文件、2,000 个 PowerPoint 文件等共享。贝尔发现该系统对于联系老熟人和寻找需要与之交流的其他人特别有用。他还使用 MyLifeBits 来检索他研究论文中引用的网站,为医生提供 25 年前冠状动脉搭桥手术的记录,并为报纸讣告获取已故朋友的照片。

MyLifeBits 的某些功能(例如全文搜索)已融入商业产品中。但总的来说,该系统需要更多开发才能提高其易用性和数据管理能力。用于将语音转换为文本的更好软件将通过允许用户搜索电话对话或其他录音中的单词或短语来极大地增强系统。同样,自动面部识别将解决照片标签的棘手问题。如果系统自动识别数百种文档类型中每种文档的性质,也许通过分析其形式和内容,则信息的检索可能会变得更容易。但是我们的研究项目已经戏剧性地展示了 PC 从文字处理器和数字运算器到事务处理器的演变,事务处理器可以以高保真多媒体记录用户生活的方方面面。许多专家预测个人电脑将消亡,但很明显,“PC”中的“P”不会消失。如果有什么变化的话,PC 将变得更加个性化。变化的是“C”。我们的机器将演变成计算生态系统,不仅包括计算机,还包括互联网上的存储服务、新的访问设备(例如手机和娱乐中心)以及无处不在的传感器。最有可能的是,我们的 LifeBits 最终将存储在连接到各种 Web 服务的家庭服务器中。

实现愿景
为了说明数字记忆的潜在影响,我们想象了不久的将来,一个虚构的家庭充分利用这项技术的一天。家庭数字记忆的各个部分存储在他们的个人设备中——他们的手机、笔记本电脑、家用电脑等——但所有这些信息也通过互联网安全地传输到一家名为 LifeBits, Inc. 的假设公司运行的主机服务器。该公司管理数据的存储,执行定期备份(以便恢复任何意外删除的材料),并将档案副本放置在不同的位置,以确保其不会在自然或人为灾难中被毁坏。

由于他们的大部分信息都可以通过安全的 Web 访问获得,因此家庭成员可以随时随地检索它。可能使某人陷入法律困境的特别敏感的信息可以保存在离岸数据存储帐户中——如果您愿意,可以称为“瑞士数据银行”——使其超出美国法院的管辖范围。家庭中的孩子可以加密他们的录音,但 LifeBits 服务将允许父母在紧急情况下访问数据。同样,父母的一些数字记忆可能受雇佣合同的约束,合同规定与其工作相关的数据属于其雇主。当此类员工离职时,他们可能必须对自己的记忆副本执行“部分脑叶切除术”,删除所有被视为公司财产的内容。

我们描述的一些场景并非完全是未来主义的。可穿戴传感器平台,用于收集健康数据并监测生命体征,例如心率、呼吸和燃烧的卡路里数量,已经由位于加利福尼亚州文图拉的 VivoMetrics 和位于匹兹堡的 BodyMedia 等公司商业化。与此同时,位于加利福尼亚州海沃德的 Dust Networks 开发了一种无线集线器,用于在传感器网络中中继信号。由麻省理工学院媒体实验室的 Deb Roy 领导的人类语音组项目正在进行一项工作,记录一个孩子生命最初三年几乎所有醒着的时间——这个孩子是 Roy 的儿子,现在一岁——以研究人们如何获得语言。东京大学的 Kiyoharu Aizawa 和他的同事正在研究可穿戴摄像机系统,该系统可以通过监测用户大脑中的 α 波来识别有趣的时刻以供后人捕捉。

微软研究院正在支持 14 所大学开展各种数字记忆领域的项目。其中之一是由匹兹堡大学的 Bambang Parmanto 领导的 MyHealthBits;这项工作正在迎接记录大量健康数据和管理由此产生的大量记录的挑战。华盛顿大学最近的研究表明,持续健康监测对糖尿病患者和睡眠障碍患者有益。

早期的进展令人鼓舞,但数字记忆时代的到来并非一帆风顺。一些国家和美国州目前对录制对话或拍摄人物照片施加了限制。许多个人同样担心记录可能在法庭上被用来对付他们的信息。数字记忆与我们大脑中的记忆不同,在法律诉讼中是公平的游戏。理查德·尼克松曾建议他的助手在在大陪审团面前作证时说“我不记得了”,但他自己谈话的录音是他垮台的原因。对于我们这些将数字记忆视为我们自己思想延伸的人来说,在法庭上使用此类材料会感觉像是自证其罪。然而,新技术可以帮助最大限度地减少潜在的危险。例如,在录制他人时,可能会模糊他们的图像或语音以避免非法录制。

保护数字记忆的隐私将至关重要。身份窃贼、饶舌者或专制国家可能获得此类记录的前景令人恐惧。然而,大多数人的电脑上已经有相当多的敏感信息。无论您在数字记忆的概念上走多远,安全都是一个重要的考虑因素(尽管在单个档案中存储一生的个人数据至少会使问题在数量上变得更糟,即使不是在质量上)。此外,即使我们的计算机系统可以像诺克斯堡一样安全,用户在共享信息时也必须非常小心;只需一个错误的击键,一个人的医疗记录就可能无意中分发给全世界。为了防止此类错误,数字记忆的用户界面必须比我们现在拥有的更好,并且我们将需要智能软件在共享数据看起来有风险时提供警告。

另一个技术挑战将是确保用户能够在存储数十年后打开他们的数字文件。我们已经遇到过无法访问文档的情况,因为它们的格式已经过时。数字档案管理员将不得不不断地将他们的文件转换为最新的格式,在某些情况下,他们可能需要运行旧机器的模拟器来检索数据。一个小行业可能会兴起,专门防止人们因格式演变而丢失信息。

更大的挑战将是设计软件,使计算机能够通过利用这个巨大的知识库来执行有用的任务。最终目标是一台可以像私人助理一样工作的机器,预测用户的需求。至少,计算机必须更好地组织信息。对于几排书架效果良好的搜索策略可能根本不适用于国会图书馆大小的馆藏。我们大多数人都不想成为我们数字档案的图书管理员——我们希望计算机成为图书管理员!

因此,我们的研究小组对将人工智能 (AI) 应用于数字记忆非常感兴趣。尽管许多专家对人工智能的努力持怀疑态度,但我们相信,如果这种软件可以利用个人档案中海量的数据存储,那么它可能会产生实际效果。旨在处理大量信息的人工智能系统肯定会比必须基于非常少的数据点提出建议的系统表现更好。我们已经开始在该领域工作,开发可以根据文件内容组织文件的软件,但仍有许多工作要做。

从某种意义上说,数字记忆时代是不可避免的。即使那些对我们的愿景感到反感的人,在未来几年内,他们的计算机也将拥有更多的存储空间,并期望软件能够越来越多地帮助他们利用它。尽管有些人可能会对无处不在的记录前景感到恐惧,但对我们来说,兴奋远远超过了恐惧。数字记忆将在广泛的领域产生益处,提供关于人们如何思考和感受的宝贵信息。通过不断监测患者的健康状况,未来的医生可能会为心脏病、癌症和其他疾病开发更好的治疗方法。科学家将能够一窥他们前辈的思维过程,未来的历史学家将能够以前所未有的细节审视过去。机会仅受我们想象力的限制。

我们可能会这样想。范内瓦尔·布什,《大西洋月刊》,第 176 卷,第 1 期,第 101-108 页;1945 年 7 月。

个人数字存储。G. 贝尔,《ACM 通讯》,第 44 卷,第 1 期,第 86-91 页;2001 年 1 月。

无处不在的计算和丰富存储时代中的数字记忆。Mary Czerwinski、Douglas W. Gage、Jim Gemmell、Catherine C. Marshall、Manuel A. Pérez-Quiñones、Meredith M. Skeels 和 Tiziana Catarci,《ACM 通讯》,第 49 卷,第 1 期,第 44-50 页;2006 年 1 月。

MyLifeBits:万物个人数据库。Jim Gemmell、Gordon Bell 和 Roger Lueder,《ACM 通讯》,第 49 卷,第 1 期,第 88-95 页;2006 年 1 月。

数字生活的一天

存储容量

大众科学杂志第 296 卷第 3 期本文最初以“数字生活”为标题发表于大众科学杂志第 296 卷第 3 期(
doi:10.1038/scientificamerican032007-4PQWRprLH6ECawaeMZBsNZ
© . All rights reserved.