关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。
云计算的想法是使世界各地数据中心运行的所有信息和服务都可通过网络访问。但现实情况令人望而生畏。不同企业、政府实体和研究机构建立的数据中心并非天生就为了共享而设计,而且并非所有信息都可以(或应该)提供给任何可以使用网络浏览器的人。
许多人认为,随着移动互联设备的普及和宽带接入的扩展,云计算模式将盛行,因为它可以在设备本身上无需大量存储或处理能力即可访问数据和应用程序。
也许这些人中最重要的是 戈登·贝尔,微软研究院的首席研究员和资深的 “生活记录者”,他与大众科学谈论了云计算与其他类型的网络服务的区别,为什么科学家需要加入云模式,以及为什么有人会想将一生的记忆存储在数字深渊中。
贝尔认为云计算是同名 贝尔定律 的新篇章,他于 1972 年制定该定律,以描述不同的计算方法如何出现、发展并最终消亡(或至少淡出背景)。这些新方法大约每十年出现一次,并承诺使计算机更便宜、更易于访问。在 1960 年代,大型机将分布式计算和哑终端引入工作场所。紧随其后的是小型计算机,它基本上使小型企业也能使用大型机的功能。个人电脑随后出现,将计算的范围扩展到家庭,并最终使互联网得以蓬勃发展。最近,无线设备使我们能够随身携带计算。贝尔认为,“云”有望将计算提升到一个新的水平。
尽管贝尔已经在微软研究院工作了近二十年,但他明确指出,本次采访中表达的观点仅代表他个人,不代表其雇主的观点。
[以下是经过编辑的采访稿。]
您如何定义“云计算”?
正如贝尔计算机等级形成定律所描述的那样,它是下一个计算平台。像所有新平台一样,我们可以从四个功能组件来看待它:存储、计算能力、网络和用户界面。对于云计算,重点在于存储和网络,以实现对交易所需数据的广泛、24 小时全天候访问——无论是科学的、金融的还是其他的。
它与早期的硬件、网络、应用程序和数据托管服务有何区别?
在某些方面,没有什么区别。云是从托管网络内容的大量分布式服务器发展而来的。不同之处在于这些服务器的规模——数万台计算机消耗 50 兆瓦的电力并托管数千个客户。托管公司不是让每个客户维护自己隔离的服务器,而是将对其服务器的访问权限作为服务出售。客户共享计算机系统、电力、数据中心空间和维护服务。
我们正处于云服务发展的哪个阶段?
亚马逊是第一个在其业务中使用云计算模型的公司,现在是向其他企业提供云服务的领导者。企业家们正在利用亚马逊的 Web 服务、微软的 Windows Azure 托管平台和其他云服务来创办公司,因为它们无需任何资本设备投入。付款方式为信用卡,并且按需付费。
今天大多数人都在以某种方式使用云吗?
当然。想想 iTunes、Dropbox、Salesforce.com 和 HealthVault——[后者] 让您存储和共享您的医疗信息,而不是,比如说,您当地医院使用的 Epic 软件。提供在线游戏、项目管理工具和其他服务的初创公司是人们使用云的其他方式。
云服务如何影响科学?
对于科学而言,云服务实际上还没有真正开始到任何可衡量的程度。然而,对于科学而言,云是不可避免的,这受到几个因素的驱动。大学和其他研究机构维护自己的高性能计算集群将开始看到让其他人管理这些系统的成本效益。高性能集群中数据的生命周期是可疑的,可能只与学生运行实验的时间一样长。他们产生的数据可能没有或可能没有任何冗余或备份。
云计算为科学家提供了跨多个研究机构访问数据的途径。随着科学发展超越单个实验室,支持科学界的管理细节和网络成本需要超出单个实验室或大学计算中心心态的标准和开销。由研究生管理的、定位为一种迷你云的本土计算机系统,可提供 24 小时全天候的数据访问,将让位于具有地域冗余和更高可靠性的商业云服务。科学家们还面临着永久提供数据的压力,尤其是在他们的实验由公共资金资助时。更重要的是,由竞争性研究市场驱动并由无处不在的传感器提供数据的大规模实验正在产生 TB 级的信息,这些信息太昂贵而无法在实验室服务器上管理。然后是维护这些系统所需的技能。目标是培训计算机操作员还是让研究生从事科学研究?
什么是“生活记录”,微软的 MyLifeBits 与此有何关系? MyLifeBits,我与吉姆·杰梅尔在 2007 年 3 月号的大众科学 中撰写过关于它的文章,是微软研究院的一个项目,旨在为人们提供编译终身数字档案或生活记录所需的工具。它是 瓦内瓦尔·布什 1945 年的 memex [超文本] 愿景的实现——一个贯穿一生的信息数字存储库,以补充自己的记忆——包括全文搜索、文本和音频注释以及超链接。
自 2001 年以来,吉姆·杰梅尔和我演示了完整生活记录的许多方面——将与我生活相关的信件、论文、照片、视频和录音存储在带注释且可搜索的数据库中。数码相机、生物传感器和 GPS 的出现意味着我们现在可以实时记录关于个人的所有信息,从位置到他们的身体状态的各个方面,例如能量消耗、心率和压力水平。
乌托邦愿景还是反乌托邦噩梦?未来生活记录的程度将至少取决于我们建立的关于隐私的法律和规范。例如,我们有什么权利记录我们与他人的互动?但生活记录对个人生活和社会整体的潜在益处是巨大的。2009 年,英国的研究人员展示了使用延时相机进行生活记录如何帮助那些患有失忆症的人重新掌控自己的生活。对于社会科学家来说,广泛的生活记录将意味着前所未有的数据洪流,以进一步我们对人类行为的理解。对于我们每个人来说,这可能意味着获得一点有限的永生的机会。
为了使一个人一生中收集的所有信息都变得有用,它必须是可搜索的。不同类型的数据(文档、音频、视频等)在多大程度上可以轻松搜索?
每年都在变得更好。所有照片都在朝着基于地理位置和时间进行标记的方向发展,这有助于系统识别它们。印刷文档已经可以搜索十年了,尽管我不相信手写文档目前正在被研究。视频与图片相关,并且正在得到解决。
您已经无纸化办公十多年了。您要从中筛选所有这些信息以找到您想要的东西有多容易?
我很少放弃查找某个项目,无论是照片、电子邮件还是文档。这些文件始终与我同在,我可以随时随地工作。
数据泄露已变得司空见惯,企业因网络攻击或笔记本电脑丢失而泄露个人信息。随着世界日益数字化,对于那些担心安全和隐私的人们,您有什么要说的?
嗯,我们有两种情况:数据在本地计算机上或保存在云中。任何在本地计算机上拥有公司或机构数据的人都必须加密他们的磁盘,以防有人偷走系统。此功能内置于 Windows 中。人们可以通过物理隔离(包括本地数据服务器和外部硬盘驱动器)在不同程度上保护他们的个人计算机。我们不断努力使连接到网络的 PC 更难被渗透,尤其是被攻击访问。远离网络是理想的选择,基本上是我们都使用的防火墙背后的想法。对于那些将所有内容都存储在云中的人来说,我不知道有任何重大攻击导致每个人的数据都被泄露的例子,但这可能会发生。
亚马逊最近经历了长时间的服务器停机,这使得该公司的许多客户无法进行云计算。对于任何考虑将所有数据和软件外包给服务提供商的人来说,这是否应该作为一种警示?
我不认为这次停机会影响云计算的采用。亚马逊的许多客户可能受到了影响,但这可能与您将所有独立运行的单独系统所遭受的停机时间加起来的总和相同。停机无疑将影响[未来]应用程序的设计方式。
云计算的下一步是什么?
它将继续增长,拥有更多的功能和范围。我希望科学最终能够加入我们试图在 2005 年出版的 第四范式 一书中概述的计划。科学界不妨开始研究工业界已经开始的事情,建立在伴随规模经济而来的大规模投资和不可避免的成本下降之上?下一个阶段将看到传感器数据持续不断地输入云端,这与当今移动用户的交互方式非常相似。