如今隐私很难获得,尤其是在互联网上,每次你在谷歌上搜索内容时,你的需求都会被记录下来以供后人参考——或者至少是为了广告商。
互联网搜索公司表示,他们通过加密个人信息以及使用数字而非姓名来保护客户的隐私,从而为用户提供匿名性。问题是匿名化并非总是有效。AOL 用户 4417749 号在 2006 年就吃到了苦头,当时 AOL 决定在线发布一份包含 2000 万次网络搜索的列表,其中包括她和 657,000 名其他用户的搜索记录。记者通过分析她的搜索内容,追踪到了这位家住佐治亚州利尔本的 62 岁寡妇。幸运的是,塞尔玛·阿诺德对她的身份和私密兴趣被曝光并不感到尴尬。我们当中有多少人能说同样的话呢?
然而,物理定律可能会来解救我们。通过特殊的“量子通道”进行通信已经使银行和其他机构能够发送具有几乎牢不可破的加密的数据。因此,技术已经存在,可以向可能拦截您查询的窃听者隐藏您的搜索内容。但在未来,新“量子”版本的互联网可能会使您能够发送查询并接收答案,并确保没有人——甚至谷歌也不知道您提出了什么问题。此外,将保证私密搜索的相同技术也可能保证整个在线体验过程中的隐私。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事能够拥有未来。
当然,搜索引擎会保存和分析用户数据,以便他们可以展示有针对性的广告。这就是他们支付费用并赚取利润的方式。如果他们决定对用户数据保密,搜索引擎将需要一种新的商业模式。用户可能必须决定他们是否愿意付费搜索,或者他们是否宁愿免费搜索并放弃他们的搜索数据。
非经典监听者
在 2004 年春天,我发现自己参加了在加利福尼亚州蒙特雷举行的一次会议期间的亿万富翁宴会,当时我感到有些错位。据我所知,我的角色是做那个从蛋糕里跳出来的人——换句话说,娱乐对量子技术感兴趣的客人。出席活动的合法亿万富翁包括谷歌的创始人谢尔盖·布林和拉里·佩奇。令我惊讶的是,布林和佩奇对量子信息了解很多。在对量子物理学可能如何改变人们与互联网互动方式进行一番大胆猜测之后,我建议我将与我的同事合作研究“量子互联网搜索”,无论这最终证明是什么。
量子物理学提供完全隐私的能力源于一个简单的事实:量子领域中的系统(包括从基本粒子到分子的任何事物)可以存在于多种状态。在任何特定时间,原子可以位于多个不同的位置;光粒子或光子可以同时垂直和水平偏振;电子的磁矩可以指向上和向下,等等。因此,经典(相对于量子)数据位只能记录值 0 或值 1,而量子位可以同时记录 0 和 1。此外,每当量子位同时取值 0 和 1 时,您都无法精确复制该量子位,并且任何尝试这样做都会改变该位的状态。这条规则,被称为不可克隆定理,也适用于量子位的字符串,例如,量子位的字符串可以表示单词或句子。因此,窃听量子通道(通常是光纤,在多个偏振态下携带光子)的人将无法“监听”通信而不干扰它,从而暴露入侵行为。
由于不可克隆性,存在几种不同的量子加密技术可以完全私密地交换数据。然而,这些技术假定允许收件人读取您发送给他们的数据:仅仅向谷歌发送加密的搜索查询是无济于事的。然而,去年,我的同事,意大利比萨高等师范学院的维托里奥·乔万内蒂和意大利帕维亚大学的洛伦佐·马孔内以及我发现,不可克隆定理也使私密查询成为可能。在我们设计的协议中,用户必须能够向搜索引擎发送“量子问题”——一个同时包含真实问题和另一个问题的量子位字符串。(第二个问题是什么并不重要:您的计算机甚至可以自动提供一个随机问题。)
搜索引擎在其数据库中搜索您的多个问题的答案,并将问题和答案组合成一个新的量子包,然后将其发送回给您。如果搜索引擎复制问题以供记录,您将能够知道您的隐私受到了侵犯,因为您的原始问题的量子态将以您的计算机可以检测到的方式受到扰动。至关重要的是,搜索引擎可以提供答案,而无需物理检测(更不用说克隆)编码问题的位字符串,因此无需知道问题是什么。
尽管这种魔法在目前的计算机、数据库和网络硬件上是不可能的,但我们意识到这并非技术上遥不可及。量子私密查询的第一个要求是基本的量子互联网。沿专用线路交换量子消息的技术已经存在,并已用于安全通信。然而,功能完善的量子互联网将不仅是两点之间的一条线路,而是一个网络,其节点路由数据包,以便任何用户都可以访问任何其他用户或任何 Web 服务器。事实证明,在不制作数据临时副本的情况下路由数据——从而避免遭受不可克隆定理的后果——是一项非同寻常的任务,需要一种目前处于实验阶段的复杂技术,称为量子路由器。这种网络的原型可能会在 5 到 10 年内问世。
私密 Web 搜索的第二个要求是用户和数据服务器拥有基本的量子计算机,这意味着能够存储和处理量子位的计算机。不幸的是,量子位是出了名的变化无常,并且倾向于在一秒钟的一小部分时间内自发地失去其多重量子态。例如,将量子位存储在悬浮在真空中的单离子的磁态中的实验性量子计算机,到目前为止一次只能存储大约八个量子位。功能完善的量子计算机将需要数百甚至数千个量子位,即使作为实验室演示,也可能还需要数十年才能实现。不过,幸运的是,对于量子私密搜索的目的而言,仅需约 30 个量子位就足够了:如果编码得当,一个 30 位查询可以从包含超过十亿条条目的数据库中提取答案。这种 30 位“量子微处理器”也可能在 5 到 10 年内问世。
并非如此随机
到目前为止,一切看起来都不错:量子私密搜索似乎只需要非常简单的量子计算机和量子通信系统。现在困难的部分来了。为了回答用户的多方面量子问题,搜索引擎的数据库必须能够同时提供问题的每个组成部分的答案。这样做将需要一种新型的数据存储,称为量子随机存取存储器,或量子 RAM。
RAM 只是一个用于存储数据的设备,以树状结构排列。每条数据都是一个八位序列,即一个字节,并且有一个地址,地址本身也是一个位序列。字节就像树上的叶子;地址控制着从树干到特定叶子的路径。地址的第一位指定在树的最低层要走哪两个分支中的一个,第二位控制第二层分支,依此类推。分支在每一层都加倍,在具有 30 位地址的传统 RAM 中,检索数据需要拨动 230 个(超过 10 亿个)开关。
可以设计传统 RAM 的量子版本。唯一的区别是,现在通过二叉树路由信息的开关必须能够同时通过两个不同的分支路由信息,因为量子问题的每个位都可以指定两条不同的路径。这种量子开关可以使用现有技术构建,例如半透明反射镜,它可以“分裂”光子,使其同时沿两条不同的路径传播。问题是量子电路对噪声和错误极其敏感:如果仅仅一个开关出现故障,相应位的隐私就会丢失。由于典型的地址位控制着大量的开关,因此丢失隐私的机会非常高。
乔万内蒂、马孔内和我提出了一种不同的 RAM(量子和经典)寻址设计,其中每次内存调用拨动的开关要少得多。秘诀是将地址位沿着与数据要遵循的相同树分支进行路由,而不是通过单独的寻址线。由于地址位是按顺序通过阵列传递的,因此我们称之为“接力式”RAM。
接力式架构在阵列的每一层仅需要拨动一个开关,而传统 RAM 在每一层的每个开关都拨动。节省非常显著:具有十亿个内存槽的接力式 RAM 每次内存调用拨动 30 个开关,而传统 RAM 每次内存调用拨动十亿个开关。并且接力式架构在错误率和节能方面的优势随着位数的增加呈指数增长。
量子的慰藉
起初,我们认为接力式想法有可能彻底改变传统 RAM 行业,并且对金钱的渴望开始在我们脑海中闪现。但我们很快发现,其他人之前也想到过类似的设计,而且无论如何,该设计对于传统 RAM 来说速度太慢了(尽管它可能是非易失性存储器(例如数码相机中使用的存储器)的节能解决方案)。
但是,接力式设计对于量子搜索至关重要,因为它的架构可以容忍三十分之一的错误率,而不是十亿分之一。量子 RAM 的存储介质可以由传统的物理支持组成。例如,数据可以存储在数十亿个微小的反射镜中,就像构成传统 CD 表面的反射镜一样。量子 RAM 真正具有量子特性的部分是开关阵列,它可以由每个开关都可以在两个分支上同时分流量子位的开关构成。这种量子开关已经存在,并且达到了足够低的错误率,可以构建具有十亿个或更多槽的量子 RAM。
当然,组装量子开关以制造大型量子 RAM 可能会被证明是困难的,更不用说将量子 RAM 连接到量子通信通道以实现量子私密查询的问题了。但是,这些困难似乎都不是无法克服的。顺便说一句,我们最近意识到,我们的量子 RAM 设计的数据路由技术可以应用于整个量子互联网的交换网络。人们可以完全匿名地浏览网络,不仅不会泄露他们正在搜索的内容,也不会泄露他们正在访问的网站。
在我的同事和我确定了如何构建量子 RAM 并进行量子私密查询的细节几个月后,我在加利福尼亚州纳帕的一次会议上遇到了布林和佩奇。在无花果树下的热水浴缸中,当星星在头顶旋转时,我描述了量子查询的工作原理及其可能带来的好处。他们的第一反应是,谷歌的商业模式是保留有关所有查询的信息,并使用它来优先考虑广告和未来的搜索结果。他们没有想到不保留有关查询的信息。当我向他们提出新的、基于向客户收取搜索结果费用的量子商业模式的明显优势时,他们又思考了一会儿。“好吧,”他们说,“让我们看看你是否能构建它。”
最近,弗朗切斯科·德·马蒂尼和他在罗马大学“La Sapienza”的团队正是这样做的。他们使用激光器、偏振器和光子探测器,构建了一个简单的量子 RAM,并在小型数据库上演示了我们的搜索协议。因此,量子私密查询是真正有可能实现的。如果有一天我们将拥有更大的量子 RAM 或可行的量子互联网,那么接下来会发生什么就只能由大家猜测了。