秘密信息可以隐藏在人工智能生成的媒体中

在隐写术中,普通信息掩盖了秘密通信的存在。人类永远无法完美地做到这一点,但一项新的研究表明,机器有可能做到

Digital generated image of abstract cubic pattern in red, blue and lilac.

2010年6月27日,联邦调查局逮捕了10名俄罗斯间谍,他们在纽约市附近以美国专业人士的身份生活和工作。该案件揭露了一个由虚假身份和秘密会议组成的复杂系统,曝光了自冷战结束以来美国最大的间谍网络之一,并启发了电视剧《美国谍梦》。

这也引起了人们对隐写术的关注,这是一种在另一条信息中伪装秘密信息的方法。纽约间谍将他们的秘密隐藏在众目睽睽之下,将通信编码在公开发布的看似无害的图像的像素中。为了阅读这些信息,接收者必须下载图像,将其转换为二进制代码的1和0,并知道哪些被修改的数字,按顺序排列,会拼出秘密信息。

隐写术既是一门艺术,也是一门科学,它与更为人所知的秘密通信方法——密码术不同。密码术有意隐藏消息的内容,将其转换为一团乱麻的文本或数字,而隐写术则隐藏了秘密存在的事实。“隐写术隐藏了消息的存在,”伯尔尼大学计算机科学家和密码学家克里斯蒂安·卡钦说。“如果对手可以检测到隐藏的消息,那么发送者就输了。”


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。


与任何秘密通信方法一样,挑战在于如何使其完全安全,这意味着人类或机器检测器都不会怀疑一条消息隐藏着秘密。对于隐写术来说,长期以来这在理论上是可能的,但人们认为在实际的人类通信中不可能实现。

ChatGPT等大型语言模型的出现提出了一种不同的前进方向。虽然可能无法保证人类创建的文本的安全性,但一项新的证明首次阐述了如何在机器生成的消息(无论是文本、图像、视频还是任何其他媒体)中实现隐写术的完美安全性。作者还包括一套生成安全消息的算法,并且他们正在研究将它们与流行的应用程序结合使用的方法。

卡内基梅隆大学的计算机科学家塞缪尔·索科塔帮助开发了新的算法,他说:“随着我们越来越成为一个与人工智能模型交互非常普遍的社会,在人们一直使用的媒体中编码秘密信息的机会越来越多。”

该结果来自信息论领域,信息论为理解各种通信提供了数学框架。这是一个抽象而整洁的领域,与实际隐写术的复杂混乱形成对比。宾厄姆顿大学的研究员杰西卡·弗里德里希研究在数字媒体中隐藏(和检测)数据的方法,她说这两个世界并不经常重叠。但新的算法将它们结合在一起,既满足了长期以来对安全性的理论标准,又为在机器生成的内容中隐藏消息提出了实际应用。新的算法可以被像纽约俄罗斯人这样的间谍利用,但它们也可以帮助人们将信息输入或输出禁止加密渠道的国家。

光头和其他策略

隐写术,希腊语意为“覆盖的写作”,其方案比数字媒体早数千年。

最早的已知例子出现在公元前5世纪希罗多德撰写的《历史》中。在一个故事中,一条消息被写在木板上,并用一层蜡隐藏起来,以避免在运输过程中被拦截。在另一个故事中,归功于埃涅阿斯·塔克提库斯,一条消息在某些字母上隐藏了不可见的墨点,这些墨点拼出了真正的消息。在一个更极端的例子中,暴君希斯提亚乌斯想要在不被发现的情况下向他的侄子传达一个策略,所以他剃光了一个奴隶的头,将他的信息纹在那个人的头上,并等待头发长出来,然后才派遣信使。到达后,侄子剃光了信使的头,露出了计划。

这些策略一直存在,技术也催生了新的策略。第一次世界大战期间,德国间谍找到了通过微点传输信息的方法:他们复制并缩小一份文件,直到它小到像字母“i”的点一样,这看起来是无辜的,但可以通过放大镜显示出来。

政治家也转向了这种欺骗性的艺术。在1980年代,在一系列新闻泄露事件之后,据称英国首相玛格丽特·撒切尔重新编程了她部长的文字处理器,以便每个文字处理器都有自己独特的、几乎无法检测但独一无二的单词间距模式。这种细微的修改使得泄露的文件可以追溯到来源。

这种方法在21世纪继续蓬勃发展,既有好的方面,也有坏的方面。现代隐写术策略包括用隐形墨水书写信息(纽约的俄罗斯间谍也使用了另一种策略)、在绘画细节中隐藏艺术家签名以及设计带有隐藏或倒放音轨的音频文件。弗里德里希说,数字媒体中的隐写术方法还可以帮助在语音邮件文件中隐藏图像,或者像俄罗斯间谍的案例一样,将书面文本放置在经过篡改的照片中。

形式化保密

卡钦说,直到1980年代,数学家和计算机科学家才开始寻求隐写术的形式化数学规则。他们转向了信息论,这个领域始于克劳德·香农1948年开创性的论文《通信的数学理论》,该论文建立了一种分析方法,用于思考通过信道发送和接收信息。(香农模拟了电报线路,但他为今天的数字技术奠定了基础。)他使用术语“熵”来量化变量中的信息量——例如,编码一个字母或消息所需的比特数——并在1949年,他制定了完全安全的密码术的规则。但香农没有解决隐写术中的安全性问题。

大约50年后,卡钦做到了。他的方法,本着香农的精神,是以概率的方式思考语言。假设爱丽丝和鲍勃这两个特工想要通过隐写术交流信息,并对他们的对手伊芙保密。当爱丽丝向鲍勃发送一条无害的消息时,她从整个英语词库中选择单词。这些单词都有与之相关的概率;例如,单词“the”比方说“lexicon”更有可能被选择。总而言之,这些单词可以表示为概率分布。如果爱丽丝使用隐写术向鲍勃发送一条编码消息,则该消息将具有自己的概率分布。

信息论学者使用一种称为相对熵的度量来比较概率分布。这就像测量一种抽象的距离:牛津大学的计算机科学家克里斯蒂安·施罗德·德维特参与了这篇新论文的研究,他说,如果两个分布之间的相对熵为零,“你就不能依赖统计分析”来揭示秘密。换句话说,如果未来的间谍开发出一种完全安全的算法来走私秘密,那么任何基于统计的监视都将无法检测到它。他们的传输将是完全隐藏的。

但卡钦的证明依赖于一个关于隐藏秘密的消息的关键假设,即所谓的掩盖文本。卡钦说,为了提出一条与原始的、无害的消息无法区分的新消息,你必须创建掩盖文本分布的完美模拟。例如,在书面消息中,这意味着使用某种工具,可以完美地模拟一个人的语言。但是人类生成的文本太混乱了。有可能接近——ChatGPT和其他大型语言模型可以产生令人信服的模拟——但它们并不完全精确。“对于人类生成的文本,这是不可行的,”卡钦说。出于这个原因,完全安全的隐写术长期以来似乎遥不可及。

弗里德里希的研究重点是隐藏在人类制作的数字媒体(如照片和短信)中的消息的复杂现实世界的复杂性,她说,完美模拟是一个永远无法满足的条件。“数字媒体的问题是,你永远不会有真正的模型,”她说。“它太复杂了。隐写术永远不可能完美。”

实现完美

当然,机器生成的文本不是由人类创建的。最近,专注于语言的生成模型,或其他生成图像或声音的模型,表明完全安全的隐写术在现实世界中可能是可能的。毕竟,这些模型使用明确定义的采样机制作为生成文本的一部分,在许多情况下,这些文本看起来令人信服地像人类。

索科塔和施罗德·德维特之前一直在研究机器学习,而不是隐写术。他们一直在寻求通过各种渠道传输信息的新方法,并且在某个时候,他们了解到信息论中一个相对较新的概念,称为最小熵耦合。

索科塔说:“这是一种看似基本的工具,但尚未得到充分探索。”在最小熵耦合中,研究人员可以将两个概率分布组合成一个单一的联合分布,该分布表示两个系统。在隐写术的情况下,其中一个分布表示掩盖文本,另一个分布表示包含隐藏消息的密文。联合分布可以确保两个文本在统计上无法区分,从而生成完全安全的消息。

索科塔、施罗德·德维特和他们的团队一直在尝试寻找利用该工具进行深度学习新方法的方法。但有一天,索科塔回忆说,他们的合作者马丁·斯特罗迈尔提到,他们关于最小熵耦合的工作让他想起了围绕隐写术的安全问题。

斯特罗迈尔只是随意评论,但索科塔和施罗德·德维特认真对待了它。该小组很快弄清楚了如何使用最小熵耦合来设计一种隐写术程序,该程序满足卡钦对现实世界机器学习系统中完美安全性的要求。

普渡大学电气与计算机工程师穆拉特·科考格鲁说:“我很惊讶地看到它在隐写术中具有如此好的应用。”他不从事隐写术工作,但他确实帮助设计了团队在论文中使用的一种算法。“这项工作确实很好地与最小熵耦合联系起来。”

然后,该团队更进一步,表明为了使隐写术方案尽可能具有计算效率,它必须基于最小熵耦合。新策略为如何实现安全性和效率都指明了明确的方向——并表明两者是齐头并进的。

索科塔说:“我们的结果似乎表明,这甚至比那些并非完全安全的方法更有效。”

现实世界

存在局限性。卡钦指出,找到真正的最小熵耦合是一个NP-hard问题,这基本上意味着完美的解决方案在计算上过于昂贵而无法实际应用,又回到了效率问题。

索科塔和施罗德·德维特承认这个问题:最佳耦合确实会过于复杂而无法计算。但是为了绕过这个瓶颈,作者使用了索科塔和施罗德·德维特开发的近似程序(基于科考格鲁引入的方法),该程序仍然保证了安全性和合理的效率。

以下是他们认为它在实践中如何运作的:假设一位持不同政见者或人权活动家想要从一个被封锁的国家发送短信。WhatsApp或Signal等应用程序的插件将完成繁重的算法工作,施罗德·德维特说。第一步是选择一个掩盖文本分布——即,来自ChatGPT或类似大型语言模型的大量可能的单词集合——这将隐藏密文。然后,该程序将使用该语言模型来近似掩盖文本和密文之间的最小熵耦合,并且该耦合将生成将通过文本发送的字符串。对于外部对手来说,新文本将与无害的机器生成的消息无法区分。它也不必是文本:该算法可以通过对机器生成的艺术品(而不是ChatGPT)或人工智能生成的语音邮件音频进行采样来工作,例如。

新的算法在秘密消息的大小方面受到限制:施罗德·德维特估计,以今天的技术,他们的系统可以在大约30秒的机器生成的语音邮件中隐藏大约225千字节的图像(或其他消息)。但它不需要很大才能成功。这足以让重要信息通过审查员或当局。

弗里德里希说,她更习惯于对抗现实世界的局限性,而不是考虑理论。“看到另一面很有趣,”她说。对她来说,这项新的工作开始弥合理论证明与现实世界的混乱之间的差距。如果人们不使用机器生成的内容,那么新的方案将无法保证安全。但她说,随着机器生成的内容变得越来越普遍,完美安全性的潜力将会更强。

她说:“一切都取决于什么将成为典型。”如果一台机器生成大量看起来自然的无害图像,并且人们习惯了这些图像,那么就很容易创建一个富含秘密消息的图像源。“有了生成模型,这种方法为两种方法会合提供了可能的途径,”她说。

显然,这也是一把双刃剑。“罪犯会使用它,”弗里德里希说,“但它也可以用于好的方面。”

量子杂志许可转载,量子杂志是西蒙斯基金会的编辑独立出版物,其使命是通过报道数学、物理和生命科学的研究进展和趋势来增进公众对科学的理解。阅读此处的原始文章。

© . All rights reserved.