数据可视化革命

用于大数据的虚拟“望远镜”使其有可能看穿数据洪流

伽利略是第一个发现木星并非孤立存在的人,而是实际上伴随着其他围绕其旋转的天体。最终,他的发现为驳斥地心宇宙观提供了最有力的证据,将地球从宇宙的中心降级为仅仅是围绕太阳运行的行星。

我们认为,我们理解和可视化大型数据集的能力正在进入与 17 世纪天文学相似的进化阶段。正如伽利略几个世纪前所做的那样,我们现在拥有一些工具的原始版本,这些工具具有成为强大工具的潜力。这些工具使我们能够探索流动的比特景观,而不是刚性的原子,从而产生一种新的媒介,帮助我们理解复杂的事物,同时提供一种新的艺术表达手段。

随着数据可视化摆脱传统图形设计的刚性,墨水被像素取代,我们遇到了处理并非事先完全指定的设计的流动性。在其更现代的形式中,数据可视化产生了一种新的图形设计形式,其中线条、形状和颜色等视觉属性只不过是图形对象的物质现实,其灵魂由数据构成。新的图形设计师不再通过选择一组固定的形状、位置和颜色来创建可视化,而是通过选择数据将形式注入几何抽象所需的规则。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。


这些新的可视化具有其基于墨水的前辈所没有的属性。这些属性允许可视化与读者之间建立更丰富的关系,读者现在不再仅仅是旁观者,而更多的是探险家。因此,这场革命不仅是形式上的革命,也是功能上的革命。

回到我们的朋友伽利略和他的早期望远镜,我们现在有能力将望远镜交给任何好奇并想了解更多的人。然而,我们不是研究主题问题或事件的单个快照,而是以越来越精细的细节进行研究,而是可以创建“数据镜”,用于放大和缩小大型数据集,以寻求新的理解。

公共记录是开始训练我们的数据镜的显而易见的地方。即使法律规定公开,这些大型信息集合在实践中也常常无法访问。这种无法访问性主要是技术不足的问题,因为数据已经数字化,在某些情况下甚至可以在不友好的政府网站上获得。

以 DataViva 为例,它是一个可以帮助我们实现公共记录访问民主化的数据镜。巴西米纳斯吉拉斯州最近发布的 DataViva 为巴西整个正规经济部门开放了数据。DataViva 不是围绕文件链接构建的,而是围绕 1 亿多个交互式可视化构建的,这些可视化被组织成八个不同的“应用程序”。得益于 DataViva,世界各地的人们现在都能够将其浏览器指向巴西的公共数据,并以前所未有的分辨率探索巴西经济。有兴趣比较里约和米纳斯支付的工资或希望了解贝洛奥里藏特的产业结构及其机会的人们,现在可以非常快速且相对轻松地将这些巴西公共记录带入他们的脑海。

 


另一个数据镜的例子是 万神殿。万神殿提供了收集到的用于量化全球文化发展的数据。这使得万神殿与 DataViva 相似,因为它是一个可视化人类能力的数据镜,尽管它关注的是工业领域(例如摩托车制造)中表达的能力,但万神殿关注的是人类成就中表达的能力,例如牛顿的理论或埃尔维斯·普雷斯利的歌曲。

万神殿使我们能够可视化英国的历史文化产品,类似于 DataViva 使我们能够探索贝洛奥里藏特的产业结构的方式。然而,这些数据镜的真正价值不在于它们创建一次性可视化的能力,而在于它们提供框架的能力,这些框架将故事编织在一起,而这些故事只能从多个角度准确讲述。

当使用万神殿观察文化领域的演变时,人们会想起伊丽莎白·艾森斯坦的著作《作为变革动因的印刷机》。艾森斯坦在此书中认为,印刷机不仅改变了出版书籍的数量,而且还改变了出版者是谁、出版什么以及谁成为出版商。艾森斯坦的论点类似于马歇尔·麦克卢汉的“媒介即讯息”,即媒体的变化通过改变谁受到关注,从而将新的文化形式推向突出地位,从而引发社会的深刻变化。在印刷机的情况下,受欢迎程度增加的形式是艺术和科学。

因此,让我们尝试使用万神殿快速构建一个简化版的艾森斯坦故事。如果我们查看公元 1300 年之前的世界文化产品,我们会注意到它主要由宗教人物和政治领导人组成。艺术和科学明显缺席。然而,当我们把目光转向接下来的 400 年(即跨越到 1700 年的时期)时,我们发现艺术的文化突出性大大增加。下一个时期,即 1700 年至 1900 年之间,包括科学的顶峰,科学在 19 世纪成为第二大文化领域。总而言之,这些图例快速证实(尽管它们当然不能证明)艾森斯坦的理论。

 万神殿 网站上探索互动
 万神殿 网站上探索互动

 万神殿 网站上探索互动

尽管万神殿的发现与艾森斯坦的故事一致,但要真正抓住要点,我们需要从印刷机转向通信技术的其他变化。考虑一下 20 世纪上半叶:随着收音机和银幕的出现,演员和歌手成为最受欢迎的文化产品。这会将艾森斯坦的原始想法扩展到新的广播技术。然而,还有更多。20 世纪下半叶,以及电视的兴起,引入了通信技术的又一项新变化,同时也伴随着新的文化偶像的兴起:体育人物,他们历史上首次升至全球名人的地位。

 万神殿 网站上探索互动
 万神殿 网站上探索互动

 

César A. Hidalgo directs the Center for Collective Learning at the Artificial and Natural Intelligence Institute (ANITI) of the University of Toulouse. He also holds appointments at the Harvard School of Engineering and Applied Sciences (SEAS), at the Alliance Manchester Business (AMBS) School of the University of Manchester, at the Toulouse School of Economics (TSE) and at the Institute of Advanced Study in Toulouse (IAST). He is the author of three books including How Humans Judge Machines (MIT Press, 2021).

More by César A. Hidalgo
© . All rights reserved.