在线数据可视化的幕后揭秘

安迪·柯克(来自 Visualising Data)最近发表了一篇巧妙的、以图像驱动的文章,他在文章中使用汽车来阐述一系列关于数据可视化实践的观点。

加入我们的科学爱好者社区!

本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点



安迪·柯克(来自 Visualising Data)最近发表了一篇巧妙的图像驱动的文章,他在文章中使用汽车来阐述一系列关于数据可视化实践的观点。有趣的是,当我在几周前反思一次数据可视化聚会时,汽车也浮现在我的脑海中。

OpenVis 会议是一年一度的活动(现在是第二年),专注于“使用开放网络上的最新和最强大的技术和工具进行数据处理、故事讲述、视觉设计、代码结构和实施的最佳实践”。我今年是演讲者,标签为“设计”和“科学可视化”。这是我的专长。但是,尽管我与使用最新和最强大的技术和工具的自由职业可视化人员合作并编辑他们的作品,但我个人扎根于印刷和插画传统。我不编程。(状态更新待定)。我有点担心我的经验和观点对这个特定的会议参与者群体有多大的相关性。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。


在听取了 20 位个人就新闻编码、色彩理论、使用 iPython Notebooks、可视化无(如零)到使用 D3 理解机器学习等主题的演讲后,我意识到这可能是我参加过的最全面的数据可视化会议。

那么汽车在哪里适合呢?请原谅我片刻,因为我把一个延伸的隐喻引入了死胡同。

以我的经验来看,许多会议都关注汽车(数据可视化)的外观。通常,它们会在一个原始的展示厅中,脱离上下文地展示。也许会稍微提及燃油效率,并讨论一些目标受众。但在 OpenVis 会议上,我们打开了引擎盖,讨论了内部运作,然后退后一步,聊了聊美学,通过现场演示进行了一些虚拟试驾,甚至想象了它可能带我们去的地方。很高兴能被提醒所有这些事情都是错综复杂地联系在一起的。没有底盘,发动机就没有什么价值。即使一辆车看起来很棒,如果不能驾驶它,它也没有什么用处。能花几天时间与来自许多不同专业领域的人们聊天,并对了解整体感兴趣,真是太好了。

接下来是我在 OpenVis 会议上所做演讲的简化版本——一瞥《大众科学》数据可视化背后的流程和指导理念。有关完整节目(视频即将推出),请访问会议网站。有关会议的想法,请参阅此我推文的 storify 列表,或在 Twitter 上搜索 #OpenVisConf

* * * *

我将从艺术总监的角度来谈论这些事情,而不是专注于用于为杂志创建图形的工具。我非常荣幸能够按项目聘用设计师,这让我可以依靠自由职业可视化人员的才能和不断发展的技能。我的工作是帮助将合适的艺术家与合适的数据集相匹配,然后推动事情进展,始终关注它的最终受众;我们精通科学,但非专业读者的读者。

在我谈论像这样的具体项目之前

我想稍微退后一步,提供一些背景信息。我将要谈论的合作完全由最终的背景驱动。我所说的不仅是指最终的媒介,如纸上的墨水或屏幕上的像素,还包括元背景,包括《大众科学》的国际版本、我们的历史和我们工作流程的现实。

《大众科学》是美国历史最悠久的连续出版的杂志。它于 1845 年创刊,是一份 4 页的周刊,主要致力于发明创造。

1921 年,其范围正式扩大。它从一份每周发明的报纸转变为一份每月出版的科普期刊。

在随后的几十年中,发生了几次重新设计,但下一个分水岭时刻发生在 1948 年,当时该杂志的报道范围扩大到工业进步之外,并涵盖了更广泛的应用和理论科学领域。该杂志将以清晰的语言向感兴趣的非专业人士传播科学知识。

英文网站于 1996 年推出(这是它现在的样子)。

接下来是 2001 年杂志的重大重新设计。

最近的一次重新设计是在 2010 年。

我们的 iPad 平板电脑版于 2012 年推出。

我们有 14 个国际合作伙伴,他们可以访问我们的原创内容,但也专门为自己的受众开发文章,因此这不是逐页的直接翻译。

对发明和机械性能的细致插图是早期刊物的标志。

尽管许多图表通常基于精确测量,但我认为这张关于惯性、动量和投影的图表可以被认为是杂志中第一个真正基于数据的图表。考虑到它所描绘的是对数值的印象,而不是数值的精确表示,这可能有点慷慨。但事实仍然是,它专门存在是为了传达基于测量的概念。

这个例子是从我之前提到的 1948 年重新设计后的一期中提取的。这个时代最能引起我的共鸣:经典的科学传播,科学家、记者和艺术家合作,以接触非专业受众。

这种风格持续了数十年。正如 1948 年重新设计之前的公告所述,“…《大众科学》将使用图片来精确而清晰地传达科学知识。”就像这张 1975 年的癌症图表对一样。

但在几十年后,平淡无奇将不再流行。2001 年重新设计版中的图形标志着明显的背离。图表被分解为更小、更易于理解的片段。引入了诸如第三维度和阴影等与内容无关的细节,这表明图形的目标不再是尽可能清晰地传达信息。它们也被用作激活页面和吸引读者的工具。

与其将 3D 饼图视为误导,我们能从这种有意识地从平淡而精确转变为有意识的动态的选择中学到什么?

毕竟,以牺牲清晰的数据读取为代价的说明性细节并不是什么新鲜事。

杂志的这两个时代(上图)有什么共同之处?在这两种情况下,该杂志都在积极尝试吸引更广泛的受众。一个光荣且必要的目标。这让我想到今天杂志中数据可视化的理念。我的目标是帮助制作既能尊重数据,又能吸引读者的图形。这意味着在适当的时候采用新的形式,并且永远不要低估欢迎姿态的力量,例如这些蜜蜂插图。

现在,让我们深入研究一些具体的例子。我将从 2013 年 9 月的单主题食品期刊中的 2 个图形开始。首先是风味网络。这是一个以印刷版为主的项目,它将为整个期刊做一个有趣的介绍。该图形将基于同行评审期刊上发表的结果。

您可能认识这个图,它来自 2011 年发表的 Scientific Reports 上的原始论文。它连接了共享化学成分的食物。然后,研究人员继续对照食谱数据库检查这些连接,以查看经常搭配的成分与其化学成分重叠之间是否存在关系。事实证明,西方美食确实倾向于将密切相关的成分搭配在一起。但来自东亚的经典食谱却没有。我们的目标是创建一个图像,将研究人员的结论带给新的受众。或许以更直观、更吸引人的方式揭示其中的模式。

这篇论文是公开的。我可以立即下载初始数据集进行审查。这是一个信号,表明作者可能会乐于并兴奋地合作。他们确实如此。科学家 Yong-Yeol Ahn 和 Sebastian Ahnert 在建议一种过滤方法和审查草图方面真的很有帮助。有了数据,我就可以在布局中为图形划分空间。我联系了自由职业者 Jan Willem Tulp,看看他是否对该项目感兴趣。

提醒一下——我将从艺术总监的角度谈论这些项目。而不是艺术家的。如果可能,我还会将您引导到一些资源,这些资源将有助于充实故事。在这种情况下,请查看 Jan Willem Tulp 在纽约举办的 Visualized 会议上的演示。我认为视频尚未上线——但上面的链接应该在可用时起作用。

对于这个项目,我的指令非常开放。获取原始风味网络图表背后的数据集,并为我们的印刷杂志开发一个单页变体。如果兴趣增加,并且该图形的交互式版本有意义,那么我们将协商一个配套的网站项目。

这是 Jan Willem 发给我的第一张草图。您将从他在 Visualized 的演示中看到,这绝对不是他的第一次尝试。

我尽量尽早将概念草图放入布局中。很明显,我需要不止一页来呈现数据并用文本进行设置。尽早与整个文章团队协调将增加我能够为介绍和注释溢出装订线的可能性。

回到草图。原始的风味网络在突出拓扑结构方面已经做得很好了。Jan Willem 可以通过排序或分组来改进它,以便更容易阅读该信息。

他将成分按类别排序到列中。

每个黑点都是一种成分。黑点的大小对应于该成分在食谱数据库中出现的频率。

与每个黑点配对的蓝圈表示与其他成分的链接总数。

灰线连接同一类别中具有共享化合物的成分。橙色线连接跨类别具有共享化合物的成分。

黑点的垂直位置基于该成分对于其所有链接的平均共享化合物值。这是关键点。在某些方面,这是一个按其排序的逻辑指标。与其他成分有许多紧密关系的成分会升到顶部。但这是一种复杂的度量标准。需要一些思维跳跃。

整体结构和计划感觉是对的。但每个点垂直位置背后的度量标准不是很直观。所以我要求了各种变体……Jan Willem 发送了很多选项。我用右侧的描述标注了他的屏幕截图,以帮助巩固我自己的逻辑,并更有效地与文章编辑沟通。我不会深入探讨每个草图的所有细节,但我想你可能会喜欢看到接下来的一些选项。

这个选项是我们最喜欢的。垂直位置基于与其他成分的连接总数。(不是这些连接的强度)。最初包含该信息的蓝色轮廓圆圈不再需要了。

一旦结构确定下来,我们就开始微调美学,并参考了为整个特刊出现的调色板和风格。这是最终的文章。

你会注意到,我们添加了注释来引起人们对我们发现的几个有趣点的注意,但也许最关键的是,我们包含了一个大的“如何阅读此图表”面板,我们以非常对话的方式引导读者了解图表中使用的符号。这种方法很自然地来自于我第一次向同事展示图表时必须提供的口头解释。而且它比角落里的小键或图例更吸引人。

在我微调标签、解决事实核查问题并准备打印版付印时,Jan Willem 将注意力转向为网站开发交互版本。基于我们的预算和截止日期的最佳选择是先从打印版本开始,并允许读者按成分选择和查看。这样,他们可以通过消除重叠的线条清楚地看到所有连接。

按成分选择似乎合乎逻辑,但近 400 种成分的下拉列表过于笨拙,屏幕上的完整列表也不清晰。列表的鱼眼变形仍然过于密集,无法有效导航。那么点击蓝色成分点怎么样?事实证明,许多选择仅显示非常稀疏的网络。在所有 381 种成分中,148 种成分在其类别之外没有链接,150 种成分在其类别之外只有 1 个链接。因此,只有 83 种成分会有两条或更多粉红色连接线。随机点击成分可能不会产生令人满意的体验。

因此,在探索了一些其他想法之后,Jan Willem 建议,与其按单个节点选择,不如按行选择?读者不太可能偶然遇到一个单一乏味的成分。但这种方法仍然会过滤掉许多线条,以便更容易跟踪各个连接。

点击此处查看最终的交互式图形。

回到其他与食物相关的项目……
在这种情况下,任务更加开放,有点超出我们的舒适区。一个数字优先、读者主导的探索工具,从庞大的数据集中提取数据,但没有预先分析的结论。我向创意研究办公室询问了与食物相关的建议。

Jer Thorpe 和 Ben Rubin 提出了几个想法。杂志团队对美国境内和周围的农产品运输数据最感兴趣,这些数据基于美国农业部的每日报告

以下是一些关于数据随时间和空间变化的初步探索。

这就是最终数据的显示方式。读者可以使用下拉菜单选择农产品,然后通过滑动底部的日期标签自定义时间段。

还可以在同一屏幕上比较三种农产品……

可以在此交互式地图上探索一段时间内的总进口量。

交互式项目仍需整理一些细节,但出版时间表的现实意味着我们需要将注意力转向印刷项目。早期的概念草图包含了一些非常棒的想法(左图),但对于单个静态页面来说过于雄心勃勃。因此,我们尝试删除一些副故事,并将地图点击到一个小倍数网格中(右图)。

这是杂志中出现的最终页面。要仔细查看,请参阅静态网页版本最终交互版本。要了解其中一位艺术家的想法,请参阅Sandra Rendgen 对 Jer Thorp 的采访

到目前为止,我已经谈论了一个印刷优先的项目和一个数字优先的项目。但有时,印刷品和网页的需求差异如此之大,以至于为每种媒体以不同的方式处理相同的数据集是有意义的。对于我们 2012 年的“世界科学状况”特别报告,我聘请了艺术家Arno Ghelfi进行印刷版面,特别是为了他充满活力和大胆的风格。然而,对于网页来说,我可以接受更安静的美学,Jan Willem Tulp 的互动性证明了这一点。

这是印刷版面的近距离观察。中心的螺旋气泡代表“科学领域排名前 25 的国家”,这是根据研究论文的产出指数来衡量的。左下角的列表显示了其他一些衡量标准的排名,例如授予的专利数量。是的,我们本可以使这个版面在信息密度方面更加努力。但是,在这种情况下,一切都归结于背景。

整个部分文本量很大。中心的图形版面不仅需要显示数据,还需要充当进入该部分的欢迎入口。是的,数据可视化应该尊重数据。但它们还需要注意它们的背景。

在网络上,该图将作为其自己的模块呈现。背景非常不同。在这里,我们可以专注于呈现更多信息。我们将从国家排名开始,但读者也可以看到绝对数字。

有时,无论我多么痛苦,静态图形的交互式网页版本可能不是有限资源的最佳利用方式。尽管Moritz Stefaner 完全有能力为这个印刷图形创建一个交互式伴侣,但我必须对事情有点现实。该页面基于一个巧妙的项目,其中科学家 Laura Burkle 和她的团队将他们的蜜蜂和花卉相互作用数据与一百多年前在同一地点进行的一项类似研究进行了比较。它是杂志中静态单页独立图形的完美候选者。但我认为范围有点太窄,不足以保证全面的互动性。

在为一篇不同的、更广泛的关于本地蜜蜂的文章进行研究时,文本编辑和我被这项研究迷住了。我们搁置了原始论文中的这张图,稍后再重新审视。我不禁想知道像 Moritz 这样的人会如何重新想象相同的数据集。

Moritz 在他的博客上写了关于这个图形的文章,所以我现在不会尝试重述。相反,我将在他达到这一点(下方)之后开始。在许多概念草图之后,他决定将结构基于蜜蜂。在这里,每个淡黄色圆圈代表 1800 年代后期和 2010 年在伊利诺伊州卡林维尔活跃的蜜蜂种类。粉红色圆圈代表在 1800 年代活跃但在当地已灭绝的蜜蜂种类。这些圆圈内的每个选项卡位置代表一组蜜蜂授粉的 26 种植物之一。该选项卡的颜色和大小包含有关蜜蜂和植物相互作用随时间变化的性质的信息。

我接受了基本概念,但仍有工作要做。Moritz 尝试按属对物种进行分组,但此初步草图未包括所有物种。虽然从视觉角度来看很有趣,但没有强有力的编辑理由将蜜蜂安排在较小的组中。

因此,我采用了原始图案,并构建了一个包含正确数量蜜蜂圆圈的版本。一旦我们确定图形实际上可以放在页面上,Moritz 就开始改进。他没有让已灭绝的蜜蜂以强烈的红色和粉红色突出显示,而是让这些圆圈逐渐消失,这有助于加强物种消失的想法。为了帮助加强蜂巢图案,Jillian Walters 以复古风格绘制了 3 只蜜蜂,作为对项目开始年份的微妙致敬。

由于这是一种不寻常的图形形式,我们需要真正制作注释和标签。我们再次采用了某种对话式方法,而不仅仅是采用简化的键或图例。

要仔细查看完整的图形,请参阅此处的网络友好版本

让我们回顾一下《大众科学》的遗产。

我的大多数决定都植根于对科学发现进行精确和简洁的视觉解释的传统。

但我也需要意识到需要对更广泛的受众具有可访问性和吸引力。

在我看来,这些目标并非相互排斥。但在某些情况下,即使在同一本杂志中,也可能需要在某个方向上稍微偏移一点。

当图形本身还需要充当进入更大的、文本驱动的包的邀请时,我可能会倾向于更轻松和轻松的解决方案。

我尽量不低估欢迎姿态的价值,例如说明性细节。

也许明确声明并预先邀请阅读图形,可以为采用更复杂或不熟悉的视觉形式提供一些回旋余地。

脚注:有关我关于欢迎姿态的更多想法,因为它与插图信息图(不仅是数据可视化)有关,请参阅 2012 年 10 月的博客文章“捍卫科学概念插图中的艺术许可。”有关我在同一主题上的更正式论文的 pdf 下载,“捍卫为非专业受众说明科学概念的艺术许可”(来自2CO Communicating Complexity: 2013 会议记录,由 Nicol? Ceccarelli 编辑),点击此处。

Jen Christiansen is author of the book Building Science Graphics: An Illustrated Guide to Communicating Science through Diagrams and Visualizations (CRC Press) and senior graphics editor at 大众科学, where she art directs and produces illustrated explanatory diagrams and data visualizations. In 1996 she began her publishing career in New York City at 大众科学. Subsequently she moved to Washington, D.C., to join the staff of National Geographic (first as an assistant art director–researcher hybrid and then as a designer), spent four years as a freelance science communicator and returned to 大众科学 in 2007. Christiansen presents and writes on topics ranging from reconciling her love for art and science to her quest to learn more about the pulsar chart on the cover of Joy Division's album Unknown Pleasures. She holds a graduate certificate in science communication from the University of California, Santa Cruz, and a B.A. in geology and studio art from Smith College. Follow Christiansen on Bluesky @jenchristiansen.com

More by Jen Christiansen
© . All rights reserved.