本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
数据新闻手册
编辑: JonathanGray, LucyChambers, LilianaBounegru
出版社(纸质版): O'Reilly Media
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
发布时间: 2012年5月
页数: 120
或可在以下网址免费下载:http://datajournalismhandbook.org
在这篇博客文章中,《Significance》杂志的编辑 Julian Champkin 评论了新发布的《数据新闻手册》,该杂志是英国皇家统计学会和美国统计协会的科普出版物。他更进一步,提醒我们新闻界正在经历一场革命。Champkin 认为,为了参与这场革命,年轻的和职业生涯早期的科学作家不应回避新的数据密集型来源或新的调查工具。相反,他认为他们应该探索和试验数据,从而产生强大、相关和卓越的科学新闻。
--
曾几何时,新闻工作是这样的。一位记者前往遥远的现场。他将文字电话告知办公室。对于头版头条新闻,一千字已经很多了——用今天的信息论语言来说,称之为 8000 比特或 1 千字节的信息内容。在办公室里,一位誊写员将这些文字打字到压缩木浆上。一位副编辑会剪切它们,以便它们适合可用空间。然后,铅锑被熔化,通常在同一栋建筑的底层,并挤压成微小的字母形状的模具,这些模具由技术非常娴熟的工匠在铸铁机器上操作,这些工匠(在英国)通常在罢工,大约在下午三点,巨大的印刷机开始隆隆作响,震动整栋建筑,因为第二天的报纸开始印刷。史前史?那是我在伦敦舰队街开始工作时的情况,大约 25 年前。
现在,世界比以前更复杂,也比以前更数字化。热金属让位于电子文字处理,没有人真正哀悼它的逝去。一场同样巨大的革命正在发生。
过去一年最大的新闻故事之一是维基解密发布的美国外交电报的内容和影响。单一来源,不幸的布拉德利·曼宁,下载了一个数据库——称之为信息洪流似乎是轻描淡写——的信息。涉及 251,287 份文件,总计 2.61 亿字;这是一个惊人的数字。大约是 1 吉字节的香农信息内容。
假设作为一名记者,你面对的是那座虚拟文件山。你到底要用它做什么?99.99% 的文件很可能像沟渠水一样平淡乏味。你如何找到万分之一——仍然是一个很大的数字——可以成为新闻的文件? 谁能理解这一切?让事情变得有意义是记者的工作。但当然,这是分析师、信息处理员、数据挖掘者、统计学家、IT 专家、程序员、代码编写员的工作,对吗? 实际上,所有这些都是新记者或新闻团队需要的技能。
新闻业,如果你没有注意到,正在发生变化。它的一些方面实际上正在变得更好。这些方面与计算能力和数字有关。即使在几年前,也很少有记者,即使在像 BBC 这样信誉良好的报纸和广播公司中,知道如何处理任何涉及基本计算能力的故事,更不用说数据库了。现在有一小群但不断壮大的记者可以处理数字。更多的人开始意识到,仅仅因为官员或新闻稿引用了一些数字,这些数字可能并不意味着官员或新闻稿声称的意思——它们可能是伪造的或片面的或断章取义的,它们可能是将不相似的事物进行比较,等等。还有另一小群但不断壮大的记者——汉斯·罗斯林、大卫·麦坎德莱斯就是其中之一——他们意识到隐藏在庞大的数字数据库中是关于世界的精彩故事——有趣、重要和令人兴奋的人类故事,它们只是在等待从数字中提取出来。这需要分析来揭示这些故事;这需要巧妙的方式来解释这些故事:新的绘制图表、可视化数据的方式,首先是这样,但这些故事就在那里,解释它们的方式也在那里。
所有这些都称为数据新闻。
数据新闻是一个如此全新的领域,以至于我没有听说过在新闻课程中教授它。一些先驱者自己摸索出了如何去做,并渗透到新闻编辑室和广播办公室去实践它;随着数字化和公众访问数据,它一直在悄然稳步增长。最好的报纸和最好的广播公司正在这样做,并且将越来越多地这样做。本书是它的第一本指南。
它源于 2011 年底举行的一次会议。它由该类型的先驱编辑,并由 70 多位实践者撰稿,他们来自日本和芬兰、尼日利亚和美国等不同的地方,并且为《纽约时报》、《Zeit Online》、BBC 和《卫报》等新闻媒体工作。在游戏的这个阶段,这本手册只不过是对可能性的概述。但这本身就非常有价值。它确实为那些想加入该领域的人提供了实用指南。
那么什么是数据新闻?它与另一种新闻有何不同? 这本书给出了几个定义,来自几位不同的贡献者。“也许当您将传统的‘新闻嗅觉’和讲述引人入胜的故事的能力,与现在可用的数字信息的巨大规模和范围结合起来时,就会开启新的可能性”,这是一个定义。
“它关于联系”,史蒂夫·多伊格在 1993 年亲眼目睹了这一点。他加入了来自安德鲁飓风的两个不同的数据集:一个绘制了飓风造成的破坏程度,另一个显示了风速。这使他能够查明建筑规范薄弱和不良建筑 практики导致灾难影响的区域。他因这个故事获得了普利策奖。例子还在继续:“今天,新闻报道像潮水般涌来,来自多个来源、目击者、博客,发生的事情通过庞大的社交联系网络进行过滤,被排名、评论,而且通常被忽略。这就是数据新闻如此重要的原因。收集、过滤和可视化眼睛看不到的东西具有越来越大的价值。”
在一个受到围攻的行业(如果新闻业是这样的话)中,需要新的工作方式来实现新的目标。印刷品的未来存在疑问。数字显然是前进的方向;但数字新闻不仅仅是为了网络。它的故事出现在——有时主导着——传统媒体和传统新闻议程。
他们说,新闻业已经民主化了。在一个任何人都可以写博客的世界里,没有对准确性或真相的过滤,他们的博客可以立即被阅读并被数百万人视为事实,有人声称现在每个人都是记者。
但是数据新闻为这项工作恢复了技能——或者更确切地说是技能。因为它需要技能来分析现在例行可用的大量数据,以找到隐藏在其中的故事。当您完成这项工作后,它需要技巧来向读者——或观众或听众讲述这个故事:印刷品、音频、视频、图表、图形、可视化(交互式或非交互式)都可以参与其中。再举一个书中引用的例子
“2010 年,《拉斯维加斯太阳报》刊登了关于医院护理的 Do No Harm 系列报道。他们分析了超过 290 万份医院账单记录,揭示了超过 3,600 起可预防的伤害、感染和手术错误。他们通过公共记录请求获得了数据,并确定了 300 多起患者因本可以预防的错误而死亡的案例。他们的演示文稿包含,除其他要素外,一个 交互式 图形,允许读者按医院查看手术伤害发生频率高于预期的情况;一个 地图,其中包含一个时间线,显示感染在医院之间传播的情况;以及 另一个 交互式 图形,允许用户按可预防的伤害或按医院对数据进行排序,以查看人们在哪里受伤。《内华达州》立法机构对此做出了回应,通过了 六项 关于 医疗保健透明度的立法。”
显然,单一媒介报道的日子正在消失;正如本网站所见证的那样。《大众科学》最初是一本印刷杂志;这个网站现在是其运营不可或缺的一部分。
因此,报道的媒介正在发生变化。信息或数据——你可以称之为任何一个——已经改变了。以前,信息不多:明星记者是找到额外细节以提供故事的人。现在,问题可以归结为信息过载:明星记者是那个可以无视毫无意义的信息,并将所有其余的大量信息联系起来以找到故事的人。正如本书所说,新闻业现在是关于处理的。其中包括分析和呈现。
有一件事没有改变:新闻的定义。它是在及时且清晰地以吸引人的方式找出正在发生的事情,并告诉人们正在发生的事情。过去的老战地记者;犯罪记者跑到电话亭打电话来发布他的故事(他们真的说过“Hold the Front page”吗?); 敲门的记者以及近年贬值的手机黑客——他们都在试图发布故事。数据记者也有同样的目标。来源不同,方法不同,但其最佳状态下的目标是相同的。
本书是第一本。将来会有更多类似的书籍。但请阅读这本,因为它现在正在发生。
Julian Champkin
编辑